
Rückblick auf die ICML 2025
Rückblick auf die ICML 2025
Lassen Sie uns einen Rückblick auf die diesjährige International Conference on Machine Learning (ICML) werfen, die in Vancouver, Kanada, stattfand.
Wir freuen uns, erneut Teil der ICML gewesen zu sein und sind stolz darauf, unseren ersten Beitrag zum Thema Reinforcement Learning (RL) vorgestellt zu haben. In Zusammenarbeit mit Enric Ribera Borrell und Christof Schütte diskutierten wir unseren Beitrag „Reinforcement Learning with Random Time Horizons”.
In unserer Arbeit konnten wir RL auf Settings mit zufälligen, richtlinienabhängigen Zeithorizonten ausweiten, indem wir rigoros neue Richtliniengradientenformeln – sowohl stochastische als auch deterministische – abgeleitet haben und zeigen konnten, dass diese die Optimierungskonvergenz verbessern.
Neben unserer Präsentation haben wir uns mit anderen internationalen Forschern ausgetauscht. Die wichtigsten Themen der diesjährigen Konferenz lassen sich in folgende Kategorien einteilen:
(1) LLMs & Agenten, (2) Diffusionsmodelle, (3) Interpretierbarkeit & Alignment, (4) Optimierung & Skalierungsgesetze und (5) Fairness.
Es war wieder einmal eine wirklich großartige Atmosphäre – ein weiterer Grund, warum wir unsere Forschungsergebnisse gerne auf internationaler Ebene vorstellen.
Link zu unserem Paper: https://arxiv.org/pdf/2506.00962