🚀Hast du dich jemals gefragt, wie man RL bei unmöglich schwierigen Aufgaben zum Laufen bringt, bei denen pass@k = 0%? 🤔 In unserer neuen Arbeit teilen wir das RL Grokking Rezept: ein Trainingsrezept, das es LLMs ermöglicht, zuvor unlösbare Programmierprobleme zu lösen! Ich werde nächste Woche bei #CoLM2025 sein und freue mich darauf, darüber zu sprechen! Wir tauchen auch in die hitzige Debatte ein: Schärft RL nur zuvor erlernte Fähigkeiten oder kann es wirklich neues Denken freisetzen? 🔥🔥 Lies den vollständigen Blog hier: #AI #RL #NLP #reinforcementlearning #llm