🚀Вы когда-нибудь задумывались, как заставить RL работать над невозможными сложными задачами, где pass@k = 0%? 🤔 В нашей новой работе мы делимся Рецептом Гроккинга RL: рецептом обучения, который позволяет LLM решать ранее неразрешимые задачи программирования! Я буду на #CoLM2025 на следующей неделе, так что буду рад обсудить это! Мы также углубляемся в горячую дискуссию: улучшает ли RL просто ранее усвоенные навыки или может ли он открыть действительно новое мышление? 🔥🔥 Читать полный блог здесь: #AI #RL #NLP #reinforcementlearning #llm