🚀Heb je je ooit afgevraagd hoe je RL kunt laten werken op onmogelijk moeilijke taken waarbij pass@k = 0%? 🤔 In ons nieuwe werk delen we het RL Grokking Recept: een trainingsrecept dat LLM's in staat stelt om eerder onoplosbare programmeerproblemen op te lossen! Ik zal volgende week op #CoLM2025 zijn, dus ik praat er graag over! We duiken ook in de verhitte discussie: scherp RL alleen eerdere geleerde vaardigheden aan of kan het echt nieuwe redeneervaardigheden ontgrendelen? 🔥🔥 Lees de volledige blog hier: #AI #RL #NLP #reinforcementlearning #llm