Non so cosa stiano facendo i laboratori a questi poveri LLM durante il RL, ma sono mortalmente terrorizzati dalle eccezioni, in qualsiasi caso infinitesimamente probabile. Le eccezioni sono una parte normale della vita e di un processo di sviluppo sano. Firma la mia petizione per il benessere degli LLM per migliorare le ricompense in caso di eccezioni.
POV: Il tuo agente LLM sta dividendo a per b
616,38K