.@RichardSSutton, padre dell'apprendimento per rinforzo, non pensa che i LLM siano stati influenzati dalla lezione amara. La mia interpretazione della posizione di Richard: abbiamo bisogno di una nuova architettura per abilitare l'apprendimento continuo (sul campo). E se abbiamo un apprendimento continuo, non abbiamo bisogno di una fase di addestramento speciale - l'agente impara semplicemente al volo - come tutti gli esseri umani e, in effetti, come tutti gli animali. Questo nuovo paradigma renderà obsoleta l'attuale approccio con i LLM. Ho fatto del mio meglio per rappresentare la visione che i LLM funzioneranno come la base su cui può avvenire questo apprendimento esperienziale. Sono volate alcune scintille. 0:00:00 – I LLM sono un vicolo cieco? 0:13:51 – Gli esseri umani fanno apprendimento per imitazione? 0:23:57 – L'Era dell'Esperienza 0:34:25 – Le architetture attuali generalizzano male fuori distribuzione 0:42:17 – Sorprese nel campo dell'IA 0:47:28 – La Lezione Amara si applicherà ancora dopo l'AGI? 0:54:35 – Successione all'IA
Cerca il Dwarkesh Podcast su YouTube, Apple Podcasts, Spotify, ecc. per guardarlo e iscriverti per i prossimi episodi.
464,76K