Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, padre dell'apprendimento per rinforzo, non pensa che i LLM siano stati influenzati dalla lezione amara.
La mia interpretazione della posizione di Richard: abbiamo bisogno di una nuova architettura per abilitare l'apprendimento continuo (sul campo).
E se abbiamo un apprendimento continuo, non abbiamo bisogno di una fase di addestramento speciale - l'agente impara semplicemente al volo - come tutti gli esseri umani e, in effetti, come tutti gli animali.
Questo nuovo paradigma renderà obsoleta l'attuale approccio con i LLM.
Ho fatto del mio meglio per rappresentare la visione che i LLM funzioneranno come la base su cui può avvenire questo apprendimento esperienziale. Sono volate alcune scintille.
0:00:00 – I LLM sono un vicolo cieco?
0:13:51 – Gli esseri umani fanno apprendimento per imitazione?
0:23:57 – L'Era dell'Esperienza
0:34:25 – Le architetture attuali generalizzano male fuori distribuzione
0:42:17 – Sorprese nel campo dell'IA
0:47:28 – La Lezione Amara si applicherà ancora dopo l'AGI?
0:54:35 – Successione all'IA
Cerca il Dwarkesh Podcast su YouTube, Apple Podcasts, Spotify, ecc. per guardarlo e iscriverti per i prossimi episodi.
464,76K
Principali
Ranking
Preferiti