Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, padre del aprendizaje por refuerzo, no cree que los LLMs estén llenos de lecciones amargas.
Mi interpretación del punto de vista de Richard: necesitamos una nueva arquitectura que permita el aprendizaje continuo (en el trabajo).
Y si tenemos aprendizaje continuo, no necesitamos una fase de entrenamiento especial: el agente simplemente aprende sobre la marcha, como todos los humanos y, de hecho, como todos los animales.
Este nuevo paradigma hará que nuestro enfoque actual con los LLMs quede obsoleto.
Hice mi mejor esfuerzo para representar la opinión de que los LLMs funcionarán como la base sobre la cual puede ocurrir este aprendizaje experiencial. Algunas chispas volaron.
0:00:00 – ¿Son los LLMs un callejón sin salida?
0:13:51 – ¿Hacen los humanos aprendizaje por imitación?
0:23:57 – La Era de la Experiencia
0:34:25 – Las arquitecturas actuales generalizan mal fuera de distribución
0:42:17 – Sorpresas en el campo de la IA
0:47:28 – ¿Seguirá aplicándose la Lección Amarga después de la AGI?
0:54:35 – Sucesión a la IA
Busca el podcast de Dwarkesh en YouTube, Apple Podcasts, Spotify, etc. para verlo allí y suscribirte a futuros episodios.
1,27M
Parte superior
Clasificación
Favoritos