Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@RichardSSutton, der Vater des Reinforcement Learning, denkt nicht, dass LLMs bitter-lesson-pilled sind.
Mein Stahlmann von Richards Position: Wir brauchen eine neue Architektur, um kontinuierliches (on-the-job) Lernen zu ermöglichen.
Und wenn wir kontinuierliches Lernen haben, brauchen wir keine spezielle Trainingsphase - der Agent lernt einfach im Fluss - wie alle Menschen und tatsächlich, wie alle Tiere.
Dieses neue Paradigma wird unseren aktuellen Ansatz mit LLMs obsolet machen.
Ich habe mein Bestes getan, um die Ansicht zu vertreten, dass LLMs als Grundlage fungieren werden, auf der dieses erfahrungsbasierte Lernen stattfinden kann. Einige Funken flogen.
0:00:00 – Sind LLMs eine Sackgasse?
0:13:51 – Machen Menschen Imitationslernen?
0:23:57 – Die Ära der Erfahrung
0:34:25 – Aktuelle Architekturen generalisieren schlecht außerhalb der Verteilung
0:42:17 – Überraschungen im KI-Bereich
0:47:28 – Wird die Bittere Lektion nach AGI immer noch gelten?
0:54:35 – Nachfolge zur KI
Suchen Sie den Dwarkesh Podcast auf YouTube, Apple Podcasts, Spotify usw., um ihn dort anzusehen und um zukünftige Episoden zu abonnieren.
685,12K
Top
Ranking
Favoriten