強化学習の父である.@RichardSSuttonは、LLMが苦い教訓を受けているとは考えていません。 リチャードの立場の私の鋼鉄の男は、継続的な(実地での)学習を可能にするために、いくつかの新しいアーキテクチャが必要です。 そして、継続的な学習があれば、特別なトレーニング段階は必要ありません - エージェントは、すべての人間と同じように、そして実際、すべての動物と同じように、その場で学習するだけです。 この新しいパラダイムにより、LLM を使用した現在のアプローチは時代遅れになります。 私は、LLMがこの体験学習の基盤として機能するという見解を表現するために最善を尽くしました。いくつかの火花が飛び散った。 0:00:00 – LLM は行き止まりですか? 0:13:51 – 人間は模倣学習をしますか? 0:23:57 – 経験の時代 0:34:25 – 現在のアーキテクチャは、ディストリビューションから一般化が不十分です 0:42:17 – AI分野の驚き 0:47:28 – 苦い教訓はAGIの後も適用されますか? 0:54:35 – AI への継承
YouTube、Apple Podcasts、Spotify などで Dwarkesh Podcast を検索して、そこで視聴し、今後のエピソードを購読してください。
464.76K