一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

.@RichardSSutton，強化學習的父親，並不認為LLM是苦澀教訓的產物。我對Richard立場的鋼鐵人詮釋：我們需要一些新的架構來實現持續（在職）學習。如果我們有持續學習，我們就不需要特別的訓練階段——代理人可以隨時學習——就像所有人類，實際上，像所有動物一樣。這種新範式將使我們目前的LLM方法過時。我盡力表達LLM將作為這種經驗學習發生的基礎的觀點。有些火花飛濺。 0:00:00 – LLM是死胡同嗎？ 0:13:51 – 人類會進行模仿學習嗎？ 0:23:57 – 體驗的時代 0:34:25 – 當前架構在分佈外的泛化能力差 0:42:17 – AI領域的驚喜 0:47:28 – 苦澀教訓在AGI之後仍然適用嗎？ 0:54:35 – AI的繼承

在 YouTube、Apple Podcasts、Spotify 等平台上查找 Dwarkesh Podcast，以便觀看並訂閱未來的集數。

685.13K