熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
.@RichardSSutton,強化學習的父親,並不認為LLM是苦澀教訓的產物。
我對Richard立場的鋼鐵人詮釋:我們需要一些新的架構來實現持續(在職)學習。
如果我們有持續學習,我們就不需要特別的訓練階段——代理人可以隨時學習——就像所有人類,實際上,像所有動物一樣。
這種新範式將使我們目前的LLM方法過時。
我盡力表達LLM將作為這種經驗學習發生的基礎的觀點。有些火花飛濺。
0:00:00 – LLM是死胡同嗎?
0:13:51 – 人類會進行模仿學習嗎?
0:23:57 – 體驗的時代
0:34:25 – 當前架構在分佈外的泛化能力差
0:42:17 – AI領域的驚喜
0:47:28 – 苦澀教訓在AGI之後仍然適用嗎?
0:54:35 – AI的繼承
在 YouTube、Apple Podcasts、Spotify 等平台上查找 Dwarkesh Podcast,以便觀看並訂閱未來的集數。
685.13K
熱門
排行
收藏