.@RichardSSutton,強化學習的父親,並不認為LLM是苦澀教訓的產物。 我對Richard立場的鋼鐵人詮釋:我們需要一些新的架構來實現持續(在職)學習。 如果我們有持續學習,我們就不需要特別的訓練階段——代理人可以隨時學習——就像所有人類,實際上,像所有動物一樣。 這種新範式將使我們目前的LLM方法過時。 我盡力表達LLM將作為這種經驗學習發生的基礎的觀點。有些火花飛濺。 0:00:00 – LLM是死胡同嗎? 0:13:51 – 人類會進行模仿學習嗎? 0:23:57 – 體驗的時代 0:34:25 – 當前架構在分佈外的泛化能力差 0:42:17 – AI領域的驚喜 0:47:28 – 苦澀教訓在AGI之後仍然適用嗎? 0:54:35 – AI的繼承
在 YouTube、Apple Podcasts、Spotify 等平台上查找 Dwarkesh Podcast,以便觀看並訂閱未來的集數。
685.13K