一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX | OKX Wallet

發現功能使用指南

background background

discoveryBanners

熱門話題

#

Bonk 生態迷因幣展現強韌勢頭

#

有消息稱 Pump.fun 計劃 40 億估值發幣，引發市場猜測

LAUNCHCOIN+4.98%

#

Solana 新代幣發射平臺 Boop.Fun 風頭正勁

header

Dwarkesh Patel

Dwarkesh Patel

Dwarkesh Patel13 小時前

為什麼 @RichardSSutton 認為 LLMs 違背了痛苦的教訓：

Dwarkesh Patel

Dwarkesh Patel18 小時前

.@RichardSSutton，強化學習的父親，並不認為LLM是苦澀教訓的產物。我對Richard立場的鋼鐵人詮釋：我們需要一些新的架構來實現持續（在職）學習。如果我們有持續學習，我們就不需要特別的訓練階段——代理人可以隨時學習——就像所有人類，實際上，像所有動物一樣。這種新範式將使我們目前的LLM方法過時。我盡力表達LLM將作為這種經驗學習發生的基礎的觀點。有些火花飛濺。 0:00:00 – LLM是死胡同嗎？ 0:13:51 – 人類會進行模仿學習嗎？ 0:23:57 – 體驗的時代 0:34:25 – 當前架構在分佈外的泛化能力差 0:42:17 – AI領域的驚喜 0:47:28 – 苦澀教訓在AGI之後仍然適用嗎？ 0:54:35 – AI的繼承

40.59K

Dwarkesh Patel

Dwarkesh Patel18 小時前

.@RichardSSutton，強化學習的父親，並不認為LLM是苦澀教訓的產物。我對Richard立場的鋼鐵人詮釋：我們需要一些新的架構來實現持續（在職）學習。如果我們有持續學習，我們就不需要特別的訓練階段——代理人可以隨時學習——就像所有人類，實際上，像所有動物一樣。這種新範式將使我們目前的LLM方法過時。我盡力表達LLM將作為這種經驗學習發生的基礎的觀點。有些火花飛濺。 0:00:00 – LLM是死胡同嗎？ 0:13:51 – 人類會進行模仿學習嗎？ 0:23:57 – 體驗的時代 0:34:25 – 當前架構在分佈外的泛化能力差 0:42:17 – AI領域的驚喜 0:47:28 – 苦澀教訓在AGI之後仍然適用嗎？ 0:54:35 – AI的繼承

464.77K

熱門

排行

收藏

©2017 - 2025 WEB3.OKX.COM

繁體中文简体中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

關於 OKX Wallet

下載學院關於我們就業機會聯繫我們服務條款隱私政策 X (原推特)

產品

行情幣幣兌換市場賺幣發現開發者中心瀏覽器安全

用戶支持

幫助中心官方渠道驗證公告 DEX 費率標準加入 OKX 社群比特幣錢包以太坊錢包 Solana 錢包