跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
-7.06%
USELESS
+5.19%
IKUN
+1.03%
gib
-2.28%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+1.59%
ALON
-1.07%
LAUNCHCOIN
+4.98%
GOONC
-0.26%
KLED
+27.8%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+4.71%
Boopa
+18.5%
PORK
0.00%
主頁
Dwarkesh Patel
Dwarkesh Patel
13 小時前
為什麼 @RichardSSutton 認為 LLMs 違背了痛苦的教訓:
Dwarkesh Patel
18 小時前
.@RichardSSutton,強化學習的父親,並不認為LLM是苦澀教訓的產物。 我對Richard立場的鋼鐵人詮釋:我們需要一些新的架構來實現持續(在職)學習。 如果我們有持續學習,我們就不需要特別的訓練階段——代理人可以隨時學習——就像所有人類,實際上,像所有動物一樣。 這種新範式將使我們目前的LLM方法過時。 我盡力表達LLM將作為這種經驗學習發生的基礎的觀點。有些火花飛濺。 0:00:00 – LLM是死胡同嗎? 0:13:51 – 人類會進行模仿學習嗎? 0:23:57 – 體驗的時代 0:34:25 – 當前架構在分佈外的泛化能力差 0:42:17 – AI領域的驚喜 0:47:28 – 苦澀教訓在AGI之後仍然適用嗎? 0:54:35 – AI的繼承
40.59K
228
Dwarkesh Patel
18 小時前
.@RichardSSutton,強化學習的父親,並不認為LLM是苦澀教訓的產物。 我對Richard立場的鋼鐵人詮釋:我們需要一些新的架構來實現持續(在職)學習。 如果我們有持續學習,我們就不需要特別的訓練階段——代理人可以隨時學習——就像所有人類,實際上,像所有動物一樣。 這種新範式將使我們目前的LLM方法過時。 我盡力表達LLM將作為這種經驗學習發生的基礎的觀點。有些火花飛濺。 0:00:00 – LLM是死胡同嗎? 0:13:51 – 人類會進行模仿學習嗎? 0:23:57 – 體驗的時代 0:34:25 – 當前架構在分佈外的泛化能力差 0:42:17 – AI領域的驚喜 0:47:28 – 苦澀教訓在AGI之後仍然適用嗎? 0:54:35 – AI的繼承
464.77K
1.84K
熱門
排行
收藏