跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
DEX API
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+3.6%
USELESS
+3.86%
IKUN
+0.85%
gib
-0.67%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-2.15%
ALON
+1.85%
LAUNCHCOIN
-11.8%
GOONC
-3.41%
KLED
+28.59%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+0.8%
Boopa
-1.27%
PORK
+6.11%
主頁
Joan Cabezas
Joan Cabezas
10月11日 00:57
🧵 隨著 AI 實驗室競相擴展強化學習(RL),有一個問題至關重要:你應該在什麼時候停止預訓練並開始強化學習? 我們在 GSM8K 上訓練了 5 個 Qwen 模型(0.6B→14B)並發現了一些驚人的事情: 小型模型出現類似於 EMERGENCE 的跳躍。大型模型則看到收益遞減。 擴展法則?並不是你所期望的那樣。
38.79K
231
Joan Cabezas
10月10日 11:28
所以,@OpenAI 在做開源硬體,但卻沒有任何炒作! 今晚打算在這上面黑客攻關,感謝 @dubssg 和 @michelleqin_,謝謝你 :) 我一直想要 @Humane,但希望是開源、便宜,且沒有那些垃圾。
3.68K
6
Joan Cabezas
2025年9月30日
保留曲線看起來更好
z∩ch
2025年9月29日
Aura had 25k active users last week.
3.22K
16
熱門
排行
收藏