熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我想知道當 MiniMax 兄弟晉升到 #3 時,他們是否會公開承認失敗。他們對 NSA 擴展的所謂失敗和他們選擇 GQA(甚至不是像 StepFun 那樣聰明的 GQA)的天才決定感到得意,這讓人感到厭煩。快速、昂貴的模型卻注意力薄弱。

我不會對他們的實際技術決策心懷不滿,無論如何,他們可以像其他人一樣轉向DSA/混合MLA(或其他任何東西)。他們在M2上的重點顯然是數據和訓練,並且在這方面取得了大量進展。
但這真的讓人感到煩躁。
509
熱門
排行
收藏

