熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
IBM 推出了 Granite 4.0 - 一個新的開放權重語言模型系列,大小範圍從 3B 到 32B。人工分析在發布前提供了訪問權限,我們的基準測試顯示 Granite 4.0 H Small(32B/9B 總/活躍參數)在智力指數上得分 23,特別在標記效率方面表現出色。
今天 IBM 發布了四個新模型:Granite 4.0 H Small(32B/9B 總/活躍參數)、Granite 4.0 H Tiny(7B/1B)、Granite 4.0 H Micro(3B/3B)和 Granite 4.0 Micro(3B/3B)。我們使用人工分析智力指數評估了 Granite 4.0 Small(在非推理模式下)和 Granite 4.0 Micro。Granite 4.0 模型結合了一小部分標準變壓器風格的注意力層和大多數 Mamba 層,聲稱在不影響性能的情況下減少內存需求。
關鍵基準測試要點:
➤🧠 Granite 4.0 H Small 智力:在非推理模式下,Granite 4.0 H Small 在人工分析智力指數上得分 23,比 IBM Granite 3.3 8B(非推理)提高了 +8 分。Granite 4.0 H Small 超過了 Gemma 3 27B(22),但落後於 Mistral Small 3.2(29)、EXAONE 4.0 32B(非推理,30)和 Qwen3 30B A3B 2507(非推理,37)在智力方面。
➤⚡ Granite 4.0 Micro 智力:在人工分析智力指數上,Granite 4.0 Micro 得分 16。它超過了 Gemma 3 4B(15)和 LFM 2 2.6B(12)。
➤⚙️ 標記效率:Granite 4.0 H Small 和 Micro 展示了令人印象深刻的標記效率 - Granite 4.0 Small 使用 5.2M,而 Granite 4.0 Micro 使用 6.7M 標記來運行人工分析智力指數。這兩個模型使用的標記數量少於 Granite 3.3 8B(非推理)和大多數其他小於 40B 總參數的開放權重非推理模型(除了 Qwen3 0.6B,該模型使用 1.9M 輸出標記)。
關鍵模型細節:
➤🌐 可用性:所有四個模型均可在 Hugging Face 上獲得。Granite 4.0 H Small 可在 Replicate 上獲得,價格為每 1M 輸入/輸出標記 $0.06/$0.25。
➤📏 上下文窗口:128K 標記。
➤©️ 許可:Granite 4.0 模型在 Apache 2.0 許可下可用。


Granite 4.0 H Small’s(非推理)輸出代幣效率和每個代幣定價在智能與運行人工分析智能指數的成本之間提供了引人注目的權衡。

在總參數小於40B的開放權重非推理模型類別中,Granite 4.0 H Small處於智慧與人工分析智慧指數中使用的輸出標記之間的邊界權衡。

在總參數小於4B的開放權重非推理模型類別中,Granite 4.0 Micro處於智能與人工分析智能指數中使用的輸出標記之間的權衡前沿。

比較 Granite 4.0 型號相對於您正在使用或考慮的其他型號的表現:
34.99K
熱門
排行
收藏