IBM推出了Granite 4.0——一个新的开放权重语言模型系列,规模从3B到32B不等。人工分析在发布前获得了访问权限,我们的基准测试显示Granite 4.0 H Small(32B/9B总/活跃参数)在智能指数上得分23,在令牌效率方面表现尤为突出。 今天,IBM发布了四个新模型:Granite 4.0 H Small(32B/9B总/活跃参数)、Granite 4.0 H Tiny(7B/1B)、Granite 4.0 H Micro(3B/3B)和Granite 4.0 Micro(3B/3B)。我们使用人工分析智能指数评估了Granite 4.0 Small(在非推理模式下)和Granite 4.0 Micro。Granite 4.0模型结合了一小部分标准的变压器风格注意力层和大多数Mamba层,声称在不影响性能的情况下减少内存需求。 关键基准测试要点: ➤🧠 Granite 4.0 H Small智能:在非推理模式下,Granite 4.0 H Small在人工分析智能指数上得分23,比IBM Granite 3.3 8B(非推理)提高了8分。Granite 4.0 H Small的得分高于Gemma 3 27B(22),但低于Mistral Small 3.2(29)、EXAONE 4.0 32B(非推理,30)和Qwen3 30B A3B 2507(非推理,37)在智能方面。 ➤⚡ Granite 4.0 Micro智能:在人工分析智能指数上,Granite 4.0 Micro得分16。它高于Gemma 3 4B(15)和LFM 2 2.6B(12)。 ➤⚙️ 令牌效率:Granite 4.0 H Small和Micro展示了令人印象深刻的令牌效率——Granite 4.0 Small使用5.2M,而Granite 4.0 Micro使用6.7M令牌来运行人工分析智能指数。这两个模型使用的令牌数量少于Granite 3.3 8B(非推理)和大多数其他小于40B总参数的开放权重非推理模型(除了Qwen3 0.6B,它使用1.9M输出令牌)。 关键模型细节: ➤🌐 可用性:所有四个模型均可在Hugging Face上获得。Granite 4.0 H Small可在Replicate上获得,定价为每百万输入/输出令牌$0.06/$0.25。 ➤📏 上下文窗口:128K令牌 ➤©️ 许可:Granite 4.0模型在Apache 2.0许可下可用。
Granite 4.0 H Small(非推理)输出令牌效率和每个令牌定价在智能与运行人工分析智能指数的成本之间提供了一个引人注目的权衡。
在总参数小于40B的开放权重非推理模型类别中,Granite 4.0 H Small处于智能与人工分析智能指数中使用的输出令牌之间的前沿权衡。
在开放权重非推理模型中,总参数小于4B的类别中,Granite 4.0 Micro处于智能与人工分析智能指数中使用的输出令牌之间的权衡前沿。
比较Granite 4.0模型与您正在使用或考虑的其他模型的性能:
34.99K