Z ai 更新的 GLM 4.6(推理)是最智能的开放权重模型之一,接近 DeepSeek V3.1(推理)和 Qwen3 235B 2507(推理)级别的智能 🧠 关键智能基准测试要点: ➤ 推理模型性能:GLM 4.6(推理)在人工分析智能指数上得分 56,较 GLM 4.5 在推理模式下的 51 分有所上升 ➤ 非推理模型性能:在非推理模式下,GLM 4.6 的得分为 45,领先 GPT-5(最小的非推理)2 分 ➤ 令牌效率:Z ai 在减少输出令牌的同时提高了 GLM 的评估分数。对于 GLM 4.6(推理),我们看到人工分析智能指数的令牌使用量减少了 14%,从 100M 降至 86M,相较于 GLM 4.5(推理)。这与我们看到的其他模型升级不同,其他模型的智能提升通常与输出令牌使用量的增加相关。在非推理模式下,GLM 4.6 使用 12M 输出令牌来运行人工分析智能指数 其他模型细节: ➤🪙 上下文窗口:200K 令牌上下文。这比 GLM 4.5 的 128K 令牌上下文更大 ➤📏 大小:GLM 4.6 具有 355B 总参数和 32B 活跃参数 - 这与 GLM 4.5 相同。对于自我部署,GLM 4.6 需要约 710GB 的内存来存储以原生 BF16 精度的权重,无法在单个 NVIDIA 8xH100 节点(约 640GB 内存)上部署 ➤©️ 许可:GLM 4.6 在 MIT 许可下可用 ➤🌐 可用性:GLM 4.6 可在 Z ai 的第一方 API 和多个第三方 API 上使用,如 DeepInfra(FP8)、Novita(BF16)、GMI Cloud(BF16)和 Parasail(FP8)
GLM 4.6(推理)提高了令牌效率,与 GLM 4.5(推理)相比,减少了 1400 万个输出令牌,适用于人工分析智能指数
由人工智能分析独立运行的完整评估
比较 GLM 4.6 相对于您正在使用或考虑的模型的表现:
41.37K