热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
Z ai 更新的 GLM 4.6(推理)是最智能的开放权重模型之一,接近 DeepSeek V3.1(推理)和 Qwen3 235B 2507(推理)级别的智能
🧠 关键智能基准测试要点:
➤ 推理模型性能:GLM 4.6(推理)在人工分析智能指数上得分 56,较 GLM 4.5 在推理模式下的 51 分有所上升
➤ 非推理模型性能:在非推理模式下,GLM 4.6 的得分为 45,领先 GPT-5(最小的非推理)2 分
➤ 令牌效率:Z ai 在减少输出令牌的同时提高了 GLM 的评估分数。对于 GLM 4.6(推理),我们看到人工分析智能指数的令牌使用量减少了 14%,从 100M 降至 86M,相较于 GLM 4.5(推理)。这与我们看到的其他模型升级不同,其他模型的智能提升通常与输出令牌使用量的增加相关。在非推理模式下,GLM 4.6 使用 12M 输出令牌来运行人工分析智能指数
其他模型细节:
➤🪙 上下文窗口:200K 令牌上下文。这比 GLM 4.5 的 128K 令牌上下文更大
➤📏 大小:GLM 4.6 具有 355B 总参数和 32B 活跃参数 - 这与 GLM 4.5 相同。对于自我部署,GLM 4.6 需要约 710GB 的内存来存储以原生 BF16 精度的权重,无法在单个 NVIDIA 8xH100 节点(约 640GB 内存)上部署
➤©️ 许可:GLM 4.6 在 MIT 许可下可用
➤🌐 可用性:GLM 4.6 可在 Z ai 的第一方 API 和多个第三方 API 上使用,如 DeepInfra(FP8)、Novita(BF16)、GMI Cloud(BF16)和 Parasail(FP8)

GLM 4.6(推理)提高了令牌效率,与 GLM 4.5(推理)相比,减少了 1400 万个输出令牌,适用于人工分析智能指数

由人工智能分析独立运行的完整评估

比较 GLM 4.6 相对于您正在使用或考虑的模型的表现:
41.37K
热门
排行
收藏