GLM 通常被視為僅僅是一個編碼模型,但它在人工分析上的 #1 開源排名卻講述了不同的故事。人們可能忽略的地方:低幻覺、在經濟價值任務上的強大表現,以及頂級的推理和代理能力。 除了基準測試,它在日常聊天和角色扮演方面也表現良好。