GSM8K 零-shot(核心 LLM 數學能力基準) Qwen 3 8b 基本版:0.11 Qwen 3 8b 指令版:0.59 Gradients 指令 8b(從 Qwen 3 8b 基本版開始):0.68 是的 - 你沒看錯。 在 Grads 上訓練 >> Qwen 團隊? 下週在 Novelty Search 中將有完整公告!
7.1K