GSM8K零-shot(核心LLM数学能力基准) Qwen 3 8b基础:0.11 Qwen 3 8b指令:0.59 Gradients指令8b(从Qwen 3 8b基础开始):0.68 没错 - 你没看错。 在Grads上的训练 >> Qwen团队? 下周在Novelty Search中发布完整公告!
7.24K