“下一个令牌预测”刚刚迎来了一个强劲的竞争者 🤯 蚂蚁集团刚刚发布了 LLaDA 2.1,它挑战了 LLMs 的主导范式。 与大多数一次生成一个令牌的模型不同,LLaDA 2.1 使用扩散技术并行生成文本块。 为什么这会改变一切: → 全球规划:它在写“过去”的同时有效地看到“未来” → 并行生成:它并行生成块,而不是顺序生成,速度更快 → 巨大的效率:16B MoE 架构每步仅使用约 1.4B 活跃参数。 100% 开源。