「下一個標記預測」剛剛迎來了一個強勁的競爭者 🤯 螞蟻集團剛剛推出了 LLaDA 2.1,這挑戰了 LLM 的主導範式。 與大多數一次生成一個標記的模型不同,LLaDA 2.1 使用擴散技術來並行生成文本塊。 為什麼這會改變一切: → 全球規劃:它在寫「過去」的同時有效地看到「未來」 → 並行生成:它並行生成塊,而不是按順序生成,速度更快 → 大規模效率:16B MoE 架構,每步僅使用約 1.4B 的活躍參數。 100% 開源。