"Sonraki token tahmini" ciddi bir rakip 🤯 kazandı Ant Group yeni LLaDA 2.1'i çıkardı ve bu baskın LLM paradigmasına meydan okuyor. Çoğu modelin bir anda tek bir token üretmesinin aksine, LLaDA 2.1 paralel olarak metin blokları oluşturmak için difüzyon kullanır. Neden bu her şeyi değiştiriyor:  → Küresel Planlama: "Geçmişi" yazarken "geleceği" etkili bir şekilde görür → Paralel Üretim: Parçalar sıralı olarak değil, paralel olarak üretir ve çok daha hızlıdır → Büyük Verimlilik: Sadece ~1.4B aktif parametre kullanan 16B MoE mimarisi. %100 Açık Kaynak.