🚨Команда DeepSeek зламала дешевий довгий контекст для LLM: попереднє заповнення в ~3,5 рази дешевше і в ~10 разів дешевше декодування при 128k контексті при висновках з тією ж якістю. Не можу не любити єдину передову лабораторію штучного інтелекту, яка публікує відкриту модель і чудові відкриті дослідження!
Технічний звіт:
44,94K