Важная исследовательская работа: "Меньше значит больше: Рекурсивное мышление с помощью крошечных сетей" Согласно исследованию, крошечная модель с 7 миллионами параметров превосходит более крупные LLM (включая DeepSeek R1, Gemini 2.5 Pro) на ARC-AGI-1/2 • ARC-AGI-1: 44.6% • ARC-AGI-2: 7.8% прорыв заключается не в размере, а в эффективности. малые рекурсивные модели намекают на то, что следующий скачок произойдет за счет оптимизации, а не масштабирования.