Podczas gdy Kimi k2 od Moonshot AI jest wiodącym modelem o otwartych wagach, który nie wykorzystuje rozumowania w Indeksie Sztucznej Analizy Inteligencji, generuje ~3 razy więcej tokenów niż inne modele bez rozumowania, zacierając granice między rozumowaniem a brakiem rozumowania. Kimi k2 jest największym modelem o otwartych wagach - 1T całkowitych parametrów z 32B aktywnymi (wymaga to ogromnej pamięci 1TB w natywnym FP8, aby przechować wagi). Mamy k2 na 57. miejscu w Indeksie Sztucznej Analizy Inteligencji, co jest imponującym wynikiem, który stawia go powyżej modeli takich jak GPT-4.1 i DeepSeek V3, ale za wiodącymi modelami rozumującymi. Do tej pory istniała wyraźna różnica między modelami rozumującymi a modelami bez rozumowania w naszych ocenach - definiowana nie tylko przez to, czy model używa tagów <reasoning>, ale przede wszystkim przez użycie tokenów. Mediana liczby tokenów używanych do odpowiedzi na wszystkie oceny w Indeksie Sztucznej Analizy Inteligencji jest ~10 razy wyższa dla modeli rozumujących niż dla modeli bez rozumowania. @Kimi_Moonshot's Kimi k2 używa ~3 razy więcej tokenów niż mediana modelu bez rozumowania. Jego użycie tokenów jest tylko o 30% niższe niż Claude 4 Sonnet i Opus, gdy są uruchamiane w ich maksymalnym budżecie w trybie rozszerzonego myślenia, i jest prawie trzykrotnie wyższe niż użycie tokenów zarówno Claude 4 Sonnet, jak i Opus z wyłączonym rozumowaniem. Zalecamy zatem, aby Kimi k2 był porównywany z Claude 4 Sonnet i Opus w ich maksymalnych budżetach w trybie rozszerzonego myślenia, a nie z wynikami modeli Claude 4 bez rozumowania. Kimi k2 jest dostępny w API pierwszej strony @Kimi_Moonshot oraz w @FireworksAI_HQ, @togethercompute, @novita_labs i @parasail_io. Zobacz poniżej i na Sztucznej Analizie, aby uzyskać dalszą analizę 👇
60,42K