Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Podczas gdy Kimi k2 od Moonshot AI jest wiodącym modelem o otwartych wagach, który nie wykorzystuje rozumowania w Indeksie Sztucznej Analizy Inteligencji, generuje ~3 razy więcej tokenów niż inne modele bez rozumowania, zacierając granice między rozumowaniem a brakiem rozumowania.
Kimi k2 jest największym modelem o otwartych wagach - 1T całkowitych parametrów z 32B aktywnymi (wymaga to ogromnej pamięci 1TB w natywnym FP8, aby przechować wagi). Mamy k2 na 57. miejscu w Indeksie Sztucznej Analizy Inteligencji, co jest imponującym wynikiem, który stawia go powyżej modeli takich jak GPT-4.1 i DeepSeek V3, ale za wiodącymi modelami rozumującymi.
Do tej pory istniała wyraźna różnica między modelami rozumującymi a modelami bez rozumowania w naszych ocenach - definiowana nie tylko przez to, czy model używa tagów <reasoning>, ale przede wszystkim przez użycie tokenów. Mediana liczby tokenów używanych do odpowiedzi na wszystkie oceny w Indeksie Sztucznej Analizy Inteligencji jest ~10 razy wyższa dla modeli rozumujących niż dla modeli bez rozumowania.
@Kimi_Moonshot's Kimi k2 używa ~3 razy więcej tokenów niż mediana modelu bez rozumowania. Jego użycie tokenów jest tylko o 30% niższe niż Claude 4 Sonnet i Opus, gdy są uruchamiane w ich maksymalnym budżecie w trybie rozszerzonego myślenia, i jest prawie trzykrotnie wyższe niż użycie tokenów zarówno Claude 4 Sonnet, jak i Opus z wyłączonym rozumowaniem.
Zalecamy zatem, aby Kimi k2 był porównywany z Claude 4 Sonnet i Opus w ich maksymalnych budżetach w trybie rozszerzonego myślenia, a nie z wynikami modeli Claude 4 bez rozumowania.
Kimi k2 jest dostępny w API pierwszej strony @Kimi_Moonshot oraz w @FireworksAI_HQ, @togethercompute, @novita_labs i @parasail_io.
Zobacz poniżej i na Sztucznej Analizie, aby uzyskać dalszą analizę 👇



60,42K
Najlepsze
Ranking
Ulubione