Zatímco Kimi k2 společnosti Moonshot AI je předním modelem s otevřenou váhou v indexu umělé analýzy, vydává ~3x více tokenů než jiné nerozumné modely, čímž stírá hranice mezi uvažováním a neuvažováním Kimi k2 je zatím největší hlavní model s otevřenými váhami - celkové parametry 1T s 32B aktivními (to vyžaduje masivní 1TB paměti na nativním FP8, aby se váhy udržely). V indexu umělé analýzy máme k2 na 57, což je působivé skóre, které ho staví nad modely jako GPT-4.1 a DeepSeek V3, ale za přední modely uvažování. Až dosud byl v našich hodnoceních jasný rozdíl mezi modelem uvažování a modely bez uvažování - definovaný nejen tím, zda model používá <reasoning> značky, ale především použitím tokenů. Medián počtu tokenů použitých k zodpovězení všech hodnocení v indexu umělé analýzy je ~10x vyšší pro modely uvažování než pro modely bez uvažování. Kimi k2 @Kimi_Moonshot používá ~3x více tokenů, než používá mediánový model bez uvažování. Jeho využití tokenů je pouze o 30% nižší než u Claude 4 Sonet a Opus, když běží v režimu rozšířeného myšlení s maximálním rozpočtem, a je téměř trojnásobné oproti použití tokenů Claude 4 Sonet a Opus s vypnutým uvažováním. Proto doporučujeme, aby byl Kimi k2 srovnáván s Claude 4 Sonet a Opus v jejich režimech myšlení s maximálním rozpočtem, nikoli s nerozumovým skóre pro modely Claude 4. Kimi k2 je k dispozici na API první strany @Kimi_Moonshot a také na @FireworksAI_HQ, @togethercompute, @novita_labs a @parasail_io. Další analýzu 👇 naleznete níže a v části Umělá analýza
60,42K