Provedores Kimi K2: Groq está servindo Kimi K2 a >400 tokens de saída / s, 40 vezes mais rápido que a API primária do Moonshot Parabéns a vários provedores por serem rápidos no lançamento de APIs para Kimi K2, incluindo @GroqInc, @basetenco, @togethercompute, @FireworksAI_HQ, @parasail_io, @novita_labs, @DeepInfra e, claro, @Kimi_Moonshot. Isso é impressionante, considerando o tamanho do modelo em 1 trilhão de parâmetros totais. Groq se destaca por sua velocidade extremamente rápida. DeepInfra, Novita e Baseten se destacam por seus preços, sendo os únicos provedores com preços semelhantes ou mais baratos do que a API primária do Moonshot. Veja abaixo mais comparações entre os provedores. Esperamos aumentos rápidos na velocidade em alguns provedores à medida que as equipes otimizam para o modelo K2 - nossos números abaixo mostram velocidades médias nas últimas 72 horas, mas já estamos vendo o DeepInfra saltar para 62 tokens/s nas medições de hoje
52,08K