O GLM 4.6 atualizado (Raciocínio) da Z ai é um dos modelos de pesos abertos mais inteligentes, com inteligência de nível próximo ao DeepSeek V3.1 (Raciocínio) e Qwen3 235B 2507 (Raciocínio) 🧠 Principais conclusões de benchmarking de inteligência: ➤ Desempenho do Modelo de Raciocínio: GLM 4.6 (Raciocínio) pontua 56 no Índice de Inteligência de Análise Artificial, acima da pontuação do GLM 4.5 de 51 no modo de raciocínio ➤ Desempenho do modelo sem raciocínio: No modo sem raciocínio, o GLM 4.6 atinge uma pontuação de 45, colocando-o 2 pontos à frente do GPT-5 (mínimo, sem raciocínio) ➤ Eficiência do token: Z ai aumentou as pontuações de avaliação do GLM enquanto diminuía os tokens de saída. Para o GLM 4.6 (Raciocínio), vemos uma diminuição material de 14% no uso de tokens para executar o Índice de Inteligência de Análise Artificial de 100 milhões para 86 milhões, em comparação com o GLM 4.5 (Raciocínio). Isso é diferente de outras atualizações de modelo que vimos, onde o aumento da inteligência é frequentemente correlacionado com o aumento do uso do token de saída. No modo sem raciocínio, o GLM 4.6 usa 12 milhões de tokens de saída para o Índice de Inteligência de Análise Artificial Outros detalhes do modelo: 🪙 ➤ Janela de contexto: 200K de contexto de token. Isso é maior em comparação com a janela de contexto do GLM 4.5 de 128 mil tokens 📏 ➤ Tamanho: GLM 4.6 tem 355B parâmetros totais e 32B parâmetros ativos - isso é o mesmo que GLM 4.5. Para autoimplantação, o GLM 4.6 exigirá ~710 GB de memória para armazenar os pesos com precisão BF16 nativa e não pode ser implantado em um único nó NVIDIA 8xH100 (~640 GB de memória) ©️ ➤ Licenciamento: GLM 4.6 está disponível sob a licença MIT 🌐 ➤ Disponibilidade: O GLM 4.6 está disponível na API primária da Z ai e em várias APIs de terceiros, como DeepInfra (FP8), Novita (BF16), GMI Cloud (BF16) e Parasail (FP8)
O GLM 4.6 (Raciocínio) melhora a eficiência do token, exigindo 14 milhões a menos de tokens de saída em comparação com o GLM 4.5 (Raciocínio) para o Índice de Inteligência de Análise Artificial
Avaliações completas executadas de forma independente pela Análise Artificial
Compare o desempenho do GLM 4.6 em relação aos modelos que você está usando ou considerando em:
41,37K