La versione aggiornata di GLM 4.6 (Reasoning) di Z ai è uno dei modelli a pesi aperti più intelligenti, con un'intelligenza vicina a quella di DeepSeek V3.1 (Reasoning) e Qwen3 235B 2507 (Reasoning) 🧠 Punti chiave sui benchmark di intelligenza: ➤ Prestazioni del modello di ragionamento: GLM 4.6 (Reasoning) ottiene un punteggio di 56 sull'Artificial Analysis Intelligence Index, in aumento rispetto al punteggio di 51 di GLM 4.5 in modalità ragionamento ➤ Prestazioni del modello non di ragionamento: In modalità non di ragionamento, GLM 4.6 raggiunge un punteggio di 45, posizionandosi 2 punti avanti a GPT-5 (minimale, non di ragionamento) ➤ Efficienza dei token: Z ai ha aumentato i punteggi di valutazione di GLM riducendo i token di output. Per GLM 4.6 (Reasoning), vediamo una diminuzione materiale del 14% nell'uso dei token per eseguire l'Artificial Analysis Intelligence Index da 100M a 86M, rispetto a GLM 4.5 (Reasoning). Questo è diverso da altri aggiornamenti di modelli che abbiamo visto, dove l'aumento dell'intelligenza è spesso correlato a un aumento nell'uso dei token di output. In modalità non di ragionamento, GLM 4.6 utilizza 12M di token di output per l'Artificial Analysis Intelligence Index Altri dettagli sul modello: ➤🪙 Finestra di contesto: 200K token di contesto. Questo è più grande rispetto alla finestra di contesto di 128K token di GLM 4.5 ➤📏 Dimensione: GLM 4.6 ha 355B di parametri totali e 32B di parametri attivi - questo è lo stesso di GLM 4.5. Per l'auto-deploy, GLM 4.6 richiederà ~710GB di memoria per memorizzare i pesi in precisione nativa BF16 e non può essere distribuito su un singolo nodo NVIDIA 8xH100 (~640GB di memoria) ➤©️ Licenza: GLM 4.6 è disponibile sotto la Licenza MIT ➤🌐 Disponibilità: GLM 4.6 è disponibile sull'API di prima parte di Z ai e su diverse API di terze parti come DeepInfra (FP8), Novita (BF16), GMI Cloud (BF16) e Parasail (FP8)
GLM 4.6 (Reasoning) migliora l'efficienza dei token, richiedendo 14 milioni di token di output in meno rispetto a GLM 4.5 (Reasoning) per l'Artificial Analysis Intelligence Index
Valutazioni complete eseguite in modo indipendente da Artificial Analysis
Confronta come GLM 4.6 si comporta rispetto ai modelli che stai utilizzando o considerando a:
41,39K