IBM hat Granite 4.0 eingeführt - eine neue Familie von offenen Sprachmodellen mit Gewichten, die von 3B bis 32B reichen. Artificial Analysis erhielt vor der Veröffentlichung Zugang, und unsere Benchmarking zeigt, dass Granite 4.0 H Small (32B/9B Gesamt-/aktive Parameter) einen Intelligence Index von 23 erzielt, mit einer besonderen Stärke in der Token-Effizienz. Heute hat IBM vier neue Modelle veröffentlicht: Granite 4.0 H Small (32B/9B Gesamt-/aktive Parameter), Granite 4.0 H Tiny (7B/1B), Granite 4.0 H Micro (3B/3B) und Granite 4.0 Micro (3B/3B). Wir haben Granite 4.0 Small (im Nicht-Reasoning-Modus) und Granite 4.0 Micro mit dem Artificial Analysis Intelligence Index bewertet. Die Granite 4.0 Modelle kombinieren eine kleine Anzahl von standardmäßigen Transformer-ähnlichen Aufmerksamkeits-Schichten mit einer Mehrheit von Mamba-Schichten, die angeblich die Speicheranforderungen reduzieren, ohne die Leistung zu beeinträchtigen. Wichtige Benchmarking-Ergebnisse: ➤🧠 Granite 4.0 H Small Intelligenz: Im Nicht-Reasoning-Modus erzielt Granite 4.0 H Small 23 im Artificial Analysis Intelligence Index - ein Anstieg von +8 Punkten im Index im Vergleich zu IBM Granite 3.3 8B (Non Reasoning). Granite 4.0 H Small liegt vor Gemma 3 27B (22), aber hinter Mistral Small 3.2 (29), EXAONE 4.0 32B (Non-Reasoning, 30) und Qwen3 30B A3B 2507 (Non-Reasoning, 37) in der Intelligenz. ➤⚡ Granite 4.0 Micro Intelligenz: Im Artificial Analysis Intelligence Index erzielt Granite 4.0 Micro 16. Es liegt vor Gemma 3 4B (15) und LFM 2 2.6B (12). ➤⚙️ Token-Effizienz: Granite 4.0 H Small und Micro zeigen eine beeindruckende Token-Effizienz - Granite 4.0 Small verwendet 5.2M, während Granite 4.0 Micro 6.7M Tokens benötigt, um den Artificial Analysis Intelligence Index auszuführen. Beide Modelle verwenden weniger Tokens als Granite 3.3 8B (Non-Reasoning) und die meisten anderen offenen Gewicht-Non-Reasoning-Modelle mit weniger als 40B Gesamtparametern (außer Qwen3 0.6B, das 1.9M Ausgabetokens verwendet). Wichtige Modellinformationen: ➤🌐 Verfügbarkeit: Alle vier Modelle sind auf Hugging Face verfügbar. Granite 4.0 H Small ist auf Replicate verfügbar und kostet $0.06/$0.25 pro 1M Eingabe-/Ausgabetokens. ➤📏 Kontextfenster: 128K Tokens ➤©️ Lizenzierung: Die Granite 4.0 Modelle sind unter der Apache 2.0 Lizenz verfügbar.
Die Token-Effizienz und die Preisgestaltung pro Token von Granite 4.0 H Small’s (Non Reasoning) bieten einen überzeugenden Kompromiss zwischen Intelligenz und Kosten für den Betrieb des Artificial Analysis Intelligence Index.
In der Kategorie der Open Weights Non-Reasoning-Modelle mit weniger als 40B Gesamtparametern befindet sich Granite 4.0 H Small an der Grenze des Kompromisses zwischen Intelligenz und verwendeten Ausgabetoken im Artificial Analysis Intelligence Index.
In der Kategorie der Open Weights Non-Reasoning-Modelle mit weniger als 4B Gesamtparametern befindet sich Granite 4.0 Micro an der Grenze des Kompromisses zwischen Intelligenz und verwendeten Ausgabetoken im Artificial Analysis Intelligence Index.
Vergleichen Sie, wie die Granite 4.0-Modelle im Vergleich zu anderen Modellen, die Sie verwenden oder in Betracht ziehen, abschneiden:
35,48K