IBM telah meluncurkan Granite 4.0 - keluarga baru model bahasa bobot terbuka mulai dari 3B hingga 32B. Analisis Buatan disediakan akses pra-rilis, dan pembandingan kami menunjukkan Granite 4.0 H Small (parameter total/aktif 32B/9B) mencetak Indeks Kecerdasan 23, dengan kekuatan khusus dalam efisiensi token Hari ini IBM merilis empat model baru: Granite 4.0 H Small (32B/9B total/parameter aktif), Granite 4.0 H Tiny (7B/1B), Granite 4.0 H Micro (3B/3B) dan Granite 4.0 Micro (3B/3B). Kami mengevaluasi Granite 4.0 Small (dalam mode non-penalaran) dan Granite 4.0 Micro menggunakan Indeks Kecerdasan Analisis Buatan. Model granit 4.0 menggabungkan sejumlah kecil lapisan perhatian bergaya transformator standar dengan sebagian besar lapisan Mamba yang mengklaim dapat mengurangi kebutuhan memori tanpa memengaruhi kinerja Poin utama pembandingan: ➤ 🧠 Granit 4.0 H Kecerdasan Kecil: Dalam non-penalaran, Granit 4.0 H Small mendapat skor 23 pada indeks Kecerdasan Analisis Buatan - lompatan +8 poin pada Indeks dibandingkan dengan IBM Granite 3.3 8B (Non Reasoning). Granit 4.0 H Tempat kecil di depan Gemma 3 27B (22) tetapi di belakang Mistral Small 3.2 (29), EXAONE 4.0 32B (Non-Reasoning, 30) dan Qwen3 30B A3B 2507 (Non-Reasoning, 37) dalam kecerdasan ➤ ⚡ Kecerdasan Mikro Granit 4.0: Pada Indeks Kecerdasan Analisis Buatan, skor Mikro Granit 4.0 16. Ini menempati posisi di depan Gemma 3 4B (15) dan LFM 2 2,6B (12). ➤ ⚙️ Efisiensi token: Granite 4.0 H Small dan Micro menunjukkan efisiensi token yang mengesankan - Granite 4.0 Small menggunakan 5.2M, sedangkan Granite 4.0 Micro menggunakan 6.7 juta token untuk menjalankan Indeks Kecerdasan Analisis Buatan. Kedua model token lebih sedikit daripada Granite 3.3 8B (Non-Reasoning) dan sebagian besar model non-penalaran bobot terbuka lainnya yang lebih kecil dari parameter total 40B (kecuali Qwen3 0.6B yang menggunakan 1.9 juta token keluaran) Detail model utama: ➤ 🌐 Ketersediaan: Keempat model tersedia di Hugging Face. Granite 4.0 H Small tersedia di Replika dan dihargai $0,06/$0,25 per 1 juta token input/output ➤ 📏 Jendela Konteks: 128K token ➤ ©️ Lisensi: Model Granite 4.0 tersedia di bawah lisensi Apache 2.0
Efisiensi token keluaran Granite 4.0 H Small (Non Reasoning) dan harga per token menawarkan tradeoff yang menarik antara kecerdasan dan Indeks Kecerdasan Analisis Buatan Biaya untuk Dijalankan
Dalam kategori model Non-Penalaran Bobot Terbuka yang lebih kecil dari parameter total 40B, Granite 4.0 H Small berada di perbatasan tradeoff antara kecerdasan dan Token Output yang Digunakan dalam Indeks Kecerdasan Analisis Buatan
Dalam kategori model Non-Penalaran Bobot Terbuka yang lebih kecil dari total parameter 4B, Granite 4.0 Micro berada di perbatasan tradeoff antara kecerdasan dan Token Keluaran yang Digunakan dalam Indeks Kecerdasan Analisis Buatan
Bandingkan bagaimana kinerja model Granit 4.0 relatif terhadap model lain yang Anda gunakan atau pertimbangkan di:
34,3K