GLM 4.6 (Reasoning) Z ai yang diperbarui adalah salah satu model bobot terbuka paling cerdas, dengan kecerdasan tingkat DeepSeek V3.1 (Reasoning) dan Qwen3 235B 2507 (Reasoning) 🧠 Takeaways pembandingan intelijen utama: ➤ Kinerja Model Penalaran: GLM 4.6 (Penalaran) mendapat skor 56 pada Indeks Kecerdasan Analisis Buatan, naik dari skor GLM 4.5 51 dalam mode penalaran ➤ Kinerja Model Non-Penalaran: Dalam mode non-penalaran, GLM 4.6 mencapai skor 45, menempatkannya 2 poin di depan GPT-5 (minimal, non-penalaran) ➤ Efisiensi token: Z ai telah meningkatkan skor evaluasi GLM sekaligus mengurangi token keluaran. Untuk GLM 4.6 (Penalaran), kami melihat penurunan material sebesar 14% dalam penggunaan token untuk menjalankan Indeks Kecerdasan Analisis Buatan dari 100M menjadi 86M, dibandingkan dengan GLM 4.5 (Reasoning). Ini berbeda dari peningkatan model lain yang telah kita lihat di mana peningkatan kecerdasan sering berkorelasi dengan peningkatan penggunaan token output. Dalam mode non-penalaran, GLM 4.6 menggunakan 12 juta token keluaran untuk Indeks Kecerdasan Analisis Buatan Detail model lainnya: ➤ 🪙 Jendela Konteks: Konteks token 200K. Ini lebih besar dibandingkan dengan jendela konteks GLM 4.5 dari 128K token ➤ 📏 Ukuran: GLM 4.6 memiliki parameter total 355B dan parameter aktif 32B - ini sama dengan GLM 4.5. Untuk penyebaran mandiri, GLM 4.6 akan membutuhkan memori ~710GB untuk menyimpan bobot dalam presisi BF16 asli dan tidak dapat disebarkan pada satu node NVIDIA 8xH100 (memori ~640GB) ➤ ©️ Lisensi: GLM 4.6 tersedia di bawah Lisensi MIT ➤ 🌐 Ketersediaan: GLM 4.6 tersedia di API pihak pertama Z ai dan beberapa API pihak ketiga seperti DeepInfra (FP8), Novita (BF16), GMI Cloud (BF16) dan Parasail (FP8)
GLM 4.6 (Reasoning) meningkatkan efisiensi token, membutuhkan token output 14 juta lebih sedikit dibandingkan dengan GLM 4.5 (Reasoning) untuk Indeks Kecerdasan Analisis Buatan
Evals lengkap dijalankan secara independen oleh Analisis Buatan
Bandingkan performa GLM 4.6 relatif terhadap model yang Anda gunakan atau pertimbangkan di:
41,39K