Menurut @ArtificialAnlys, Hyperbolic menonjol dengan kinerja yang kuat di seluruh panjang konteks. Model gpt-oss-120b kami pada @OpenAI memberikan 402 token/detik dan tetap konsisten selama panjang konteks, menempatkan kami tepat di samping penyedia inferensi tercepat.
🚀 Qwen3-Next Bertenaga NVIDIA: Sekarang Siaran di Hyperbolic
Tolok ukur unggul Hyperbolic untuk Qwen3-Next-80B-A3B didukung oleh kluster @nvidia NVIDIA kami, menampilkan GPU H100 dan H200 sesuai permintaan yang dioptimalkan untuk beban kerja AI. GPU H100 dan H200 NVIDIA mendukung infrastruktur kami dengan arsitektur Hopper mereka, menyediakan komputasi yang diperlukan untuk model MoE besar Qwen3-Next. Sementara H100 menawarkan memori HBM80 3 GB, H200 meningkatkan ke memori HBM3e 141 GB dengan kinerja hingga 45% lebih baik.
Qwen3-Next-80B-A3B Benchmarking: Mengapa Hyperbolic Leads
Tolok ukur terbaru dari @ArtificialAnlys menempatkan Hyperbolic di urutan paling atas untuk Qwen3-Next-80B-A3B-Thinking dan Qwen3-Next-80B-A3B-Instruct di setiap metrik utama: kecepatan, latensi, dan biaya.