Selon @ArtificialAnlys, Hyperbolic se distingue par ses performances solides sur différentes longueurs de contexte. Notre modèle gpt-oss-120b par @OpenAI délivre 402 tokens/sec et reste constant sur les longueurs de contexte, nous plaçant aux côtés des fournisseurs d'inférence les plus rapides.
🚀 Qwen3-Next propulsé par NVIDIA : Maintenant en direct sur Hyperbolic
Les benchmarks supérieurs d'Hyperbolic pour Qwen3-Next-80B-A3B sont alimentés par nos clusters NVIDIA @nvidia, avec des GPU H100 et H200 à la demande, optimisés pour les charges de travail d'IA. Les GPU H100 et H200 de NVIDIA alimentent notre infrastructure avec leur architecture Hopper, fournissant la puissance de calcul nécessaire pour les énormes modèles MoE de Qwen3-Next. Alors que les H100 offrent 80 Go de mémoire HBM3, les H200 passent à 141 Go de mémoire HBM3e avec jusqu'à 45 % de performance en plus.
Qwen3-Next-80B-A3B Benchmarking : Pourquoi Hyperbolic est en tête
Les récentes évaluations de @ArtificialAnlys placent Hyperbolic au tout premier rang pour Qwen3-Next-80B-A3B-Thinking et Qwen3-Next-80B-A3B-Instruct sur chaque indicateur clé : vitesse, latence et coût.