Według @ArtificialAnlys, Hyperbolic wyróżnia się silną wydajnością w różnych długościach kontekstu. Nasz model gpt-oss-120b od @OpenAI osiąga 402 tokeny/sek i utrzymuje stałość w różnych długościach kontekstu, co stawia nas obok najszybszych dostawców wnioskowania.
🚀 Qwen3-Next zasilany przez NVIDIA: Teraz na żywo w Hyperbolic
Wyjątkowe wyniki Hyperbolic dla Qwen3-Next-80B-A3B są zasilane przez nasze klastry NVIDIA @nvidia, oferujące na żądanie GPU H100 i H200 zoptymalizowane do zadań AI. GPU H100 i H200 NVIDIA zasilają naszą infrastrukturę dzięki architekturze Hopper, zapewniając moc obliczeniową niezbędną dla ogromnych modeli MoE Qwen3-Next. Podczas gdy H100 oferują 80 GB pamięci HBM3, H200 przechodzą na 141 GB pamięci HBM3e z nawet 45% lepszą wydajnością.
Qwen3-Next-80B-A3B Benchmarking: Dlaczego Hyperbolic prowadzi
Najnowsze badania porównawcze od @ArtificialAnlys stawiają Hyperbolic na samym szczycie w zakresie Qwen3-Next-80B-A3B-Thinking i Qwen3-Next-80B-A3B-Instruct we wszystkich kluczowych metrykach: prędkość, opóźnienie i koszt.