Secondo @ArtificialAnlys, Hyperbolic si distingue per le sue prestazioni elevate su lunghezze di contesto. Il nostro modello gpt-oss-120b di @OpenAI fornisce 402 token/sec e rimane costante su lunghezze di contesto, mettendoci al pari dei fornitori di inferenza più veloci.
🚀 Qwen3-Next alimentato da NVIDIA: ora attivo su Hyperbolic
I benchmark superiori di Hyperbolic per Qwen3-Next-80B-A3B sono alimentati dai nostri cluster NVIDIA @nvidia, con GPU H100 e H200 on-demand ottimizzate per carichi di lavoro AI. Le GPU H100 e H200 di NVIDIA alimentano la nostra infrastruttura con la loro architettura Hopper, fornendo la potenza di calcolo necessaria per i massicci modelli MoE di Qwen3-Next. Mentre gli H100 offrono 80GB di memoria HBM3, gli H200 passano a 141GB di memoria HBM3e con prestazioni fino al 45% migliori.
Qwen3-Next-80B-A3B Benchmarking: Perché Hyperbolic è in testa
Recenti benchmark di @ArtificialAnlys collocano Hyperbolic al vertice per Qwen3-Next-80B-A3B-Thinking e Qwen3-Next-80B-A3B-Instruct in ogni metrica chiave: velocità, latenza e costo.