Te lovești de limita de memorie de 80 GB a H100?
Clusterele cu mai multe noduri H200 sunt acum disponibile la cerere.
141 GB HBM3 per GPU, 2,20 USD/oră, furnizează un singur nod sau un cluster în ~60 de secunde.
Potrivit @ArtificialAnlys, Hyperbolic se remarcă prin performanțe puternice pe lungimi de context. Modelul nostru gpt-oss-120b de la @OpenAI oferă 402 tokenuri/sec și rămâne consecvent pe lungimea contextului, plasându-ne alături de cei mai rapizi furnizori de inferență.
🚀 Qwen3-Next cu NVIDIA: acum live la Hyperbolic
Benchmark-urile superioare ale Hyperbolic pentru Qwen3-Next-80B-A3B sunt susținute de clusterele noastre NVIDIA @nvidia, cu GPU-uri H100 și H200 la cerere optimizate pentru sarcinile de lucru AI. GPU-urile NVIDIA H100 și H200 ne alimentează infrastructura cu arhitectura lor Hopper, oferind calculul necesar pentru modelele masive MoE ale Qwen3-Next. În timp ce H100 oferă 80 GB de memorie HBM3, H200 face upgrade la 141 GB de memorie HBM3e cu performanțe cu până la 45% mai bune.