¿Te encuentras con el límite de memoria de 80 GB del H100?
Los clústeres de varios nodos H200 ahora están disponibles bajo demanda.
HBM3 de 141 GB por GPU, 2,20 USD/hora, aprovisiona un solo nodo o un clúster en ~60 segundos.
Según @ArtificialAnlys, Hyperbolic se destaca con un sólido rendimiento en todas las longitudes de contexto. Nuestro modelo gpt-oss-120b de @OpenAI ofrece 402 tokens/seg y se mantiene constante en las longitudes de contexto, lo que nos coloca junto a los proveedores de inferencia más rápidos.
🚀 Qwen3-Next con tecnología NVIDIA: ahora disponible en Hyperbolic
Los puntos de referencia superiores de Hyperbolic para Qwen3-Next-80B-A3B están impulsados por nuestros clústeres NVIDIA @nvidia, con GPU H100 y H200 bajo demanda optimizadas para cargas de trabajo de IA. Las GPU H100 y H200 de NVIDIA impulsan nuestra infraestructura con su arquitectura Hopper, proporcionando la computación necesaria para los modelos masivos de MoE de Qwen3-Next. Mientras que los H100 ofrecen 80 GB de memoria HBM3, los H200 se actualizan a 141 GB de memoria HBM3e con un rendimiento hasta un 45% mejor.