Según @ArtificialAnlys, Hyperbolic se destaca con un sólido rendimiento en todas las longitudes de contexto. Nuestro modelo gpt-oss-120b de @OpenAI ofrece 402 tokens/seg y se mantiene constante en las longitudes de contexto, lo que nos coloca junto a los proveedores de inferencia más rápidos.
🚀 Qwen3-Next con tecnología NVIDIA: ahora disponible en Hyperbolic
Los puntos de referencia superiores de Hyperbolic para Qwen3-Next-80B-A3B están impulsados por nuestros clústeres NVIDIA @nvidia, con GPU H100 y H200 bajo demanda optimizadas para cargas de trabajo de IA. Las GPU H100 y H200 de NVIDIA impulsan nuestra infraestructura con su arquitectura Hopper, proporcionando la computación necesaria para los modelos masivos de MoE de Qwen3-Next. Mientras que los H100 ofrecen 80 GB de memoria HBM3, los H200 se actualizan a 141 GB de memoria HBM3e con un rendimiento hasta un 45% mejor.
Qwen3-Next-80B-A3B Benchmarking: Por qué los leads hiperbólicos
La evaluación comparativa reciente de @ArtificialAnlys coloca a Hyperbolic en la cima de Qwen3-Next-80B-A3B-Thinking y Qwen3-Next-80B-A3B-Instruct en todas las métricas clave: velocidad, latencia y costo.