Har du överskridit H100:s minnesgräns på 80 GB?
H200-kluster med flera noder är nu tillgängliga på begäran.
141 GB HBM3 per GPU, $2,20/timme, etablera en enskild nod eller ett kluster på ~60 sekunder.
Enligt @ArtificialAnlys sticker Hyperbolic ut med stark prestanda över kontextlängder. Vår gpt-oss-120b-modell från @OpenAI levererar 402 tokens/sek och förblir konsekvent över kontextlängder, vilket placerar oss precis bredvid de snabbaste inferensleverantörerna.