Náš @OpenAI model gpt-oss-120b nejenže dosahuje 402 tokenů za sekundu, ale také udržuje tuto propustnost od 1 do 100 tisíc tokenů bez kolapsu. Pro týmy, které škálují reálné aplikace, znamená tato konzistence předvídatelné náklady, spolehlivost na produkční úrovni a jistotu nasazení ve velkém měřítku.