当社の@OpenAI gpt-oss-120bモデルは、毎秒402トークンを達成するだけでなく、崩壊することなく1kから100kトークンまでのスループットを維持します。実際のアプリケーションをスケーリングするチームにとって、この一貫性は、予測可能なコスト、本番グレードの信頼性、および大規模にデプロイする信頼性を意味します。