我们的 @OpenAI gpt-oss-120b 模型不仅实现了每秒 402 个标记的速度,而且在从 1k 到 100k 个标记的过程中保持了这一吞吐量而不崩溃。对于扩展现实世界应用的团队来说,这种一致性意味着可预测的成本、生产级的可靠性,以及在大规模部署时的信心。