🚨 速報: Grok は引き続き AI ベンチマークを支配し、推論、コーディング、エージェント タスクで OpenAI の ChatGPT、Google の Gemini などを上回っています。 GPQA(科学的推論)で#1 SciCode(コーディング)の#1 ターミナルベンチの#1(エージェントコーディングとターミナル使用)