新しいARC-AGI SOTA:GPT-5 Pro - ARC-AGI-1: 70.2%、4.78 ドル/タスク - ARC-AGI-2: 18.3%、7.41 ドル/タスク @OpenAI の GPT-5 Pro は、ARC-AGI のセミプライベート ベンチマークで検証済みのフロンティア LLM スコアが最高になりました
リーダーボードを表示します。 GPT-5 Pro の回答をご覧ください。 結果を再現します。 テストポリシーの詳細をご覧ください。
528.16K