これは非常に興味深い、そして重要な論文だと思います。私の意見では、ロングコンテクスト思考は非常に重要な機能です。100万歩先を考えることができるAIモデルを想像してみてください。 ✅GPT-5 Thinkingは、私たちがテストした他のすべてのモデルよりもはるかに進んでいます。一度に1000+ステップのタスクを実行できます。 ✅432ステップで2位はクロード4ソネットです...そして Grok-4 が 384 ✅Gemini 2.5 Pro と DeepSeek R1 はわずか 120 と大きく遅れをとっています。