ARC 獎基金會 + @OpenAI DevDay 2025 @arcprize 很高興能作為 OpenAI DevDay 唯一的外部基準進行展示 @GregKamradt 介紹了 "使用互動評估來衡量代理" 他討論了為什麼互動基準為我們提供了衡量智慧的新工具