ARC奖基金会 + @OpenAI DevDay 2025 @arcprize 很高兴作为OpenAI DevDay上唯一的外部基准进行展示 @GregKamradt 介绍了 "通过互动评估测量智能体" 他讲述了为什么互动基准为我们提供了测量智能的新工具