「Claude Sonnet 4.5 在 METR 時間範圍評估中並不是 SOTA,和之前的所有 Sonnet 一樣,它正好符合指數趨勢」 @scaling01 片刻