Zrychlení vědeckého pokroku je jedním z nejvýznamnějších způsobů, jak může AI prospět společnosti. Modely už mohou výzkumníkům pomoci řešit obtížné problémy — ale když to děláte dobře, znamená testovat modely na náročnějších hodnotách a v reálných vědeckých pracovních postupech založených na experimentech.
GPT-5.2 je náš nejsilnější model v hodnocení FrontierScience a ukazuje jasné pokroky v náročných vědeckých úkolech. Benchmark však také odhaluje propast mezi silným výkonem u strukturovaných problémů a otevřeným, iterativním uvažováním, které skutečný výzkum vyžaduje.
Nejvýznamnějším měřítkem pro AI ve vědě jsou nové objevy, které umožňuje. FrontierScience stojí před tímto cílem a poskytuje klíčovou hvězdu pro vědecké uvažování na úrovni expertů tím, že testuje modely na náročných, standardizovaných problémech a ukazuje, kde uspějí nebo zaostávají. Ačkoliv je FrontierScience nutně úzký, je krokem směrem k tvrdším a smysluplnějším měřítkům, které obor potřebuje.
Klonování je základním nástrojem molekulární biologie a zlepšení efektivity má uplatnění v celé biotechnologii. To nabízí pohled na to, jak by umělá inteligence mohla spolupracovat s biology a urychlit výzkum. Zlepšení experimentálních metod pomůže lidským výzkumníkům postupovat rychleji, snížit náklady a převést objevy do reálného dopadu.
Kombinace náročnějších benchmarků, jako je FrontierScience, s reálnými laboratorními hodnoceními nám dává jasnější mapu toho, kde jsou modely dnes účinné a kde je potřeba další vývoj. Vidíme silný raný potenciál spolu s jasně definovanými omezeními a budeme pokračovat ve vývoji s vědci, abychom tyto modely učinili schopnějšími a spolehlivějšími partnery při objevování.
108