Ускорение научного прогресса — один из самых значительных способов, которыми ИИ может принести пользу обществу. Модели уже могут помогать исследователям рассуждать над сложными проблемами — но для того, чтобы это делать хорошо, необходимо тестировать модели на более сложных оценках и в реальных научных рабочих процессах, основанных на экспериментах.
GPT-5.2 — наша самая мощная модель на оценке FrontierScience, показывающая явные улучшения в сложных научных задачах. Но эталон также выявляет разрыв между высокой производительностью в структурированных задачах и открытым, итеративным рассуждением, которое требуется для настоящих исследований.
Самым значимым ориентиром для ИИ в науке являются новые открытия, которые он позволяет делать. FrontierScience находится на переднем крае этой цели, предоставляя северную звезду для экспертного научного мышления, тестируя модели на сложных, стандартизированных задачах и показывая, где они успешны или терпят неудачу. Хотя FrontierScience обязательно узкая, это шаг к более сложным и значимым критериям, которые необходимы в этой области.
Клонирование является основным инструментом молекулярной биологии, и улучшение эффективности имеет применение во всей биотехнологии. Это дает представление о том, как AI может работать бок о бок с биологами, чтобы ускорить исследования. Улучшение экспериментальных методов поможет человеческим исследователям двигаться быстрее, сократить затраты и перевести открытия в реальное воздействие.
Сочетание более сложных эталонов, таких как FrontierScience, с реальными лабораторными оценками дает нам более четкую карту того, где модели эффективны сегодня и где требуется дальнейшая разработка. Мы видим сильные ранние перспективы, наряду с четко определенными ограничениями, и мы будем продолжать работать с учеными, чтобы сделать эти модели более способными и надежными партнерами в открытии.
95