Tekoäly matematiikan olympialaisissa: Matemaattisen ongelmanratkaisun uusi aikakausi IMO on pitkään ollut maailman kovin matematiikkakilpailu huippuopiskelijoille. Nyt siitä on tulossa myös tekoälyn päättelyn vertailukohta. 👇
Tämä vuosi merkitsi virstanpylvästä: Google DeepMindin ja OpenAI:n tekoälymallit saavuttivat kultamitalin IMO-ongelmissa – samalla tasolla kuin huippukilpailijat. Todellinen harppaus tekoälyn kyvyssä päätellä abstraktin matematiikan avulla.
Tapahtumien aikajana: > perjantai: Uutinen vuoti DeepMindin kultamitalisuorituksesta > lauantaina klo 1: OpenAI julkisti tulokset ennen virallista vahvistusta > maanantai: DeepMind vahvisti virallisesti kultamitalin statuksen tyylikkäillä ratkaisuilla, jotka IMO:n virkamiehet ovat täysin vahvistaneet. Heidän ratkaisunsa olivat tyylikkäämpiä ja tarkastetumpia
Tekninen muutos vuodesta 2024 vuoteen 2025 Viime vuonna: AlphaGeometryn kaltaiset tekoälymallit tarvitsivat verkkotunnuksen käännöksen (Lean jne.) + 2–3 päivän laskentaa. Tänä vuonna: Gemini & OpenAI:n mallit ratkaisivat ongelmia päästä päähän luonnollisella kielellä, 4,5 tunnin IMO-rajan sisällä.
Tyylin erot OpenAI:n vastaukset: > Loogisesti järkevä, mutta sotkuinen > Puuttui rakenne, liikaa käytettyjä termejä, kuten "kielletty" > 400+ riviä joihinkin ongelmiin > Ei ihmisen luettavissa Kaksosten todisteet: > Tyylikkäät ja selkeät IMO-luokittelijat sanoivat, että niitä oli "helppo seurata" > Voisi kulkea ihmisen kirjoittamana
Tehtävä 2 (geometria) osoitti aukon: OpenAI käytti raa'an voiman koordinaattigeometriaa → oikeaan mutta kömpelöön 442 rivin todistukseen DeepMindin Gemini käytti kulman jahtaamista ja Sylvesterin lausetta ytimekkään, oivaltavan ratkaisun →, joka heijasti taitavaa ihmistä.
Miksi Gemini onnistui > Rinnakkaisajattelu: Useiden ratkaisupolkujen tutkiminen samanaikaisesti > Uudet vahvistusoppimistekniikat, jotka parantavat monivaiheista päättelyä > Pääsy huolellisesti kuratoituihin matemaattisiin ratkaisuihin ja strategisiin vinkkeihin
OpenAI:n lähestymistapa? Yleiskäyttöinen RL + testiaikainen laskennan skaalaus.
Mitä tämä tarkoittaa IMO-ongelmien ratkaiseminen on vaikuttavaa, mutta todellinen matematiikka menee syvemmälle: > Abstrakti päättely > Konseptin luominen > Tutki intuitiota Emme ole vielä perillä, mutta tämä on todellinen askel eteenpäin.
Jotta voimme todella viedä tekoälyn matemaattisia ominaisuuksia eteenpäin, tarvitsemme: > Yksityiskohtaiset palkitsemisfunktiot > Erikoistuneet RL-putkistot > Tai ehkä... Jokerikorttitekniikka, jota kukaan ei osannut odottaa tulevan
Kun tekoäly siirtyy matematiikkaan, luonnontieteisiin ja tutkimukseen, laskennan tarve kasvaa räjähdysmäisesti. Siksi pääsy kohtuuhintaiseen ja skaalautuvaan GPU-infrastruktuuriin on kriittisen tärkeää. Tehdään tämä tulevaisuus kaikkien ulottuville.
Katso koko blogi täältä:
Koko podcastimme Latent Spacen kanssa täällä:
1,09K