AI alle Olimpiadi di Matematica: Una Nuova Era nella Risoluzione dei Problemi Matematici L'IMO è da tempo la competizione matematica più difficile al mondo per i migliori studenti. Ora, sta diventando un punto di riferimento anche per il ragionamento dell'IA.👇
Quest'anno ha segnato una pietra miliare: I modelli di intelligenza artificiale di Google DeepMind e OpenAI hanno raggiunto prestazioni da medaglia d'oro nei problemi dell'IMO — lo stesso livello dei migliori concorrenti umani. Un vero salto nella capacità dell'IA di ragionare attraverso la matematica astratta.
Cronologia degli eventi: > Venerdì: Notizie trapelate sulle prestazioni da medaglia d'oro di DeepMind > Sabato 1am: OpenAI ha annunciato i risultati prima della conferma ufficiale > Lunedì: DeepMind ha ufficialmente confermato lo status di medaglia d'oro con soluzioni eleganti completamente verificate dagli ufficiali IMO. Le loro soluzioni erano più eleganti e rigorosamente controllate.
Cambiamento tecnologico dal 2024 al 2025 L'anno scorso: i modelli di intelligenza artificiale come AlphaGeometry avevano bisogno di una traduzione di dominio (Lean, ecc.) + 2-3 giorni di calcolo. Quest'anno: i modelli di Gemini e OpenAI hanno risolto problemi end-to-end in linguaggio naturale, entro il limite di 4,5 ore dell'IMO.
Differenze di Stile Risposte di OpenAI: > Logicamente valide, ma disordinate > Mancava di struttura, termini come "vietato" usati eccessivamente > Oltre 400 righe per alcuni problemi > Non leggibili per gli esseri umani Prove di Gemini: > Eleganti e chiare, i valutatori IMO hanno detto che erano "facili da seguire" > Potrebbero passare per scritte da un umano
Il problema 2 (geometria) ha mostrato il divario: OpenAI ha utilizzato la geometria delle coordinate a forza bruta → una prova corretta ma goffa a 442 linee Gemini di DeepMind ha utilizzato l'angle chasing e il teorema di Sylvester → soluzione concisa e perspicace che rispecchiava un essere umano esperto.
Perché Gemini ha avuto successo > Pensiero parallelo: esplorazione simultanea di più percorsi di soluzione > Nuove tecniche di apprendimento per rinforzo che migliorano il ragionamento in più fasi > Accesso a soluzioni matematiche accuratamente curate e suggerimenti strategici
L'approccio di OpenAI? RL di uso generale + scalabilità del calcolo al momento del test.
Cosa significa Risolvere i problemi IMO è impressionante, ma la vera matematica va più in profondità: > Ragionamento astratto > Creazione del concetto > Intuizione di ricerca Non ci siamo ancora, ma questo è un vero passo avanti.
Per far progredire davvero le capacità matematiche dell'intelligenza artificiale, avremo bisogno di: > Funzioni di ricompensa granulari > Pipeline RL specializzate > O forse... Una tecnica jolly che nessuno si aspettava
Man mano che l'IA avanza in matematica, scienza e ricerca, la necessità di calcolo esplode. Ecco perché l'accesso a un'infrastruttura GPU scalabile e conveniente è fondamentale. Rendiamo quel futuro accessibile a tutti.
Dai un'occhiata al blog completo qui:
Il nostro podcast completo con Latent Space qui:
1,07K