Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI alle Olimpiadi di Matematica: Una Nuova Era nella Risoluzione dei Problemi Matematici
L'IMO è da tempo la competizione matematica più difficile al mondo per i migliori studenti.
Ora, sta diventando un punto di riferimento anche per il ragionamento dell'IA.👇
Quest'anno ha segnato una pietra miliare:
I modelli di intelligenza artificiale di Google DeepMind e OpenAI hanno raggiunto prestazioni da medaglia d'oro nei problemi dell'IMO — lo stesso livello dei migliori concorrenti umani.
Un vero salto nella capacità dell'IA di ragionare attraverso la matematica astratta.
Cronologia degli eventi:
> Venerdì: Notizie trapelate sulle prestazioni da medaglia d'oro di DeepMind
> Sabato 1am: OpenAI ha annunciato i risultati prima della conferma ufficiale
> Lunedì: DeepMind ha ufficialmente confermato lo status di medaglia d'oro con soluzioni eleganti completamente verificate dagli ufficiali IMO. Le loro soluzioni erano più eleganti e rigorosamente controllate.
Cambiamento tecnologico dal 2024 al 2025
L'anno scorso: i modelli di intelligenza artificiale come AlphaGeometry avevano bisogno di una traduzione di dominio (Lean, ecc.) + 2-3 giorni di calcolo.
Quest'anno: i modelli di Gemini e OpenAI hanno risolto problemi end-to-end in linguaggio naturale, entro il limite di 4,5 ore dell'IMO.
Differenze di Stile
Risposte di OpenAI:
> Logicamente valide, ma disordinate
> Mancava di struttura, termini come "vietato" usati eccessivamente
> Oltre 400 righe per alcuni problemi
> Non leggibili per gli esseri umani
Prove di Gemini:
> Eleganti e chiare, i valutatori IMO hanno detto che erano "facili da seguire"
> Potrebbero passare per scritte da un umano
Il problema 2 (geometria) ha mostrato il divario:
OpenAI ha utilizzato la geometria delle coordinate a forza bruta → una prova corretta ma goffa a 442 linee
Gemini di DeepMind ha utilizzato l'angle chasing e il teorema di Sylvester → soluzione concisa e perspicace che rispecchiava un essere umano esperto.
Perché Gemini ha avuto successo
> Pensiero parallelo: esplorazione simultanea di più percorsi di soluzione
> Nuove tecniche di apprendimento per rinforzo che migliorano il ragionamento in più fasi
> Accesso a soluzioni matematiche accuratamente curate e suggerimenti strategici
L'approccio di OpenAI?
RL di uso generale + scalabilità del calcolo al momento del test.
Cosa significa
Risolvere i problemi IMO è impressionante, ma la vera matematica va più in profondità:
> Ragionamento astratto
> Creazione del concetto
> Intuizione di ricerca
Non ci siamo ancora, ma questo è un vero passo avanti.
Per far progredire davvero le capacità matematiche dell'intelligenza artificiale, avremo bisogno di:
> Funzioni di ricompensa granulari
> Pipeline RL specializzate
> O forse... Una tecnica jolly che nessuno si aspettava
Man mano che l'IA avanza in matematica, scienza e ricerca, la necessità di calcolo esplode.
Ecco perché l'accesso a un'infrastruttura GPU scalabile e conveniente è fondamentale.
Rendiamo quel futuro accessibile a tutti.
Dai un'occhiata al blog completo qui:
Il nostro podcast completo con Latent Space qui:
1,07K
Principali
Ranking
Preferiti