Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI la Olimpiada de Matematică: O nouă eră a rezolvării problemelor matematice
IMO a fost mult timp cea mai dură competiție de matematică din lume pentru studenții de top.
Acum, devine un punct de referință și pentru raționamentul AI. 👇
Anul acesta a marcat o piatră de hotar:
Modelele AI de la Google, DeepMind și OpenAI au obținut medalia de aur la problemele IMO - la același nivel cu concurenții umani de top.
Un adevărat salt în capacitatea AI de a raționa prin matematică abstractă.
Cronologia evenimentelor:
> vineri: S-au scurs știri despre performanța DeepMind pentru medalia de aur
> sâmbătă 1 dimineața: OpenAI a anunțat rezultatele înainte de confirmarea oficială
> luni: DeepMind a confirmat oficial statutul de medalie de aur cu soluții elegante complet verificate de oficialii OMI. Soluțiile lor au fost mai elegante și verificate riguros
Schimbare tehnologică din 2024 în 2025
Anul trecut: modelele AI precum AlphaGeometry au avut nevoie de traducere a domeniului (Lean etc.) + 2-3 zile de calcul.
Anul acesta: Modelele Gemini și OpenAI au rezolvat probleme end-to-end în limbaj natural, în limita de 4,5 ore IMO.
Diferențe de stil
Răspunsurile OpenAI:
> Logic sănătos, dar dezordonat
> Lipsă de structură, termeni suprautilizați, cum ar fi "interzis"
> 400+ linii pentru unele probleme
> Nu poate fi citit de om
Dovezile Gemenilor:
> Elegant și clar, evaluatorii IMO au spus că sunt "ușor de urmărit"
> Ar putea trece ca fiind scris de om
Problema 2 (Geometrie) a arătat decalajul:
OpenAI a folosit geometria coordonată de forță brută → demonstrație corectă, dar greoaie de 442 de linii
Gemenii de la DeepMind au folosit urmărirea unghiului și teorema lui Sylvester → soluție concisă și perspicace care oglindește un om priceput.
De ce Gemenii au reușit
> Gândire paralelă: Explorarea simultană a mai multor căi de soluție
> Noi tehnici de învățare prin întărire care îmbunătățesc raționamentul în mai mulți pași
> Acces la soluții matematice atent organizate și sugestii strategice
Abordarea OpenAI?
RL de uz general + scalare de calcul în timpul testului.
Ce înseamnă asta
Rezolvarea problemelor IMO este impresionantă, dar matematica reală merge mai adânc:
> Raționament abstract
> Crearea conceptului
> Intuiția de cercetare
Nu am ajuns încă acolo, dar acesta este un adevărat pas înainte.
Pentru a împinge cu adevărat capacitățile matematice AI, vom avea nevoie de:
> Funcții de recompensă granulară
> Conducte RL specializate
> Sau poate... O tehnică wildcard pe care nimeni nu a văzut-o venind
Pe măsură ce AI se extinde în matematică, știință și cercetare, nevoia de calcul explodează.
De aceea, accesul la o infrastructură GPU accesibilă și scalabilă este esențial.
Să facem acest viitor accesibil tuturor.
Consultați blogul complet aici:
Podcastul nostru complet cu Latent Space aici:
1,08K
Limită superioară
Clasament
Favorite