L'IA aux Olympiades de Mathématiques : Une nouvelle ère de résolution de problèmes mathématiques L'IMO a longtemps été la compétition de mathématiques la plus difficile au monde pour les meilleurs étudiants. Maintenant, elle devient également un critère pour le raisonnement de l'IA.👇
Cette année a marqué une étape importante : Les modèles d'IA de Google DeepMind et d'OpenAI ont atteint des performances de niveau médaille d'or sur les problèmes de l'IMO — le même niveau que les meilleurs concurrents humains. Un véritable bond dans la capacité de l'IA à raisonner à travers les mathématiques abstraites.
Chronologie des événements : > Vendredi : Des nouvelles ont fuité concernant la performance en or de DeepMind > Samedi 1h : OpenAI a annoncé les résultats avant la confirmation officielle > Lundi : DeepMind a officiellement confirmé son statut de médaille d'or avec des solutions élégantes entièrement vérifiées par les responsables de l'IMO. Leurs solutions étaient plus élégantes et rigoureusement vérifiées.
Virage technologique de 2024 à 2025 L’année dernière : Les modèles d’IA comme AlphaGeometry nécessitaient une traduction de domaine (Lean, etc.) + 2 à 3 jours de calcul. Cette année : les modèles de Gemini et OpenAI ont résolu des problèmes de bout en bout en langage naturel, dans la limite de 4,5 heures de l’OMI.
Différences de style Réponses d'OpenAI : > Logiquement solides, mais désordonnées > Manquaient de structure, termes comme "interdit" trop utilisés > Plus de 400 lignes pour certains problèmes > Pas lisibles par un humain Preuves de Gemini : > Élégantes et claires, les correcteurs IMO ont dit qu'elles étaient "faciles à suivre" > Pourraient passer pour écrites par un humain
Le problème 2 (géométrie) a montré l’écart : OpenAI a utilisé la géométrie de coordonnées par force brute → une preuve correcte mais maladroite de 442 lignes Gemini de DeepMind a utilisé la chasse à l’angle et le théorème de Sylvester → solution concise et perspicace qui reflétait un humain qualifié.
Pourquoi Gemini a réussi > Pensée parallèle : explorer plusieurs pistes de solutions simultanément > De nouvelles techniques d’apprentissage par renforcement améliorant le raisonnement en plusieurs étapes > Accès à des solutions mathématiques et à des conseils stratégiques soigneusement sélectionnés
L'approche d'OpenAI ? Apprentissage par renforcement généraliste + mise à l'échelle des calculs au moment du test.
Ce que cela signifie Résoudre des problèmes d’OMI est impressionnant, mais les mathématiques réelles vont plus loin : > Raisonnement abstrait > Création du concept > Recherche intuition Nous n’en sommes pas encore là, mais c’est un véritable pas en avant.
Pour vraiment faire progresser les capacités mathématiques de l’IA, nous aurons besoin de : > Fonctions de récompense granulaires > Pipelines RL spécialisés > Ou peut-être... Une technique joker que personne n’a vu venir
Alors que l'IA s'immisce dans les mathématiques, la science et la recherche, le besoin de calcul explose. C'est pourquoi l'accès à une infrastructure GPU abordable et évolutive est essentiel. Rendons cet avenir accessible à tous.
Découvrez le blog complet ici :
Notre podcast complet avec Latent Space ici :
1,09K