IA en la Olimpiada de Matemáticas: Una nueva era de resolución de problemas matemáticos La OMI ha sido durante mucho tiempo la competencia de matemáticas más dura del mundo para los mejores estudiantes. Ahora, también se está convirtiendo en un punto de referencia para el razonamiento de IA. 👇
Este año marcó un hito: Los modelos de IA de Google DeepMind y OpenAI alcanzaron el rendimiento de la medalla de oro en problemas de la OMI, el mismo nivel que los mejores concursantes humanos. Un verdadero salto en la capacidad de la IA para razonar a través de matemáticas abstractas.
Cronología de los eventos: > viernes: Se filtraron noticias sobre la actuación de DeepMind en la medalla de oro > Sábado 1 a.m.: OpenAI anunció los resultados antes de la confirmación oficial > lunes: DeepMind confirmó oficialmente el estatus de medalla de oro con soluciones elegantes totalmente verificadas por funcionarios de la OMI. Sus soluciones eran más elegantes y rigurosamente controladas
Cambio tecnológico de 2024 a 2025 El año pasado: los modelos de IA como AlphaGeometry necesitaban traducción de dominio (Lean, etc.) + 2-3 días de cómputo. Este año: los modelos de Gemini y OpenAI resolvieron problemas de extremo a extremo en lenguaje natural, dentro del límite de 4,5 horas de la OMI.
Diferencias de estilo Respuestas de OpenAI: > Lógicamente sólido, pero desordenado > Falta de estructura, términos usados en exceso como "prohibido" > 400+ líneas para algunos problemas > No legible por humanos Pruebas de Géminis: > Elegantes y claros, los calificadores de la OMI dijeron que eran "fáciles de seguir" > Podría pasar por escrito por humanos
El problema 2 (Geometría) mostró la brecha: OpenAI utilizó geometría de coordenadas de fuerza bruta → prueba correcta pero torpe de 442 líneas Gemini de DeepMind utilizó la persecución de ángulos y el teorema de Sylvester → solución concisa y perspicaz que reflejaba a un humano experto.
Por qué Gemini tuvo éxito > Pensamiento paralelo: Explorando múltiples caminos de solución simultáneamente > Nuevas técnicas de aprendizaje por refuerzo que mejoran el razonamiento de varios pasos > Acceso a soluciones matemáticas cuidadosamente seleccionadas y consejos estratégicos
¿El enfoque de OpenAI? RL de uso general + escalado de proceso en tiempo de prueba.
Lo que esto significa Resolver problemas de la OMI es impresionante, pero las matemáticas reales son más profundas: > Razonamiento abstracto > Creación de conceptos > Investiga la intuición Todavía no hemos llegado a ese punto, pero este es un verdadero paso adelante.
Para impulsar realmente las capacidades matemáticas de IA, necesitaremos: > Funciones de recompensa granulares > Pipelines especializados de RL > O tal vez... Una técnica comodín que nadie vio venir
A medida que la IA se adentra en las matemáticas, la ciencia y la investigación, la necesidad de computación explota. Es por eso que el acceso a una infraestructura de GPU asequible y escalable es fundamental. Hagamos que ese futuro sea accesible para todos.
Echa un vistazo al blog completo aquí:
Nuestro podcast completo con Latent Space aquí:
1.07K