La historia de la ciencia está plagada de momentos importantes en los que todo cambia, para bien o para mal, y eso es lo que está ocurriendo ahora mismo en los departamentos de matemáticas de las universidades más prestigiosas del mundo. Una disciplina milenaria, fundamentada en el razonamiento abstracto y la intuición humana, se enfrenta a un golpe por parte de la IA.

La velocidad a la que la inteligencia artificial está adquiriendo y mejorando sus capacidades lógicas y deductivas ha dejado atónitos incluso a los más escépticos, obligando a la comunidad académica a replantearse qué significa realmente ser matemático en los días que corren.

Como analistas del impacto de las nuevas tecnologías en la ciencia pura, llevamos tiempo observando la evolución de los modelos de lenguaje, y el salto cualitativo que estamos viendo es abrumador.

Uso real

Según un artículo publicado por New Scientist, la percepción de los propios expertos ha cambiado drásticamente en cuestión de meses. Daniel Litt, matemático de la Universidad de Toronto, apostó en marzo de 2025 que existía solo un 25 % de probabilidades de que una IA pudiera escribir un artículo matemático al nivel de los mejores humanos para 2030. Apenas un año después, ha admitido públicamente en su blog que da la apuesta por perdida, sobre todo porque la IA es capaz de resolver problemas reales de investigación.

Todo comenzó a cambiar cuando OpenAI y Google DeepMind lograron rendimientos de medalla de oro en la Olimpiada Internacional de Matemáticas, una competición de élite que muchos consideraban el último bastión inexpugnable de la mente humana frente al software.

Pero el verdadero punto de inflexión ha llegado con el proyecto First Proof, iniciado por Nikhil Srivastava (Universidad de California, Berkeley) y su equipo. Pretendían medir la aptitud matemática de la IA enfrentándola a 10 problemas reales y cotidianos extraídos directamente de las investigaciones de los propios matemáticos. En los resultados, OpenAI afirmó haber resuelto correctamente la mitad de los problemas, mientras que el modelo Aletheia de Google DeepMind logró una puntuación de 6 sobre 10, validada por expertos.

ipad con la pantalla
Figura 2: Interfaz de un asistente matemático basado en IA validando una demostración. Imagen de Apple

Thang Luong, investigador de Google DeepMind, resume a la perfección el sentir general: «Las cosas han cambiado muy rápido. Para nosotros, ahora la IA se ha convertido realmente en un colaborador serio».

Facebook
Instagram