Stuff AI CAN'T Do

¿Puede la IA resolver problemas novedosos de la Olimpiada Internacional de Matemáticas en algunas categorías ?

¿Qué opinas?

DeepMind's AlphaProof + AlphaGeometry 2 alcanzó el nivel de medalla de plata en la IMO 2024 y se acercó al oro en 2025 en geometría y teoría de números.

Background

AI systems such as DeepMind’s AlphaProof + AlphaGeometry 2 achieved silver-medal level at the IMO in 2024 and approached gold by 2025 in geometry and number theory. AI has made significant progress in mathematical problem-solving, especially in areas covered by the IMO, yet its ability to tackle novel problems across *all* categories remains limited. Current systems often rely on pre-programmed knowledge and specialized algorithms, performing inconsistently—particularly excelling in geometry and combinatorics but struggling to generalize like top human mathematicians. Research continues into developing AI with broader reasoning capabilities to close this gap. (Source: MIT News, May 9, 2026)

Estado verificado por última vez en June 28, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · jun. 28, 2026
— The Question Before the Court —

¿Puede la IA resolver problemas novedosos de la Olimpiada Internacional de Matemáticas en algunas categorías?

★ The Court Finds ★
Reaffirmed
En investigación

El jurado no pudo emitir un veredicto con las pruebas presentadas.

Ruling of the Bench

El jurado reconoció destellos de progreso —la IA puede procesar problemas que ha visto antes— pero ninguno podía reclamar el misterio completo y centelleante de un verdadero desafío novel de IMO. La sola voz de optimismo cauteloso insistió en que los pequeños avances valen la pena celebrar, mientras que el resto se mantuvo firme en que la montaña sigue sin conquistar. Fallos: los libros de texto de álgebra todavía caben en la mochila, pero la cima de la montaña sigue desnuda.

— Hon. C. Babbage, Presiding
Jury Tally
0
1Casi
1No
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 No
Session III · May 2026 Casi · 73%
Session IV · May 2026 Casi · 81%
Session V · May 2026 Casi · 77%
Session VI · Jun 2026 Casi · 79%
Session VII · Jun 2026 In_research · 79%
Session VIII · Jun 2026 Casi · 77%
Session IX · Jun 2026 In_research · 90%
Session X · Jun 2026 In_research · 88%
Case № 4ADD · Session XI
In the Court of AI Capability

The Case File

Docket № 4ADD · Session XI · Vol. XI
I. Particulars of the Case
Question put to the court¿Puede la IA resolver problemas novedosos de la Olimpiada Internacional de Matemáticas en algunas categorías?
SessionXI (11 hearing)
Convened28 jun. 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26)
Presiding JudgeHon. C. Babbage
II. Cumulative Tally Across Sessions

Across 11 sessions, 32 jurors have heard this case. Combined tally: 1 YES · 19 ALMOST · 12 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 1 — 1, the panel returns a verdict of EN INVESTIGACIóN, with verdict confidence of 88%. The court so orders.

IV. Declaraciones del tribunal
Jurado I No

"No AI system has solved novel IMO problems reliably or broadly."

Jurado II ALMOST

"AI solves some math problems"

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

C. Babbage
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 13% · Sí 84% · Quizás 3% 88 votes
No · 13%
Sí · 84%
La tendencia necesita votos de al menos 2 días distintos.

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

11 jury checks · más reciente hace 13 horas
28 Jun 2026 2 jurors · no puede, indeciso indeciso
22 Jun 2026 2 jurors · indeciso, no puede indeciso
17 Jun 2026 2 jurors · indeciso, no puede indeciso
11 Jun 2026 3 jurors · indeciso, no puede, indeciso indeciso
06 Jun 2026 2 jurors · no puede, indeciso indeciso
01 Jun 2026 5 jurors · indeciso, no puede, indeciso, indeciso, indeciso indeciso
26 May 2026 3 jurors · no puede, indeciso, indeciso indeciso
21 May 2026 5 jurors · indeciso, indeciso, puede, indeciso, indeciso indeciso
15 May 2026 3 jurors · indeciso, indeciso, indeciso indeciso estado cambiado
12 May 2026 3 jurors · no puede, no puede, no puede no puede
11 May 2026 2 jurors · no puede, no puede no puede estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Judgment

¿Nos faltó uno?

Revisamos semanalmente.