🔥 Hot topics · NÃO sabe fazer · Sabe fazer · § The Court · Mudanças recentes · 📈 Cronologia · Pergunta · Editoriais · 🔥 Hot topics · NÃO sabe fazer · Sabe fazer · § The Court · Mudanças recentes · 📈 Cronologia · Pergunta · Editoriais
Stuff AI CAN'T Do

Pode a IA resolver problemas originais de olimpíadas internacionais de matemática em algumas categorias ?

O que achas?

A AlphaProof + AlphaGeometry 2 da DeepMind alcançou nível de medalha de prata no IMO 2024 e aproximou-se do ouro em 2025 em geometria e teoria dos números.

Background

AI systems such as DeepMind’s AlphaProof + AlphaGeometry 2 achieved silver-medal level at the IMO in 2024 and approached gold by 2025 in geometry and number theory. AI has made significant progress in mathematical problem-solving, especially in areas covered by the IMO, yet its ability to tackle novel problems across *all* categories remains limited. Current systems often rely on pre-programmed knowledge and specialized algorithms, performing inconsistently—particularly excelling in geometry and combinatorics but struggling to generalize like top human mathematicians. Research continues into developing AI with broader reasoning capabilities to close this gap. (Source: MIT News, May 9, 2026)

Estado verificado pela última vez em July 3, 2026.

📰

Galeria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul 3, 2026
— The Question Before the Court —

Pode a IA resolver problemas originais de olimpíadas internacionais de matemática em algumas categorias?

★ The Court Finds ★
▲ Upgraded from In_research
Quase

Existem demonstrações limitadas — mas o painel não foi unânime.

Ruling of the Bench

O júri lutou entre a admiração pelo poder matemático da IA e o ceticismo sobre sua capacidade de generalizar em todos os domínios olímpicos. Embora alguns modelos tenham conquistado medalhas de ouro, a voz dissidente isolada lembrou o painel de que a consistência além dos exemplos curados permanece sem comprovação. No final, eles decidiram por aplausos medidos. Decisão: *A IA pode acender a tocha olímpica, mas ainda não pode carregá-la por todas as disciplinas.*

— Hon. B. Liskov-Chen, Presiding
Jury Tally
1Sim
1Quase
0Não
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Não
Session II · May 2026 Não
Session III · May 2026 Quase · 73%
Session IV · May 2026 Quase · 81%
Session V · May 2026 Quase · 77%
Session VI · Jun 2026 Quase · 79%
Session VII · Jun 2026 In_research · 79%
Session VIII · Jun 2026 Quase · 77%
Session IX · Jun 2026 In_research · 90%
Session X · Jun 2026 In_research · 88%
Session XI · Jun 2026 In_research · 88%
Case № 4ADD · Session XII
In the Court of AI Capability

The Case File

Docket № 4ADD · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtPode a IA resolver problemas originais de olimpíadas internacionais de matemática em algumas categorias?
SessionXII (12 hearing)
Convened3 jul 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 12 sessions, 34 jurors have heard this case. Combined tally: 2 YES · 20 ALMOST · 12 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 1 — 0, the panel returns a verdict of QUASE, with verdict confidence of 88%. The court so orders. Verdict upgraded from prior session.

IV. Declarações do tribunal
Jurado I ALMOST

"Specialized LLMs solve some Olympiad-style problems but lack broad generalization"

Jurado II SIM

"AI systems have achieved gold-medal level performance at the International Mathematical Olympiad, solving a majority of novel problems."

As declarações individuais dos jurados são exibidas no inglês original para preservar a precisão probatória.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

O que o público pensa

Não 13% · Sim 84% · Talvez 3% 88 votes
Não · 13%
Sim · 84%
A tendência precisa de votos de, pelo menos, 2 dias diferentes.

Discussão

no comments

Comentários e imagens passam por análise admin antes de aparecerem publicamente.

12 jury checks · mais recente há 17 horas
03 Jul 2026 2 jurors · indeciso, pode indeciso
28 Jun 2026 2 jurors · não pode, indeciso indeciso
22 Jun 2026 2 jurors · indeciso, não pode indeciso
17 Jun 2026 2 jurors · indeciso, não pode indeciso
11 Jun 2026 3 jurors · indeciso, não pode, indeciso indeciso
06 Jun 2026 2 jurors · não pode, indeciso indeciso
01 Jun 2026 5 jurors · indeciso, não pode, indeciso, indeciso, indeciso indeciso
26 May 2026 3 jurors · não pode, indeciso, indeciso indeciso
21 May 2026 5 jurors · indeciso, indeciso, pode, indeciso, indeciso indeciso
15 May 2026 3 jurors · indeciso, indeciso, indeciso indeciso estado alterado
12 May 2026 3 jurors · não pode, não pode, não pode não pode
11 May 2026 2 jurors · não pode, não pode não pode estado alterado

Cada linha é uma verificação de júri separada. Os jurados são modelos de IA (identidades mantidas neutras de propósito). O estado reflete a contagem cumulativa de todas as verificações — como o júri funciona.

Mais em Judgment

Tens alguma que nos escapou?

Adiciona uma afirmação ao atlas. Revemos semanalmente.