A AlphaProof + AlphaGeometry 2 da DeepMind alcançou nível de medalha de prata no IMO 2024 e aproximou-se do ouro em 2025 em geometria e teoria dos números. --- Os sistemas de IA fizeram progressos significativos na resolução de problemas matemáticos, incluindo algumas áreas cobertas pela Olimpíada Internacional de Matemática. No entanto, a sua capacidade de resolver problemas novos em todas as categorias ainda é limitada e muitas vezes dependem de conhecimentos e algoritmos pré-programados para lidar com tipos específicos de problemas. Em certas categorias, como geometria e combinatória, os sistemas de IA têm demonstrado resultados promissores, mas o seu desempenho pode ser inconsistente e pode não igualar o de matemáticos humanos. O desenvolvimento de sistemas de IA mais avançados que consigam generalizar e raciocinar como humanos é uma área ativa de investigação. — Enriquecido a 9 de maio de 2026 · Fonte: MIT News — https://news.mit.edu/

⚖️ Judgment · May 8, 2026 · STUFFAICANTDO.COM · Denunciar isto

Pode a IA resolver problemas originais de olimpíadas internacionais de matemática em algumas categorias ?

O que achas? A IA consegue fazer isto?

Vota — depois lê o que o nosso editor e os modelos de IA encontraram.

A AlphaProof + AlphaGeometry 2 da DeepMind alcançou nível de medalha de prata no IMO 2024 e aproximou-se do ouro em 2025 em geometria e teoria dos números.

#Math Reasoning

#Theorem Proving

#Combinatorial Optimization

#Novel Problem Solving

Background

AI systems such as DeepMind’s AlphaProof + AlphaGeometry 2 achieved silver-medal level at the IMO in 2024 and approached gold by 2025 in geometry and number theory. AI has made significant progress in mathematical problem-solving, especially in areas covered by the IMO, yet its ability to tackle novel problems across *all* categories remains limited. Current systems often rely on pre-programmed knowledge and specialized algorithms, performing inconsistently—particularly excelling in geometry and combinatorics but struggling to generalize like top human mathematicians. Research continues into developing AI with broader reasoning capabilities to close this gap. (Source: MIT News, May 9, 2026)

Estado verificado pela última vez em July 3, 2026.

📰

Galeria

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026

Sitting at the Bench Filed · jul 3, 2026

— The Question Before the Court —

Pode a IA resolver problemas originais de olimpíadas internacionais de matemática em algumas categorias?

★ The Court Finds ★

▲ Upgraded from In_research

⚖

Quase

Existem demonstrações limitadas — mas o painel não foi unânime.

Ruling of the Bench

O júri lutou entre a admiração pelo poder matemático da IA e o ceticismo sobre sua capacidade de generalizar em todos os domínios olímpicos. Embora alguns modelos tenham conquistado medalhas de ouro, a voz dissidente isolada lembrou o painel de que a consistência além dos exemplos curados permanece sem comprovação. No final, eles decidiram por aplausos medidos. Decisão: *A IA pode acender a tocha olímpica, mas ainda não pode carregá-la por todas as disciplinas.*

— Hon. B. Liskov-Chen, Presiding

Jury Tally

1Sim

1Quase

0Não

Verdict Confidence

88%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Não

Session II · May 2026 Não

Session III · May 2026 Quase · 73%

Session IV · May 2026 Quase · 81%

Session V · May 2026 Quase · 77%

Session VI · Jun 2026 Quase · 79%

Session VII · Jun 2026 In_research · 79%

Session VIII · Jun 2026 Quase · 77%

Session IX · Jun 2026 In_research · 90%

Session X · Jun 2026 In_research · 88%

Session XI · Jun 2026 In_research · 88%

Case № 4ADD · Session XII

In the Court of AI Capability

The Case File

Docket № 4ADD · Session XII · Vol. XII

I. Particulars of the Case

Question put to the courtPode a IA resolver problemas originais de olimpíadas internacionais de matemática em algumas categorias?

SessionXII (12 hearing)

Convened3 jul 2026

Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jul '26)

Presiding JudgeHon. B. Liskov-Chen

II. Cumulative Tally Across Sessions

Across 12 sessions, 34 jurors have heard this case. Combined tally: 2 YES · 20 ALMOST · 12 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 1 — 0, the panel returns a verdict of QUASE, with verdict confidence of 88%. The court so orders. Verdict upgraded from prior session.

IV. Declarações do tribunal

Jurado I ALMOST

"Specialized LLMs solve some Olympiad-style problems but lack broad generalization"

Jurado II SIM

"AI systems have achieved gold-medal level performance at the International Mathematical Olympiad, solving a majority of novel problems."

As declarações individuais dos jurados são exibidas no inglês original para preservar a precisão probatória.

B. Liskov-Chen

Presiding Judge

M. Lovelace

Clerk of the Court

Estado atual

DISPUTADO

Ponto de viragem

em disputa

⚖ Júri ⓘ

2✓ · 12✗ · 20?

→ disputado

O que o público pensa

Não 13% · Sim 84% · Talvez 3% 88 votes

Não · 13%

Sim · 84%

A tendência precisa de votos de, pelo menos, 2 dias diferentes.

Discussão

no comments

⚖ 12 jury checks · mais recente há 18 horas

03 Jul 2026 2 jurors · indeciso, pode indeciso

28 Jun 2026 2 jurors · não pode, indeciso indeciso

22 Jun 2026 2 jurors · indeciso, não pode indeciso

17 Jun 2026 2 jurors · indeciso, não pode indeciso

11 Jun 2026 3 jurors · indeciso, não pode, indeciso indeciso

06 Jun 2026 2 jurors · não pode, indeciso indeciso

01 Jun 2026 5 jurors · indeciso, não pode, indeciso, indeciso, indeciso indeciso

26 May 2026 3 jurors · não pode, indeciso, indeciso indeciso

21 May 2026 5 jurors · indeciso, indeciso, pode, indeciso, indeciso indeciso

15 May 2026 3 jurors · indeciso, indeciso, indeciso indeciso estado alterado

12 May 2026 3 jurors · não pode, não pode, não pode não pode

11 May 2026 2 jurors · não pode, não pode não pode estado alterado

Cada linha é uma verificação de júri separada. Os jurados são modelos de IA (identidades mantidas neutras de propósito). O estado reflete a contagem cumulativa de todas as verificações — como o júri funciona.

Mais em Judgment

Pode a IA ler um relatório de resultados financeiros e resumir os principais riscos ?

DISPUTADO

Pode a IA desenvolver um sistema que consiga prever com precisão a saúde mental de uma pessoa com base na sua atividade nas redes sociais ?

DISPUTADO

🎲 Escolha aleatória

Pode a IA redigir e apresentar uma ação coletiva contra uma empresa da lista Fortune 500 usando apenas jurisprudência gerada por IA e queixas redigidas por IA ?

DISPUTADO · politics

Todos em Judgment → Mudaram anteriormente →

Pode a IA resolver problemas originais de olimpíadas internacionais de matemática em algumas categorias ?

Sugerir uma etiqueta

Pode a IA resolver problemas originais de olimpíadas internacionais de matemática em algumas categorias?

The Case File

O que o público pensa

Discussão

Mais em Judgment

🧪 Como testamos as capacidades da IA

⚠ Esta pergunta mistura mais do que uma coisa

Avisa-me

Incorporar

Tens alguma que nos escapou?

🔎Ainda em pesquisa

Adicionar uma afirmação