🔥 Hot topics · NON sa fare · Sa fare · § The Court · Cambi recenti · 📈 Cronologia · Chiedi · Editoriali · 🔥 Hot topics · NON sa fare · Sa fare · § The Court · Cambi recenti · 📈 Cronologia · Chiedi · Editoriali
Stuff AI CAN'T Do

L'IA può risolvere problemi di matematica di livello internazionale in alcune categorie ?

Tu cosa ne pensi?

DeepMind's AlphaProof + AlphaGeometry 2 ha raggiunto un livello da medaglia d'argento all'IMO 2024 e si è avvicinato all'oro entro il 2025 in geometria e teoria dei numeri.

Background

AI systems such as DeepMind’s AlphaProof + AlphaGeometry 2 achieved silver-medal level at the IMO in 2024 and approached gold by 2025 in geometry and number theory. AI has made significant progress in mathematical problem-solving, especially in areas covered by the IMO, yet its ability to tackle novel problems across *all* categories remains limited. Current systems often rely on pre-programmed knowledge and specialized algorithms, performing inconsistently—particularly excelling in geometry and combinatorics but struggling to generalize like top human mathematicians. Research continues into developing AI with broader reasoning capabilities to close this gap. (Source: MIT News, May 9, 2026)

Stato verificato l'ultima volta il July 3, 2026.

📰

Galleria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · lug 3, 2026
— The Question Before the Court —

L'IA può risolvere problemi di matematica di livello internazionale in alcune categorie?

★ The Court Finds ★
▲ Upgraded from In_research
Quasi

Esistono dimostrazioni limitate — ma il collegio non è stato unanime.

Ruling of the Bench

La giuria si dibatteva tra l’ammirazione per la potenza matematica dell’AI e lo scetticismo sulla sua capacità di generalizzare in tutti i domini delle Olimpiadi. Sebbene alcuni modelli abbiano conquistato medaglie d’oro, l’unica voce dissenziente ha ricordato al comitato che la coerenza al di fuori degli esempi curati rimane non dimostrata. Alla fine, hanno optato per un applauso misurato. Decisione: *L’AI può accendere la torcia olimpica, ma non ancora portarla avanti in ogni disciplina.*

— Hon. B. Liskov-Chen, Presiding
Jury Tally
1
1Quasi
0No
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 No
Session III · May 2026 Quasi · 73%
Session IV · May 2026 Quasi · 81%
Session V · May 2026 Quasi · 77%
Session VI · Jun 2026 Quasi · 79%
Session VII · Jun 2026 In_research · 79%
Session VIII · Jun 2026 Quasi · 77%
Session IX · Jun 2026 In_research · 90%
Session X · Jun 2026 In_research · 88%
Session XI · Jun 2026 In_research · 88%
Case № 4ADD · Session XII
In the Court of AI Capability

The Case File

Docket № 4ADD · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtL'IA può risolvere problemi di matematica di livello internazionale in alcune categorie?
SessionXII (12 hearing)
Convened3 lug 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 12 sessions, 34 jurors have heard this case. Combined tally: 2 YES · 20 ALMOST · 12 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 1 — 0, the panel returns a verdict of QUASI, with verdict confidence of 88%. The court so orders. Verdict upgraded from prior session.

IV. Dichiarazioni del collegio
Giurato I ALMOST

"Specialized LLMs solve some Olympiad-style problems but lack broad generalization"

Giurato II

"AI systems have achieved gold-medal level performance at the International Mathematical Olympiad, solving a majority of novel problems."

Le singole dichiarazioni dei giurati sono mostrate nell'inglese originale per preservare la precisione probatoria.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Cosa pensa il pubblico

No 13% · Sì 84% · Forse 3% 88 votes
No · 13%
Sì · 84%
La tendenza richiede voti da almeno 2 giorni diversi.

Discussione

no comments

Commenti e immagini passano per una revisione admin prima di apparire pubblicamente.

12 jury checks · più recente 17 ore fa
03 Jul 2026 2 jurors · indeciso, può indeciso
28 Jun 2026 2 jurors · non può, indeciso indeciso
22 Jun 2026 2 jurors · indeciso, non può indeciso
17 Jun 2026 2 jurors · indeciso, non può indeciso
11 Jun 2026 3 jurors · indeciso, non può, indeciso indeciso
06 Jun 2026 2 jurors · non può, indeciso indeciso
01 Jun 2026 5 jurors · indeciso, non può, indeciso, indeciso, indeciso indeciso
26 May 2026 3 jurors · non può, indeciso, indeciso indeciso
21 May 2026 5 jurors · indeciso, indeciso, può, indeciso, indeciso indeciso
15 May 2026 3 jurors · indeciso, indeciso, indeciso indeciso stato cambiato
12 May 2026 3 jurors · non può, non può, non può non può
11 May 2026 2 jurors · non può, non può non può stato cambiato

Ogni riga è un controllo di giuria separato. I giurati sono modelli di IA (identità tenute volutamente neutre). Lo stato riflette il conteggio cumulativo su tutti i controlli — come funziona la giuria.

Altri in Judgment

Ne hai una che ci è sfuggita?

Aggiungi un'affermazione all'atlante. Le revisioniamo settimanalmente.