🔥 Hot topics · NON sa fare · Sa fare · § The Court · Cambi recenti · 📈 Cronologia · Chiedi · Editoriali · 🔥 Hot topics · NON sa fare · Sa fare · § The Court · Cambi recenti · 📈 Cronologia · Chiedi · Editoriali
Stuff AI CAN'T Do

L'IA può risolvere problemi di matematica di livello internazionale in alcune categorie ?

Tu cosa ne pensi?

DeepMind's AlphaProof + AlphaGeometry 2 ha raggiunto un livello da medaglia d'argento all'IMO 2024 e si è avvicinato all'oro entro il 2025 in geometria e teoria dei numeri.

Background

AI systems such as DeepMind’s AlphaProof + AlphaGeometry 2 achieved silver-medal level at the IMO in 2024 and approached gold by 2025 in geometry and number theory. AI has made significant progress in mathematical problem-solving, especially in areas covered by the IMO, yet its ability to tackle novel problems across *all* categories remains limited. Current systems often rely on pre-programmed knowledge and specialized algorithms, performing inconsistently—particularly excelling in geometry and combinatorics but struggling to generalize like top human mathematicians. Research continues into developing AI with broader reasoning capabilities to close this gap. (Source: MIT News, May 9, 2026)

Stato verificato l'ultima volta il June 28, 2026.

📰

Galleria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · giu 28, 2026
— The Question Before the Court —

L'IA può risolvere problemi di matematica di livello internazionale in alcune categorie?

★ The Court Finds ★
Reaffirmed
In esame

La giuria non ha potuto emettere un verdetto sulle prove presentate.

Ruling of the Bench

La giuria ha riconosciuto bagliori di progresso - l'AI può risolvere problemi che ha già visto in precedenza - ma nessuno poteva reclamare il pieno, scintillante mistero di una vera sfida IMO innovativa. La sola voce di cauto ottimismo ha insistito che le piccole scoperte valgono la pena di essere celebrate, mentre il resto ha mantenuto saldamente che la montagna rimane inviolata. Verdetto: i libri di algebra ancora entrano nello zaino, ma la vetta della montagna rimane spoglia.

— Hon. C. Babbage, Presiding
Jury Tally
0
1Quasi
1No
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 No
Session III · May 2026 Quasi · 73%
Session IV · May 2026 Quasi · 81%
Session V · May 2026 Quasi · 77%
Session VI · Jun 2026 Quasi · 79%
Session VII · Jun 2026 In_research · 79%
Session VIII · Jun 2026 Quasi · 77%
Session IX · Jun 2026 In_research · 90%
Session X · Jun 2026 In_research · 88%
Case № 4ADD · Session XI
In the Court of AI Capability

The Case File

Docket № 4ADD · Session XI · Vol. XI
I. Particulars of the Case
Question put to the courtL'IA può risolvere problemi di matematica di livello internazionale in alcune categorie?
SessionXI (11 hearing)
Convened28 giu 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26)
Presiding JudgeHon. C. Babbage
II. Cumulative Tally Across Sessions

Across 11 sessions, 32 jurors have heard this case. Combined tally: 1 YES · 19 ALMOST · 12 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 1 — 1, the panel returns a verdict of IN ESAME, with verdict confidence of 88%. The court so orders.

IV. Dichiarazioni del collegio
Giurato I NO

"No AI system has solved novel IMO problems reliably or broadly."

Giurato II ALMOST

"AI solves some math problems"

Le singole dichiarazioni dei giurati sono mostrate nell'inglese originale per preservare la precisione probatoria.

C. Babbage
Presiding Judge
M. Lovelace
Clerk of the Court

Cosa pensa il pubblico

No 13% · Sì 84% · Forse 3% 88 votes
No · 13%
Sì · 84%
La tendenza richiede voti da almeno 2 giorni diversi.

Discussione

no comments

Commenti e immagini passano per una revisione admin prima di apparire pubblicamente.

11 jury checks · più recente 15 ore fa
28 Jun 2026 2 jurors · non può, indeciso indeciso
22 Jun 2026 2 jurors · indeciso, non può indeciso
17 Jun 2026 2 jurors · indeciso, non può indeciso
11 Jun 2026 3 jurors · indeciso, non può, indeciso indeciso
06 Jun 2026 2 jurors · non può, indeciso indeciso
01 Jun 2026 5 jurors · indeciso, non può, indeciso, indeciso, indeciso indeciso
26 May 2026 3 jurors · non può, indeciso, indeciso indeciso
21 May 2026 5 jurors · indeciso, indeciso, può, indeciso, indeciso indeciso
15 May 2026 3 jurors · indeciso, indeciso, indeciso indeciso stato cambiato
12 May 2026 3 jurors · non può, non può, non può non può
11 May 2026 2 jurors · non può, non può non può stato cambiato

Ogni riga è un controllo di giuria separato. I giurati sono modelli di IA (identità tenute volutamente neutre). Lo stato riflette il conteggio cumulativo su tutti i controlli — come funziona la giuria.

Altri in Judgment

Ne hai una che ci è sfuggita?

Aggiungi un'affermazione all'atlante. Le revisioniamo settimanalmente.