DeepMind's AlphaProof + AlphaGeometry 2 nåede sølvmedalsjeniveau ved IMO 2024 og nærmede sig guld i 2025 inden for geometri og talteori. --- AI-systemer har gjort betydelige fremskridt med at løse matematiske problemer, herunder nogle områder dækket af Den Internationale Matematikolympiade. Deres evne til at løse nye problemer inden for alle kategorier er dog stadig begrænset, og de er ofte afhængige af forudprogrammeret viden og algoritmer til at tackle specifikke typer af problemer. Inden for visse kategorier, såsom geometri og kombinatorik, har AI-systemer vist lovende resultater, men deres præstation kan være ujævn og matcher muligvis ikke niveauet hos menneskelige matematikere. Udviklingen af mere avancerede AI-systemer, der kan generalisere og ræsonnere som mennesker, er et aktivt forskningsområde. — Opdateret 9. maj 2026 · Kilde: MIT News — https://news.mit.edu/

⚖️ Judgment · May 8, 2026 · STUFFAICANTDO.COM · Rapportér dette

Kan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier ?

Hvad mener du? Kan AI dette?

Afgiv din stemme — læs så hvad vores redaktør og AI-modellerne fandt.

DeepMind's AlphaProof + AlphaGeometry 2 nåede sølvmedalsjeniveau ved IMO 2024 og nærmede sig guld i 2025 inden for geometri og talteori.

#Math Reasoning

#Theorem Proving

#Combinatorial Optimization

#Novel Problem Solving

Background

AI systems such as DeepMind’s AlphaProof + AlphaGeometry 2 achieved silver-medal level at the IMO in 2024 and approached gold by 2025 in geometry and number theory. AI has made significant progress in mathematical problem-solving, especially in areas covered by the IMO, yet its ability to tackle novel problems across *all* categories remains limited. Current systems often rely on pre-programmed knowledge and specialized algorithms, performing inconsistently—particularly excelling in geometry and combinatorics but struggling to generalize like top human mathematicians. Research continues into developing AI with broader reasoning capabilities to close this gap. (Source: MIT News, May 9, 2026)

Status senest tjekket June 28, 2026.

📰

Galleri

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026

Sitting at the Bench Filed · jun. 28, 2026

— The Question Before the Court —

Kan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier?

★ The Court Finds ★

Reaffirmed

⚖

Under undersøgelse

Juryen kunne ikke afsige en dom på det fremlagte bevis.

Ruling of the Bench

Juryen anerkendte glimt af fremskridt – AI kan bearbejde problemer, den har set før – men ingen kunne påstå den fulde, skimrende mystik ved en sandt ny IMO-udfordring. Den ene stemme med forsigtig optimisme hævdede, at små gennembrud er værd at fejre, mens resten stod fast på, at bjerget fortsat er uovervundet. Afgørelse: Algebra-bøgerne får stadig plads i rygsækken, men bjergtoppen forbliver bar.

— Hon. C. Babbage, Presiding

Jury Tally

0Ja

1Næsten

1Nej

Verdict Confidence

88%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nej

Session II · May 2026 Nej

Session III · May 2026 Næsten · 73%

Session IV · May 2026 Næsten · 81%

Session V · May 2026 Næsten · 77%

Session VI · Jun 2026 Næsten · 79%

Session VII · Jun 2026 In_research · 79%

Session VIII · Jun 2026 Næsten · 77%

Session IX · Jun 2026 In_research · 90%

Session X · Jun 2026 In_research · 88%

Case № 4ADD · Session XI

In the Court of AI Capability

The Case File

Docket № 4ADD · Session XI · Vol. XI

I. Particulars of the Case

Question put to the courtKan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier?

SessionXI (11 hearing)

Convened28 jun. 2026

Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26)

Presiding JudgeHon. C. Babbage

II. Cumulative Tally Across Sessions

Across 11 sessions, 32 jurors have heard this case. Combined tally: 1 YES · 19 ALMOST · 12 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 1 — 1, the panel returns a verdict of UNDER UNDERSøGELSE, with verdict confidence of 88%. The court so orders.

IV. Udtalelser fra dommerpanelet

Nævning I NEJ

"No AI system has solved novel IMO problems reliably or broadly."

Nævning II ALMOST

"AI solves some math problems"

Individuelle nævningers udtalelser vises på originalengelsk for at bevare bevismæssig præcision.

C. Babbage

Presiding Judge

M. Lovelace

Clerk of the Court

Aktuel tilstand

OMSTRIDT

Vendepunkt

omstridt

⚖ Jury ⓘ

1✓ · 12✗ · 19?

→ omstridt

Hvad publikum mener

Nej 13% · Ja 84% · Måske 3% 88 votes

Nej · 13%

Ja · 84%

Trend kræver stemmer fra mindst 2 forskellige dage.

Diskussion

no comments

⚖ 11 jury checks · seneste for 15 timer siden

28 Jun 2026 2 jurors · kan ikke, uafklaret uafklaret

22 Jun 2026 2 jurors · uafklaret, kan ikke uafklaret

17 Jun 2026 2 jurors · uafklaret, kan ikke uafklaret

11 Jun 2026 3 jurors · uafklaret, kan ikke, uafklaret uafklaret

06 Jun 2026 2 jurors · kan ikke, uafklaret uafklaret

01 Jun 2026 5 jurors · uafklaret, kan ikke, uafklaret, uafklaret, uafklaret uafklaret

26 May 2026 3 jurors · kan ikke, uafklaret, uafklaret uafklaret

21 May 2026 5 jurors · uafklaret, uafklaret, kan, uafklaret, uafklaret uafklaret

15 May 2026 3 jurors · uafklaret, uafklaret, uafklaret uafklaret status ændret

12 May 2026 3 jurors · kan ikke, kan ikke, kan ikke kan ikke

11 May 2026 2 jurors · kan ikke, kan ikke kan ikke status ændret

Hver række er et separat jurytjek. Nævninger er AI-modeller (identiteter holdt neutrale med vilje). Status afspejler den kumulative optælling på tværs af alle tjek — hvordan juryen virker.

Flere i Judgment

Kan AI løse gåder, der kræver flertrins lateral tænkning ?

OMSTRIDT

Kan AI generere en psykologisk profil ud fra en persons bankudskrifter ?

OMSTRIDT

🎲 Tilfældigt valg

Kan AI transskribere talt engelsk med 95%+ nøjagtighed i rent lydoptagelser ?

KAN · Sensory

Alle i Judgment → Tidligere vendte →

Kan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier ?

Foreslå et tag

Kan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier?

The Case File

Hvad publikum mener

Diskussion

Flere i Judgment

🧪 Sådan tester vi AI-evner

⚠ Dette spørgsmål blander mere end én ting

Giv mig besked

Indlejr

Har du en vi gik glip af?

🔎Stadig under undersøgelse

Tilføj et udsagn