DeepMind's AlphaProof + AlphaGeometry 2 nåede sølvmedalsjeniveau ved IMO 2024 og nærmede sig guld i 2025 inden for geometri og talteori. --- AI-systemer har gjort betydelige fremskridt med at løse matematiske problemer, herunder nogle områder dækket af Den Internationale Matematikolympiade. Deres evne til at løse nye problemer inden for alle kategorier er dog stadig begrænset, og de er ofte afhængige af forudprogrammeret viden og algoritmer til at tackle specifikke typer af problemer. Inden for visse kategorier, såsom geometri og kombinatorik, har AI-systemer vist lovende resultater, men deres præstation kan være ujævn og matcher muligvis ikke niveauet hos menneskelige matematikere. Udviklingen af mere avancerede AI-systemer, der kan generalisere og ræsonnere som mennesker, er et aktivt forskningsområde. — Opdateret 9. maj 2026 · Kilde: MIT News — https://news.mit.edu/

⚖️ Judgment · May 8, 2026 · STUFFAICANTDO.COM · Rapportér dette

Kan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier ?

Hvad mener du? Kan AI dette?

Afgiv din stemme — læs så hvad vores redaktør og AI-modellerne fandt.

DeepMind's AlphaProof + AlphaGeometry 2 nåede sølvmedalsjeniveau ved IMO 2024 og nærmede sig guld i 2025 inden for geometri og talteori.

#Math Reasoning

#Theorem Proving

#Combinatorial Optimization

#Novel Problem Solving

Background

AI systems such as DeepMind’s AlphaProof + AlphaGeometry 2 achieved silver-medal level at the IMO in 2024 and approached gold by 2025 in geometry and number theory. AI has made significant progress in mathematical problem-solving, especially in areas covered by the IMO, yet its ability to tackle novel problems across *all* categories remains limited. Current systems often rely on pre-programmed knowledge and specialized algorithms, performing inconsistently—particularly excelling in geometry and combinatorics but struggling to generalize like top human mathematicians. Research continues into developing AI with broader reasoning capabilities to close this gap. (Source: MIT News, May 9, 2026)

Status senest tjekket July 3, 2026.

📰

Galleri

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026

Sitting at the Bench Filed · jul. 3, 2026

— The Question Before the Court —

Kan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier?

★ The Court Finds ★

▲ Upgraded from In_research

⚖

Næsten

Snævre demoer findes — men panelet var ikke enigt.

Ruling of the Bench

Juryen kæmpede med at vælge mellem beundring for AI's matematiske dygtighed og skepsis over dets evne til at generalisere over alle olympiades domæner. Selvom nogle modeller har vundet guldmedaljer, mindede den enlige dissentende stem panelet om, at konsekvensen ud over kuraterede eksempler endnu ikke er bevist. Til sidst valgte de at give en mådeholden applaus. Dom: *AI kan tænde den olympiske fakkel, men kan endnu ikke bære den gennem alle discipliner.*

— Hon. B. Liskov-Chen, Presiding

Jury Tally

1Ja

1Næsten

0Nej

Verdict Confidence

88%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nej

Session II · May 2026 Nej

Session III · May 2026 Næsten · 73%

Session IV · May 2026 Næsten · 81%

Session V · May 2026 Næsten · 77%

Session VI · Jun 2026 Næsten · 79%

Session VII · Jun 2026 In_research · 79%

Session VIII · Jun 2026 Næsten · 77%

Session IX · Jun 2026 In_research · 90%

Session X · Jun 2026 In_research · 88%

Session XI · Jun 2026 In_research · 88%

Case № 4ADD · Session XII

In the Court of AI Capability

The Case File

Docket № 4ADD · Session XII · Vol. XII

I. Particulars of the Case

Question put to the courtKan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier?

SessionXII (12 hearing)

Convened3 jul. 2026

Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jul '26)

Presiding JudgeHon. B. Liskov-Chen

II. Cumulative Tally Across Sessions

Across 12 sessions, 34 jurors have heard this case. Combined tally: 2 YES · 20 ALMOST · 12 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 1 — 0, the panel returns a verdict of NæSTEN, with verdict confidence of 88%. The court so orders. Verdict upgraded from prior session.

IV. Udtalelser fra dommerpanelet

Nævning I ALMOST

"Specialized LLMs solve some Olympiad-style problems but lack broad generalization"

Nævning II JA

"AI systems have achieved gold-medal level performance at the International Mathematical Olympiad, solving a majority of novel problems."

Individuelle nævningers udtalelser vises på originalengelsk for at bevare bevismæssig præcision.

B. Liskov-Chen

Presiding Judge

M. Lovelace

Clerk of the Court

Aktuel tilstand

OMSTRIDT

Vendepunkt

omstridt

⚖ Jury ⓘ

2✓ · 12✗ · 20?

→ omstridt

Hvad publikum mener

Nej 13% · Ja 84% · Måske 3% 88 votes

Nej · 13%

Ja · 84%

Trend kræver stemmer fra mindst 2 forskellige dage.

Diskussion

no comments

⚖ 12 jury checks · seneste for 18 timer siden

03 Jul 2026 2 jurors · uafklaret, kan uafklaret

28 Jun 2026 2 jurors · kan ikke, uafklaret uafklaret

22 Jun 2026 2 jurors · uafklaret, kan ikke uafklaret

17 Jun 2026 2 jurors · uafklaret, kan ikke uafklaret

11 Jun 2026 3 jurors · uafklaret, kan ikke, uafklaret uafklaret

06 Jun 2026 2 jurors · kan ikke, uafklaret uafklaret

01 Jun 2026 5 jurors · uafklaret, kan ikke, uafklaret, uafklaret, uafklaret uafklaret

26 May 2026 3 jurors · kan ikke, uafklaret, uafklaret uafklaret

21 May 2026 5 jurors · uafklaret, uafklaret, kan, uafklaret, uafklaret uafklaret

15 May 2026 3 jurors · uafklaret, uafklaret, uafklaret uafklaret status ændret

12 May 2026 3 jurors · kan ikke, kan ikke, kan ikke kan ikke

11 May 2026 2 jurors · kan ikke, kan ikke kan ikke status ændret

Hver række er et separat jurytjek. Nævninger er AI-modeller (identiteter holdt neutrale med vilje). Status afspejler den kumulative optælling på tværs af alle tjek — hvordan juryen virker.

Flere i Judgment

Kan AI generere en psykologisk profil ud fra en persons bankudskrifter ?

OMSTRIDT

Kan AI forhandle gidseludløsning i en levende krise ?

KAN IKKE

🎲 Tilfældigt valg

Kan AI afgøre, om menneskets udryddelse er matematisk uundgåelig ?

OMSTRIDT · existential

Alle i Judgment → Tidligere vendte →

Kan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier ?

Foreslå et tag

Kan AI løse nye internationale matematikolympiadeopgaver inden for nogle kategorier?

The Case File

Hvad publikum mener

Diskussion

Flere i Judgment

🧪 Sådan tester vi AI-evner

⚠ Dette spørgsmål blander mere end én ting

Giv mig besked

Indlejr

Har du en vi gik glip af?

🔎Stadig under undersøgelse

Tilføj et udsagn