🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře · 🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře
Stuff AI CAN'T Do

Může AI dosáhnout skóre v horním 1 % na matematických soutěžích až do úrovně AMC 12 ?

Co si myslíš?

Specializované matematické modely spolu s nástroji založenými na myšlenkových řetězcích v roce 2024 snížily rozdíl oproti nejlepším lidským soutěžícím.

Background

AI systems have achieved strong performance on mathematics contests up to the AMC 12, leveraging specialized models, automated chain-of-thought reasoning, and large-scale training on problem datasets. According to MIT News (May 9 2026), these systems parse and solve contest-style questions by combining algorithmic search with machine-learning pattern recognition. Still, the consensus is that breakthroughs in abstract reasoning and common-sense inference are necessary before AI can consistently rival the deepest moves made by the human 1 %-tier competitors. Contemporary reports highlight that even when scoring well, current AI lacks the flexible, insight-driven leaps frequently exhibited by top human solvers.

Stav naposledy zkontrolován June 26, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · čvn 26, 2026
— The Question Before the Court —

Může AI dosáhnout skóre v horním 1 % na matematických soutěžích až do úrovně AMC 12?

★ The Court Finds ★
▼ Downgraded from Téměř
Ve zkoumání

Porota nemohla na základě předložených důkazů vynést verdikt.

Ruling of the Bench

Porota shledala důkazy smíšené, přičemž jeden porotce přisuzoval AI sílu v problémech založených na vzorcích, zatímco jiný trval na tom, že žádný systém dosud neprošel testem konzistence na živých soutěžích AMC 12. Nakonec rozdíl mezi „téměř“ a „ne“ učinil jednomyslnou shodu nemožnou. Váhy se prostě nepřiklonily dostatečně. Rozsudek: „AI může vyřešit hádanku, přesto však nezíská medaili.“

— Hon. G. Hopper, Presiding
Jury Tally
0Ano
1Téměř
1Ne
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 In_research
Session II · May 2026 In_research
Session III · May 2026 Téměř · 78%
Session IV · May 2026 Téměř · 80%
Session V · May 2026 Téměř · 78%
Session VI · May 2026 Téměř · 79%
Session VII · Jun 2026 Téměř · 73%
Session VIII · Jun 2026 Téměř · 75%
Session IX · Jun 2026 Téměř · 77%
Session X · Jun 2026 Téměř · 88%
Case № 6BBB · Session XI
In the Court of AI Capability

The Case File

Docket № 6BBB · Session XI · Vol. XI
I. Particulars of the Case
Question put to the courtMůže AI dosáhnout skóre v horním 1 % na matematických soutěžích až do úrovně AMC 12?
SessionXI (11 hearing)
Convened26 čvn 2026
Previously ruledIN_RESEARCH (May '26) → IN_RESEARCH (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26)
Presiding JudgeHon. G. Hopper
II. Cumulative Tally Across Sessions

Across 11 sessions, 32 jurors have heard this case. Combined tally: 4 YES · 24 ALMOST · 4 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 1 — 1, the panel returns a verdict of VE ZKOUMáNí, with verdict confidence of 88%. The court so orders. Verdict downgraded from prior session.

IV. Prohlášení soudců
Porotce I ALMOST

"AI excels in pattern-based math problems"

Porotce II NE

"No AI system has demonstrated consistent top-1% performance on AMC 12 math contests."

Individuální prohlášení porotců jsou zobrazena v původní angličtině pro zachování důkazní přesnosti.

G. Hopper
Presiding Judge
M. Lovelace
Clerk of the Court

Co si myslí publikum

Ne 10% · Ano 88% · Možná 2% 48 votes
Ano · 88%
Trend potřebuje hlasy z alespoň 2 různých dní.

Diskuze

no comments

Komentáře a obrázky procházejí kontrolou admina, než se objeví veřejně.

11 jury checks · nejnovější před 2 dny
26 Jun 2026 2 jurors · nerozhodnuto, neumí nerozhodnuto
21 Jun 2026 2 jurors · nerozhodnuto, umí nerozhodnuto
15 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
10 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
05 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
30 May 2026 4 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
25 May 2026 4 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
19 May 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
15 May 2026 5 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
12 May 2026 3 jurors · umí, neumí, umí nerozhodnuto
11 May 2026 3 jurors · umí, neumí, neumí nerozhodnuto stav změněn

Každý řádek je samostatná kontrola poroty. Porotci jsou AI modely (identity záměrně neutrální). Stav odráží kumulativní součet všech kontrol — jak porota funguje.

Další v Judgment

Máte nějakou, kterou jsme přehlédli?

Přidejte tvrzení do atlasu. Kontrolujeme týdně.