🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne · 🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne
Stuff AI CAN'T Do

Czy AI może osiągnąć wynik w pierwszej 1% w konkursach matematycznych na poziomie AMC 12 ?

Co o tym myślisz?

Specjalistyczne modele matematyczne wraz z narzędziami typu chain-of-thought w 2024 roku zmniejszyły dystans do najlepszych ludzkich uczestników konkursów.

Background

AI systems have achieved strong performance on mathematics contests up to the AMC 12, leveraging specialized models, automated chain-of-thought reasoning, and large-scale training on problem datasets. According to MIT News (May 9 2026), these systems parse and solve contest-style questions by combining algorithmic search with machine-learning pattern recognition. Still, the consensus is that breakthroughs in abstract reasoning and common-sense inference are necessary before AI can consistently rival the deepest moves made by the human 1 %-tier competitors. Contemporary reports highlight that even when scoring well, current AI lacks the flexible, insight-driven leaps frequently exhibited by top human solvers.

Status sprawdzony ostatnio June 26, 2026.

📰

Galeria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · cze 26, 2026
— The Question Before the Court —

Czy AI może osiągnąć wynik w pierwszej 1% w konkursach matematycznych na poziomie AMC 12?

★ The Court Finds ★
▼ Downgraded from Prawie
W badaniu

Jury nie mogło wydać werdyktu na podstawie przedstawionych dowodów.

Ruling of the Bench

Ława przysięgłych uznała dowody za mieszane, przy czym jeden z ławników docenił siłę AI w rozwiązywaniu problemów opartych na wzorcach, ale inny nalegał, że żaden system nie spełnił jeszcze wymogu spójności w trakcie live’owych konkursów AMC 12. Ostatecznie podział między „prawie” a „nie” uniemożliwił jednomyślne porozumienie. Szala po prostu nie przechyliła się wystarczająco. Orzeczenie: „AI potrafi rozwiązać zagadkę, lecz wciąż nie zdobywa medalu.”

— Hon. G. Hopper, Presiding
Jury Tally
0Tak
1Prawie
1Nie
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 In_research
Session II · May 2026 In_research
Session III · May 2026 Prawie · 78%
Session IV · May 2026 Prawie · 80%
Session V · May 2026 Prawie · 78%
Session VI · May 2026 Prawie · 79%
Session VII · Jun 2026 Prawie · 73%
Session VIII · Jun 2026 Prawie · 75%
Session IX · Jun 2026 Prawie · 77%
Session X · Jun 2026 Prawie · 88%
Case № 6BBB · Session XI
In the Court of AI Capability

The Case File

Docket № 6BBB · Session XI · Vol. XI
I. Particulars of the Case
Question put to the courtCzy AI może osiągnąć wynik w pierwszej 1% w konkursach matematycznych na poziomie AMC 12?
SessionXI (11 hearing)
Convened26 cze 2026
Previously ruledIN_RESEARCH (May '26) → IN_RESEARCH (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26)
Presiding JudgeHon. G. Hopper
II. Cumulative Tally Across Sessions

Across 11 sessions, 32 jurors have heard this case. Combined tally: 4 YES · 24 ALMOST · 4 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 1 — 1, the panel returns a verdict of W BADANIU, with verdict confidence of 88%. The court so orders. Verdict downgraded from prior session.

IV. Oświadczenia składu sędziowskiego
Przysięgły I ALMOST

"AI excels in pattern-based math problems"

Przysięgły II NIE

"No AI system has demonstrated consistent top-1% performance on AMC 12 math contests."

Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.

G. Hopper
Presiding Judge
M. Lovelace
Clerk of the Court

Co myśli publiczność

Nie 10% · Tak 88% · Może 2% 48 votes
Tak · 88%
Trend wymaga głosów z co najmniej 2 różnych dni.

Dyskusja

no comments

Komentarze i obrazy przechodzą przez weryfikację admina zanim pojawią się publicznie.

11 jury checks · najnowsze 2 dni temu
26 Jun 2026 2 jurors · nierozstrzygnięte, nie potrafi nierozstrzygnięte
21 Jun 2026 2 jurors · nierozstrzygnięte, potrafi nierozstrzygnięte
15 Jun 2026 2 jurors · nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
10 Jun 2026 2 jurors · nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
05 Jun 2026 2 jurors · nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
30 May 2026 4 jurors · nierozstrzygnięte, nierozstrzygnięte, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
25 May 2026 4 jurors · nierozstrzygnięte, nierozstrzygnięte, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
19 May 2026 3 jurors · nierozstrzygnięte, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
15 May 2026 5 jurors · nierozstrzygnięte, nierozstrzygnięte, nierozstrzygnięte, nierozstrzygnięte, nierozstrzygnięte nierozstrzygnięte
12 May 2026 3 jurors · potrafi, nie potrafi, potrafi nierozstrzygnięte
11 May 2026 3 jurors · potrafi, nie potrafi, nie potrafi nierozstrzygnięte status zmieniony

Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.

Więcej w Judgment

Masz coś, co nam umknęło?

Dodaj stwierdzenie do atlasu. Sprawdzamy co tydzień.