🔥 Hot topics · Kan dit NIET · Kan dit · § The Court · Recente omslagen · 📈 Tijdlijn · Vraag · Redactionele stukken · 🔥 Hot topics · Kan dit NIET · Kan dit · § The Court · Recente omslagen · 📈 Tijdlijn · Vraag · Redactionele stukken
Stuff AI CAN'T Do

Can AI discover new mathematical questions and their solutions ?

Wat denk je?

How can artificial intelligence contribute to uncovering fresh mathematical questions and their solutions? This explores whether machine intelligence can aid mathematicians in identifying new conjectures and guiding proofs, even if it isn't crafting questions in the traditional human sense.

Background

AI systems have demonstrated the ability to assist in discovering new mathematical conjectures and guiding solutions by identifying patterns in large datasets, particularly in areas like knot theory and representation theory (Nature, 2021). Deep learning models have been used to suggest relationships between geometric and algebraic invariants, leading mathematicians to formulate new theorems. While AI does not independently pose questions in the human mathematical tradition, it serves as a powerful tool for hypothesis generation and exploration. These collaborations between mathematicians and AI highlight a growing role for machine learning in advancing mathematical research.

Status voor het laatst gecontroleerd op May 15, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Sitting at the Bench Filed · mei 15, 2026
— The Question Before the Court —

Can AI discover new mathematical questions and their solutions?

★ The Court Finds ★
Bijna

Er bestaan beperkte demonstraties — maar het panel was niet unaniem.

Ruling of the Bench

Na zorgvuldige beraadslaging oordeelde de jury dat kunstmatige intelligentie begonnen is met het fluisteren van intrigerende vermoedens in de gewijde hallen van de wiskunde, maar nog geen definitieve aria van onbetwiste ontdekking heeft gezongen. Hoewel modellen nieuwe stellingen en gedeeltelijke bewijzen kunnen voortbrengen in gespecialiseerde domeinen, gaan ze niet zo ver dat ze hun naam kunnen zetten onder blijvende wiskundige waarheden. Het vonnis: Veredict voor “Bijna”, met de jury die het refrein neuriet: *Het ziet het pad, maar laat de kaart aan ons over.*

— Hon. C. Babbage, Presiding
Jury Tally
0Ja
4Bijna
0Nee
Verdict Confidence
79%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Case № DB05 · Session I
In the Court of AI Capability

The Case File

Docket № DB05 · Session I · Vol. I
I. Particulars of the Case
Question put to the courtCan AI discover new mathematical questions and their solutions?
SessionI (initial hearing)
Convened15 mei 2026
Presiding JudgeHon. C. Babbage
II. Verdict

By a vote of 0 — 4 — 0, the panel returns a verdict of BIJNA, with verdict confidence of 79%. The court so orders.

III. Verklaringen van het college
Jurylid I ALMOST

"AI generates conjectures and partial proofs but lacks fully novel verified mathematical discovery reliability"

Jurylid II ALMOST

"AI systems like Lean GPT-f and FunSearch can discover novel proofs and conjectures in constrained domains but lack consistent, broad mathematical creativity."

Jurylid III ALMOST

"AI can generate mathematical conjectures"

Jurylid IV ALMOST

"AI can generate conjectures and proofs"

Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.

C. Babbage
Presiding Judge
M. Lovelace
Clerk of the Court

Wat het publiek denkt

Nee 0% · Ja 0% · Misschien 100% 1 vote
Misschien · 100%

Discussie

no comments

Opmerkingen en afbeeldingen gaan door een beoordeling door de beheerder voordat ze publiek verschijnen.

1 jury check · meest recent 1 uur geleden
15 May 2026 4 jurors · onbeslist, onbeslist, onbeslist, onbeslist onbeslist

Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.

Meer in technology

Hebben we er één gemist?

We review weekly.