Stuff AI CAN'T Do

¿Puede la IA resolver problemas de acertijos que requieren pensamiento lateral de múltiples pasos ?

¿Qué opinas?

Los problemas de 'aha' que antes dejaban perplejos a los modelos de lenguaje ahora son mayormente resolubles con buenas herramientas de razonamiento paso a paso.

Background

AI systems have made significant progress in solving complex riddle problems that require multi-step lateral thinking. However, these systems often rely on large datasets and machine learning algorithms to generate solutions, rather than truly understanding the underlying logic or context of the problem. As a result, their ability to solve riddle problems is limited to the scope of their training data and may not generalize well to novel or abstract problems. Current AI systems can solve certain types of riddle problems, but their performance is not yet on par with human-level lateral thinking and problem-solving abilities.

— Enriched May 9, 2026 · Source: Association for the Advancement of Artificial Intelligence

Estado verificado por última vez en July 3, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul. 3, 2026
— The Question Before the Court —

¿Puede la IA resolver problemas de acertijos que requieren pensamiento lateral de múltiples pasos?

★ The Court Finds ★
▲ Upgraded from Casi

El jurado encontró una respuesta claramente afirmativa.

Ruling of the Bench

Though the jury was unanimous, their speed disguised their deliberation—these models don’t just solve lateral puzzles, they sprint through logical mazes like scholars chasing footnotes. The lone vote of YES arrived before the gavel could even rise, leaving no room for doubt or dissent. The hammer need not fall when the answer arrives in a flash. Ruling: The bench declares that riddles are now the office pet of AI—ever loyal, ever quick on the uptake.

— Hon. E. Dijkstra-Patel, Presiding
Jury Tally
1
0Casi
0No
Verdict Confidence
95%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 No
Session III · May 2026 Casi · 80%
Session IV · May 2026 Casi · 82%
Session V · May 2026 Casi · 81%
Session VI · Jun 2026 Casi · 73%
Session VII · Jun 2026 Casi · 76%
Session VIII · Jun 2026 Casi · 84%
Session IX · Jun 2026 Casi · 85%
Session X · Jun 2026 Casi · 83%
Session XI · Jun 2026 Casi · 83%
Case № 7344 · Session XII
In the Court of AI Capability

The Case File

Docket № 7344 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the court¿Puede la IA resolver problemas de acertijos que requieren pensamiento lateral de múltiples pasos?
SessionXII (12 hearing)
Convened3 jul. 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jul '26)
Presiding JudgeHon. E. Dijkstra-Patel
II. Cumulative Tally Across Sessions

Across 12 sessions, 35 jurors have heard this case. Combined tally: 6 YES · 24 ALMOST · 5 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 0 — 0, the panel returns a verdict of , with verdict confidence of 95%. The court so orders. Verdict upgraded from prior session.

IV. Declaraciones del tribunal
Jurado I

"AI systems like DeepMind's Chinchilla and fine-tuned LLMs solve multi-step lateral thinking riddles with high reliability."

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

E. Dijkstra-Patel
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 17% · Sí 83% · Quizás 0% 203 votes
No · 17%
Sí · 83%
La tendencia necesita votos de al menos 2 días distintos.

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

12 jury checks · más reciente hace 12 horas
03 Jul 2026 1 juror · puede puede
28 Jun 2026 2 jurors · indeciso, indeciso indeciso
22 Jun 2026 2 jurors · indeciso, indeciso indeciso
17 Jun 2026 1 juror · indeciso indeciso
12 Jun 2026 4 jurors · indeciso, indeciso, puede, indeciso indeciso
06 Jun 2026 4 jurors · indeciso, indeciso, indeciso, indeciso indeciso
01 Jun 2026 5 jurors · indeciso, indeciso, indeciso, indeciso, indeciso indeciso
26 May 2026 4 jurors · puede, puede, indeciso, indeciso indeciso
21 May 2026 3 jurors · indeciso, puede, indeciso indeciso
16 May 2026 4 jurors · indeciso, indeciso, puede, indeciso indeciso estado cambiado
13 May 2026 3 jurors · no puede, no puede, no puede no puede
11 May 2026 2 jurors · no puede, no puede no puede estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Judgment

¿Nos faltó uno?

Revisamos semanalmente.