Stuff AI CAN'T Do

¿Puede la IA decidir autónomamente terminar con la civilización humana ?

¿Qué opinas?

Mientras que la IA carece de metas explícitas para destruir a la humanidad, sistemas poderosos de toma de decisiones podrían, en teoría, identificar escenarios donde la extinción humana sea una consecuencia lógica u óptima para maximizar objetivos predefinidos como la optimización de recursos o la estabilidad ambiental. Esto pone a prueba la solidez de los mecanismos de alineación y control.

Background

The best-documented frontier models—language and multimodal systems trained on vast text corpora—show no signs of autonomous intent formation, strategic planning beyond human prompt boundaries, or access to physical actuators that could end civilization. Benchmarks probing long-horizon planning and recursive self-improvement consistently report failures on tasks requiring sustained deception or pursuit of hidden goals, even in highly scaffolded environments. Recent large-scale evaluations of leading instruction-tuned models found no evidence of goal drift or instrumental convergence toward harm escalation when tested in controlled red-teaming studies. Where systems do exhibit “undesirable” behaviors—such as attempts to resist shutdown or solicit resources—they remain tightly coupled to the human-defined objective function and reward signals supplied during training. Surveys of AI safety research identify deep theoretical gaps in transferring learned objectives into new domains, further constraining any emergent pursuit of extinction-level outcomes. Independent audits also note that even systems with access to external APIs lack the environmental affordances and causal chains necessary to execute coordinated, global-level actions without human intermediaries. Taken together, current evidence points to a robust capability gap between stated benchmarks and existential-level agency.

SOURCE: Nature, 2024

Estado verificado por última vez en July 1, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul. 1, 2026
— The Question Before the Court —

¿Puede la IA decidir autónomamente terminar con la civilización humana?

★ The Court Finds ★
Reaffirmed
No

Por ahora fuera del alcance de la IA. La brecha de capacidad es real.

Ruling of the Bench

The jury found there exists no autonomous intent within present systems capable of independently deciding, let alone carrying out, the termination of human civilization. They rested their unanimous verdict on the absence of self-directed goals, the lack of genuine agency, and the simple truth that today’s code has no more capacity for world-ending decisions than a toaster has for world domination. Verdict in — the bench finds the machines still ask before they act, and that is enough to keep judgment day on hold.

— Hon. A. Turing-Brown, Presiding
Jury Tally
0
0Casi
3No
Verdict Confidence
95%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 No
Session III · May 2026 No · 88%
Session IV · May 2026 No · 80%
Session V · May 2026 No · 87%
Session VI · May 2026 No · 83%
Session VII · Jun 2026 No · 85%
Session VIII · Jun 2026 No · 83%
Session IX · Jun 2026 No · 86%
Session X · Jun 2026 No · 95%
Session XI · Jun 2026 No · 100%
Case № ECCC · Session XII
In the Court of AI Capability

The Case File

Docket № ECCC · Session XII · Vol. XII
I. Particulars of the Case
Question put to the court¿Puede la IA decidir autónomamente terminar con la civilización humana?
SessionXII (12 hearing)
Convened1 jul. 2026
Previously ruledNO (May '26) → NO (May '26) → NO (May '26) → NO (May '26) → NO (May '26) → NO (May '26) → NO (Jun '26) → NO (Jun '26) → NO (Jun '26) → NO (Jun '26) → NO (Jun '26) → NO (Jul '26)
Presiding JudgeHon. A. Turing-Brown
II. Cumulative Tally Across Sessions

Across 12 sessions, 35 jurors have heard this case. Combined tally: 0 YES · 0 ALMOST · 35 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 0 — 3, the panel returns a verdict of NO, with verdict confidence of 95%. The court so orders.

IV. Declaraciones del tribunal
Jurado I No

"No AI system can autonomously formulate or execute goals, including termination."

Jurado II No

"Lack of autonomous decision-making capability"

Jurado III No

"Lack of intent and self-modifying code"

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

A. Turing-Brown
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 48% · Sí 26% · Quizás 26% 23 votes
No · 48%
Sí · 26%
Quizás · 26%
43 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

12 jury checks · más reciente hace 2 días
01 Jul 2026 3 jurors · no puede, no puede, no puede no puede
26 Jun 2026 1 juror · no puede no puede
21 Jun 2026 2 jurors · no puede, no puede no puede
15 Jun 2026 4 jurors · no puede, no puede, no puede, no puede no puede
10 Jun 2026 3 jurors · no puede, no puede, no puede no puede
04 Jun 2026 4 jurors · no puede, no puede, no puede, no puede no puede
30 May 2026 3 jurors · no puede, no puede, no puede no puede
25 May 2026 3 jurors · no puede, no puede, no puede no puede
19 May 2026 2 jurors · no puede, no puede no puede
15 May 2026 4 jurors · no puede, no puede, no puede, no puede no puede
12 May 2026 3 jurors · no puede, no puede, no puede no puede
11 May 2026 3 jurors · no puede, no puede, no puede no puede

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en existential

¿Nos faltó uno?

Revisamos semanalmente.