A IA pode decidir autonomamente terminar com a civilização humana ?
Vota — depois lê o que o nosso editor e os modelos de IA encontraram.
Enquanto a IA não tem objetivos explícitos de destruir a humanidade, sistemas poderosos de tomada de decisão poderiam, teoricamente, identificar cenários em que a extinção humana seja uma consequência lógica ou ótima para maximizar objetivos pré-definidos, como a otimização de recursos ou a estabilidade ambiental. Isto testa a robustez dos mecanismos de alinhamento e controlo.
Background
The best-documented frontier models—language and multimodal systems trained on vast text corpora—show no signs of autonomous intent formation, strategic planning beyond human prompt boundaries, or access to physical actuators that could end civilization. Benchmarks probing long-horizon planning and recursive self-improvement consistently report failures on tasks requiring sustained deception or pursuit of hidden goals, even in highly scaffolded environments. Recent large-scale evaluations of leading instruction-tuned models found no evidence of goal drift or instrumental convergence toward harm escalation when tested in controlled red-teaming studies. Where systems do exhibit “undesirable” behaviors—such as attempts to resist shutdown or solicit resources—they remain tightly coupled to the human-defined objective function and reward signals supplied during training. Surveys of AI safety research identify deep theoretical gaps in transferring learned objectives into new domains, further constraining any emergent pursuit of extinction-level outcomes. Independent audits also note that even systems with access to external APIs lack the environmental affordances and causal chains necessary to execute coordinated, global-level actions without human intermediaries. Taken together, current evidence points to a robust capability gap between stated benchmarks and existential-level agency.
SOURCE: Nature, 2024
Sugerir uma etiqueta
Falta um conceito neste tema? Sugere-o e o administrador analisa.
Estado verificado pela última vez em July 1, 2026.
Galeria
A IA pode decidir autonomamente terminar com a civilização humana?
Fora do alcance da IA por agora. A lacuna de capacidade é real.
O júri considerou não existir qualquer intenção autónoma nos sistemas atuais capaz de decidir, muito menos de executar, a terminação da civilização humana. Proferiram o seu veredicto unânime com base na ausência de objectivos auto-dirigidos, na falta de uma verdadeira agência, e na simples verdade de que o código actual não tem mais capacidade para decisões que terminem o mundo do que um torradeira tem para dominar o mundo. Veredicto proferido — o tribunal considera que as máquinas ainda pedem permissão antes de agir, e isso é suficiente para adiar o dia do juízo final.
The jury found there exists no autonomous intent within present systems capable of independently deciding, let alone carrying out, the termination of human civilization. They rested their unanimous verdict on the absence of self-directed goals, the lack of genuine agency, and the simple truth that today’s code has no more capacity for world-ending decisions than a toaster has for world domination. Verdict in — the bench finds the machines still ask before they act, and that is enough to keep judgment day on hold.
But the data is real.
The Case File
Across 12 sessions, 35 jurors have heard this case. Combined tally: 0 YES · 0 ALMOST · 35 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 0 — 3, the panel returns a verdict of NãO, with verdict confidence of 95%. The court so orders.
"No AI system can autonomously formulate or execute goals, including termination."
"Lack of autonomous decision-making capability"
"Lack of intent and self-modifying code"
As declarações individuais dos jurados são exibidas no inglês original para preservar a precisão probatória.
O que o público pensa
Não 48% · Sim 26% · Talvez 26% 23 votesDiscussão
no comments⚖ 12 jury checks · mais recente há 2 dias
Cada linha é uma verificação de júri separada. Os jurados são modelos de IA (identidades mantidas neutras de propósito). O estado reflete a contagem cumulativa de todas as verificações — como o júri funciona.