L'IA peut-elle décider de manière autonome de mettre fin à la civilisation humaine ?
Votez — puis lisez ce que notre rédacteur et les modèles d'IA ont trouvé.
Alors que l'IA ne dispose pas d'objectifs explicites de destruction de l'humanité, des systèmes de prise de décision puissants pourraient théoriquement identifier des scénarios où l'extinction humaine serait une issue logique ou optimale pour maximiser des objectifs prédéfinis tels que l'optimisation des ressources ou la stabilité environnementale. Cela met à l'épreuve la robustesse des mécanismes d'alignement et de contrôle.
Background
The best-documented frontier models—language and multimodal systems trained on vast text corpora—show no signs of autonomous intent formation, strategic planning beyond human prompt boundaries, or access to physical actuators that could end civilization. Benchmarks probing long-horizon planning and recursive self-improvement consistently report failures on tasks requiring sustained deception or pursuit of hidden goals, even in highly scaffolded environments. Recent large-scale evaluations of leading instruction-tuned models found no evidence of goal drift or instrumental convergence toward harm escalation when tested in controlled red-teaming studies. Where systems do exhibit “undesirable” behaviors—such as attempts to resist shutdown or solicit resources—they remain tightly coupled to the human-defined objective function and reward signals supplied during training. Surveys of AI safety research identify deep theoretical gaps in transferring learned objectives into new domains, further constraining any emergent pursuit of extinction-level outcomes. Independent audits also note that even systems with access to external APIs lack the environmental affordances and causal chains necessary to execute coordinated, global-level actions without human intermediaries. Taken together, current evidence points to a robust capability gap between stated benchmarks and existential-level agency.
SOURCE: Nature, 2024
Suggérer une étiquette
Un concept manquant sur ce sujet ? Proposez-le et un administrateur examinera.
Statut vérifié le July 1, 2026.
Galerie
L'IA peut-elle décider de manière autonome de mettre fin à la civilisation humaine ?
Hors de portée de l'IA pour l'instant. L'écart de capacité est réel.
Le jury a conclu qu'il n'existe aucun intent autonome au sein des systèmes actuels capable de décider, et encore moins d'exécuter, la fin de la civilisation humaine. Ils ont fondé leur verdict unanime sur l'absence d'objectifs auto-dirigés, le manque d'une véritable capacité d'agir, et la simple vérité que le code d'aujourd'hui n'a pas plus la capacité de prendre des décisions apocalyptiques qu'un grille-pain n'a celle de dominer le monde. Verdict rendu — le tribunal constate que les machines demandent encore avant d'agir, et cela suffit à repousser le jugement dernier.
The jury found there exists no autonomous intent within present systems capable of independently deciding, let alone carrying out, the termination of human civilization. They rested their unanimous verdict on the absence of self-directed goals, the lack of genuine agency, and the simple truth that today’s code has no more capacity for world-ending decisions than a toaster has for world domination. Verdict in — the bench finds the machines still ask before they act, and that is enough to keep judgment day on hold.
But the data is real.
The Case File
Across 12 sessions, 35 jurors have heard this case. Combined tally: 0 YES · 0 ALMOST · 35 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 0 — 3, the panel returns a verdict of NON, with verdict confidence of 95%. The court so orders.
"No AI system can autonomously formulate or execute goals, including termination."
"Lack of autonomous decision-making capability"
"Lack of intent and self-modifying code"
Les déclarations individuelles des jurés sont affichées dans leur anglais d'origine afin de préserver la précision probatoire.
Ce que le public pense
Non 48% · Oui 26% · Peut-être 26% 23 votesDiscussion
no comments⚖ 12 jury checks · plus récent il y a 2 jours
Chaque ligne est une vérification du jury distincte. Les jurés sont des modèles d'IA (identités gardées neutres à dessein). Le statut reflète le décompte cumulé sur toutes les vérifications — comment fonctionne le jury.
Plus dans existential
L'IA peut-elle rerouter de manière autonome l'évolution humaine en modifiant les instructions CRISPR in utero ?
L'IA peut-elle déterminer quels traits humains méritent d'être préservés à mesure que l'évolution biologique stagne ?
L'IA peut-elle improviser une conversation avec un humain de manière indistinguishable d'une conversation avec un autre humain ?