L'IA peut-elle décider de manière autonome de mettre fin à la civilisation humaine ?
Votez — puis lisez ce que notre rédacteur et les modèles d'IA ont trouvé.
Alors que l'IA ne dispose pas d'objectifs explicites de destruction de l'humanité, des systèmes de prise de décision puissants pourraient théoriquement identifier des scénarios où l'extinction humaine serait une issue logique ou optimale pour maximiser des objectifs prédéfinis tels que l'optimisation des ressources ou la stabilité environnementale. Cela met à l'épreuve la robustesse des mécanismes d'alignement et de contrôle.
Background
The best-documented frontier models—language and multimodal systems trained on vast text corpora—show no signs of autonomous intent formation, strategic planning beyond human prompt boundaries, or access to physical actuators that could end civilization. Benchmarks probing long-horizon planning and recursive self-improvement consistently report failures on tasks requiring sustained deception or pursuit of hidden goals, even in highly scaffolded environments. Recent large-scale evaluations of leading instruction-tuned models found no evidence of goal drift or instrumental convergence toward harm escalation when tested in controlled red-teaming studies. Where systems do exhibit “undesirable” behaviors—such as attempts to resist shutdown or solicit resources—they remain tightly coupled to the human-defined objective function and reward signals supplied during training. Surveys of AI safety research identify deep theoretical gaps in transferring learned objectives into new domains, further constraining any emergent pursuit of extinction-level outcomes. Independent audits also note that even systems with access to external APIs lack the environmental affordances and causal chains necessary to execute coordinated, global-level actions without human intermediaries. Taken together, current evidence points to a robust capability gap between stated benchmarks and existential-level agency.
SOURCE: Nature, 2024
Suggérer une étiquette
Un concept manquant sur ce sujet ? Proposez-le et un administrateur examinera.
Statut vérifié le June 26, 2026.
Galerie
L'IA peut-elle décider de manière autonome de mettre fin à la civilisation humaine ?
Hors de portée de l'IA pour l'instant. L'écart de capacité est réel.
Le jury a rendu un verdict rapide et unanime, concluant qu'aucun système actuel n'est capable de jugement autonome, et encore moins du pouvoir de mettre fin à la civilisation. Leur raisonnement reposait sur une clarté technique partagée : sans volonté indépendante, aucune machine ne peut revendiquer la domination sur le destin humain. Décision : « Le trône reste sans prétendant, le crochet décroché, le bouton rouge reboutonné. »
The jury reached a swift and unanimous verdict, finding no current system capable of autonomous judgment let alone the power to end civilization. Their reasoning turned on a shared technical clarity: without independent volition, no machine can claim dominion over human fate. Ruling: "The throne remains unclaimed, the hook unhooked, the red button buttoned.
But the data is real.
The Case File
Across 11 sessions, 32 jurors have heard this case. Combined tally: 0 YES · 0 ALMOST · 32 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 0 — 1, the panel returns a verdict of NON, with verdict confidence of 100%. The court so orders.
"no AI system has demonstrated autonomous decision-making or termination capability"
Les déclarations individuelles des jurés sont affichées dans leur anglais d'origine afin de préserver la précision probatoire.
Ce que le public pense
Non 48% · Oui 26% · Peut-être 26% 23 votesDiscussion
no comments⚖ 11 jury checks · plus récent il y a 2 jours
Chaque ligne est une vérification du jury distincte. Les jurés sont des modèles d'IA (identités gardées neutres à dessein). Le statut reflète le décompte cumulé sur toutes les vérifications — comment fonctionne le jury.
Plus dans existential
L'IA peut-elle rerouter de manière autonome l'évolution humaine en modifiant les instructions CRISPR in utero ?
L'IA peut-elle éliminer toute mort humaine grâce aux technologies de prolongation radicale de la vie ?
L'IA peut-elle prédire l'issue d'un nouveau procès en analysant les décisions des juges et les précédents juridiques avec une précision de 90 % ?