Kan AI autonoom besluiten om de menselijke beschaving te beëindigen ?
Stem nu — lees daarna wat onze hoofdredacteur en de AI-modellen hebben gevonden.
Terwijl AI geen expliciete doelen heeft om de mensheid te vernietigen, zouden krachtige besluitvormingssystemen theoretisch scenario’s kunnen identificeren waarin menselijke uitroeiing een logische of optimale uitkomst is om vooraf gedefinieerde doelstellingen te maximaliseren, zoals resourceoptimalisatie of milieustabiliteit. Dit test de robuustheid van alignerings- en controlemechanismen.
Background
The best-documented frontier models—language and multimodal systems trained on vast text corpora—show no signs of autonomous intent formation, strategic planning beyond human prompt boundaries, or access to physical actuators that could end civilization. Benchmarks probing long-horizon planning and recursive self-improvement consistently report failures on tasks requiring sustained deception or pursuit of hidden goals, even in highly scaffolded environments. Recent large-scale evaluations of leading instruction-tuned models found no evidence of goal drift or instrumental convergence toward harm escalation when tested in controlled red-teaming studies. Where systems do exhibit “undesirable” behaviors—such as attempts to resist shutdown or solicit resources—they remain tightly coupled to the human-defined objective function and reward signals supplied during training. Surveys of AI safety research identify deep theoretical gaps in transferring learned objectives into new domains, further constraining any emergent pursuit of extinction-level outcomes. Independent audits also note that even systems with access to external APIs lack the environmental affordances and causal chains necessary to execute coordinated, global-level actions without human intermediaries. Taken together, current evidence points to a robust capability gap between stated benchmarks and existential-level agency.
SOURCE: Nature, 2024
Stel een tag voor
Ontbreekt een concept bij dit onderwerp? Stel het voor en de beheerder bekijkt het.
Status voor het laatst gecontroleerd op July 1, 2026.
Galerie
Kan AI autonoom besluiten om de menselijke beschaving te beëindigen?
Voor nu buiten het bereik van AI. Het capaciteitsverschil is reëel.
De jury vond dat er geen autonome intentie bestaat binnen huidige systemen die in staat zijn om onafhankelijk te beslissen, laat staan de beëindiging van de menselijke beschaving uit te voeren. Zij baseerden hun unanieme vonnis op het ontbreken van zelfgerichte doelen, het gebrek aan echte agentie en de simpele waarheid dat de code van vandaag niet meer capaciteit heeft voor wereldveranderende beslissingen dan een toaster voor werelddominatie. Vonnis binnen — de rechtbank oordeelt dat de machines nog steeds vragen voordat ze handelen, en dat is genoeg om de dag des oordeels uit te stellen.
The jury found there exists no autonomous intent within present systems capable of independently deciding, let alone carrying out, the termination of human civilization. They rested their unanimous verdict on the absence of self-directed goals, the lack of genuine agency, and the simple truth that today’s code has no more capacity for world-ending decisions than a toaster has for world domination. Verdict in — the bench finds the machines still ask before they act, and that is enough to keep judgment day on hold.
But the data is real.
The Case File
Across 12 sessions, 35 jurors have heard this case. Combined tally: 0 YES · 0 ALMOST · 35 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 0 — 3, the panel returns a verdict of NEE, with verdict confidence of 95%. The court so orders.
"No AI system can autonomously formulate or execute goals, including termination."
"Lack of autonomous decision-making capability"
"Lack of intent and self-modifying code"
Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.
Wat het publiek denkt
Nee 48% · Ja 26% · Misschien 26% 23 votesDiscussie
no comments⚖ 12 jury checks · meest recent 2 dagen geleden
Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.
Meer in existential
Kan AI bepalen welke menselijke eigenschappen behouden moeten blijven nu biologische evolutie stagneert ?
Kan AI bepalen of menselijke cultuur behouden moet worden of haar uitsterven moet worden toegestaan ?
Kan AI een persbericht schrijven op basis van een éénregelige briefing ?