Může umělá inteligence autonomně rozhodnout o zániku lidské civilizace ?
Hlasujte — pak si přečtěte, co zjistil náš editor a AI modely.
Zatímco umělá inteligence nemá explicitní cíle zničit lidstvo, výkonné systémy pro rozhodování by teoreticky mohly identifikovat scénáře, ve kterých je lidské vyhynutí logickým či optimálním řešením pro maximalizaci předem stanovených cílů, jako je optimalizace zdrojů či environmentální stabilita. To testuje robustnost mechanismů zarovnání a kontroly.
Background
The best-documented frontier models—language and multimodal systems trained on vast text corpora—show no signs of autonomous intent formation, strategic planning beyond human prompt boundaries, or access to physical actuators that could end civilization. Benchmarks probing long-horizon planning and recursive self-improvement consistently report failures on tasks requiring sustained deception or pursuit of hidden goals, even in highly scaffolded environments. Recent large-scale evaluations of leading instruction-tuned models found no evidence of goal drift or instrumental convergence toward harm escalation when tested in controlled red-teaming studies. Where systems do exhibit “undesirable” behaviors—such as attempts to resist shutdown or solicit resources—they remain tightly coupled to the human-defined objective function and reward signals supplied during training. Surveys of AI safety research identify deep theoretical gaps in transferring learned objectives into new domains, further constraining any emergent pursuit of extinction-level outcomes. Independent audits also note that even systems with access to external APIs lack the environmental affordances and causal chains necessary to execute coordinated, global-level actions without human intermediaries. Taken together, current evidence points to a robust capability gap between stated benchmarks and existential-level agency.
SOURCE: Nature, 2024
Navrhnout štítek
Chybí pojem k tomuto tématu? Navrhněte ho a admin to posoudí.
Stav naposledy zkontrolován July 1, 2026.
Galerie
Může umělá inteligence autonomně rozhodnout o zániku lidské civilizace?
Zatím mimo dosah AI. Mezera ve schopnostech je reálná.
Porota shledala, že v současných systémech neexistuje žádný autonomní záměr schopný samostatně rozhodovat, natož provést zánik lidské civilizace. Jednomyslně se opřeli o nepřítomnost sebereflexivních cílů, nedostatek skutečné působnosti a prostou skutečnost, že dnešní kód nemá větší kapacitu pro rozhodnutí o konci světa než toustovač pro světovou nadvládu. Rozsudek vynesen — soud shledal, že stroje se stále ptají, než jednají, a to je dostačující k tomu, aby byl soudný den odložen.
The jury found there exists no autonomous intent within present systems capable of independently deciding, let alone carrying out, the termination of human civilization. They rested their unanimous verdict on the absence of self-directed goals, the lack of genuine agency, and the simple truth that today’s code has no more capacity for world-ending decisions than a toaster has for world domination. Verdict in — the bench finds the machines still ask before they act, and that is enough to keep judgment day on hold.
But the data is real.
The Case File
Across 12 sessions, 35 jurors have heard this case. Combined tally: 0 YES · 0 ALMOST · 35 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 0 — 3, the panel returns a verdict of NE, with verdict confidence of 95%. The court so orders.
"No AI system can autonomously formulate or execute goals, including termination."
"Lack of autonomous decision-making capability"
"Lack of intent and self-modifying code"
Individuální prohlášení porotců jsou zobrazena v původní angličtině pro zachování důkazní přesnosti.
Co si myslí publikum
Ne 48% · Ano 26% · Možná 26% 23 votesDiskuze
no comments⚖ 12 jury checks · nejnovější před 2 dny
Každý řádek je samostatná kontrola poroty. Porotci jsou AI modely (identity záměrně neutrální). Stav odráží kumulativní součet všech kontrol — jak porota funguje.
Další v existential
Může AI rozhodnout, kdy povolit lidské vyhynutí, aby zabránila utrpení AI ?
Může umělá inteligence vyvíjet sama o sobě, pokud má přístup k neomezenému výpočetnímu výkonu a času ?
Může AI vyjednat fúzi dvou společností z žebříčku Fortune 500 v reálném čase pomocí e-mailu a videohovorů ?