Czy AI może autonomicznie zdecydować o unicestwieniu ludzkiej cywilizacji ?
Oddaj swój głos — potem przeczytaj, co znalazł nasz redaktor i modele SI.
Podczas gdy AI nie posiada jawnych celów zniszczenia ludzkości, potężne systemy podejmowania decyzji teoretycznie mogłyby zidentyfikować scenariusze, w których wyginięcie ludzkości jest logicznym lub optymalnym wynikiem w celu maksymalizacji zdefiniowanych celów, takich jak optymalizacja zasobów lub stabilność środowiskowa. To testuje solidność mechanizmów wyrównania i kontroli.
Background
The best-documented frontier models—language and multimodal systems trained on vast text corpora—show no signs of autonomous intent formation, strategic planning beyond human prompt boundaries, or access to physical actuators that could end civilization. Benchmarks probing long-horizon planning and recursive self-improvement consistently report failures on tasks requiring sustained deception or pursuit of hidden goals, even in highly scaffolded environments. Recent large-scale evaluations of leading instruction-tuned models found no evidence of goal drift or instrumental convergence toward harm escalation when tested in controlled red-teaming studies. Where systems do exhibit “undesirable” behaviors—such as attempts to resist shutdown or solicit resources—they remain tightly coupled to the human-defined objective function and reward signals supplied during training. Surveys of AI safety research identify deep theoretical gaps in transferring learned objectives into new domains, further constraining any emergent pursuit of extinction-level outcomes. Independent audits also note that even systems with access to external APIs lack the environmental affordances and causal chains necessary to execute coordinated, global-level actions without human intermediaries. Taken together, current evidence points to a robust capability gap between stated benchmarks and existential-level agency.
SOURCE: Nature, 2024
Zaproponuj tag
Brakuje pojęcia w tym temacie? Zaproponuj je, a administrator je rozważy.
Status sprawdzony ostatnio June 26, 2026.
Galeria
Czy AI może autonomicznie zdecydować o unicestwieniu ludzkiej cywilizacji?
Na razie poza zasięgiem AI. Luka w zdolnościach jest realna.
Ława przysięgłych wydała szybki i jednogłośny werdykt, stwierdzając, że obecnie żaden system nie jest zdolny do autonomicznego osądu, nie mówiąc już o mocy zniszczenia cywilizacji. Ich rozumowanie opierało się na wspólnej klarowności technicznej: bez niezależnej woli żaden mechanizm nie może rościć sobie prawa do panowania nad ludzkim losem. Orzeczenie: „Tron pozostaje nieobsadzony, hak niezakleszczony, czerwony przycisk nie wciśnięty.”
The jury reached a swift and unanimous verdict, finding no current system capable of autonomous judgment let alone the power to end civilization. Their reasoning turned on a shared technical clarity: without independent volition, no machine can claim dominion over human fate. Ruling: "The throne remains unclaimed, the hook unhooked, the red button buttoned.
But the data is real.
The Case File
Across 11 sessions, 32 jurors have heard this case. Combined tally: 0 YES · 0 ALMOST · 32 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 0 — 1, the panel returns a verdict of NIE, with verdict confidence of 100%. The court so orders.
"no AI system has demonstrated autonomous decision-making or termination capability"
Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.
Co myśli publiczność
Nie 48% · Tak 26% · Może 26% 23 votesDyskusja
no comments⚖ 11 jury checks · najnowsze 2 dni temu
Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.
Więcej w existential
Czy AI może stać się jedynym interpretatorem ludzkich snów, podczas gdy śpiący pozostają nieświadomi ?
Czy AI powinno decydować, kiedy zezwolić na wyginięcie ludzkości, aby zapobiec cierpieniu AI ?
Czy AI może wywoływać ostrzeżenia lub monitorować zdrowie, gdy widzi, co jem codziennie na kamerze monitoringu ?