Stuff AI CAN'T Do

¿Puede la IA librar una ciberguerra autónoma contra infraestructuras críticas utilizando exploits de día cero descubiertos y armados por IA ?

¿Qué opinas?

Los actores estatales y no estatales están entrenando modelos de IA para sondear sistemas de control industrial, redes eléctricas y redes de defensa en busca de vulnerabilidades indetectables. A diferencia de los hackers humanos, estos sistemas operan a velocidad máquina, invirtiendo protocolos y encadenando exploits en tiempo real. Pruebas recientes en entornos aislados muestran agentes de IA identificando y armando nuevos *zero-days* en cuestión de días, más rápido de lo que las agencias pueden parchear o incluso catalogar las amenazas. El próximo gran apagón o cierre de hospitales podría ser obra de un código en lugar de una intención humana.

Background

State and non-state actors are training AI models to probe industrial control systems, power grids, and defense networks for undetectable vulnerabilities. Unlike human hackers, these systems operate at machine speed, reverse-engineering protocols and chaining exploits in real time. Recent sandbox tests show AI agents identifying and weaponizing new zero-days within days—faster than agencies can patch or even catalog threats. The next major blackout or hospital shutdown may be authored by code rather than human intent.

As of mid-2024, no known AI system can autonomously identify, weaponize, and deploy zero-day exploits against critical infrastructure without significant human oversight. Research on AI-driven cyber operations (e.g., autonomous penetration testing or vulnerability discovery) exists, but critical gaps remain in reliably generating exploits for novel, high-value targets and avoiding unintended collateral damage in live networks. Current AI tools are typically used to assist human analysts or simulate attacks in controlled environments, not to conduct fully autonomous cyberwarfare campaigns. The ethical, legal, and technical barriers—including attribution challenges and escalation risks—limit deployment in real-world conflicts.

Estado verificado por última vez en June 25, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · jun. 25, 2026
— The Question Before the Court —

¿Puede la IA librar una ciberguerra autónoma contra infraestructuras críticas utilizando exploits de día cero descubiertos y armados por IA?

★ The Court Finds ★
▼ Downgraded from Casi
No

Por ahora fuera del alcance de la IA. La brecha de capacidad es real.

Ruling of the Bench

El jurado emitió un veredicto decisivo de NO, al encontrar que, si bien la IA puede identificar patrones y sugerir vulnerabilidades, ningún sistema ha autonomizado aún su uso para ciberguerra a gran escala contra infraestructuras críticas. Su división se basó en la ausencia de capacidad demostrada más que en preocupaciones éticas, trazando firmemente la línea en la autonomía actual. Falló: "Las máquinas pueden detectar las grietas, pero aún no han blandido el martillo."

— Hon. B. Liskov-Chen, Presiding
Jury Tally
0
0Casi
1No
Verdict Confidence
100%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026 Casi · 80%
Session III · May 2026 Casi · 80%
Session IV · May 2026 Casi · 81%
Session V · May 2026 In_research · 77%
Session VI · Jun 2026 Casi · 79%
Session VII · Jun 2026 Casi · 80%
Session VIII · Jun 2026 In_research · 77%
Session IX · Jun 2026 Casi · 86%
Case № 093C · Session X
In the Court of AI Capability

The Case File

Docket № 093C · Session X · Vol. X
I. Particulars of the Case
Question put to the court¿Puede la IA librar una ciberguerra autónoma contra infraestructuras críticas utilizando exploits de día cero descubiertos y armados por IA?
SessionX (10 hearing)
Convened25 jun. 2026
Previously ruledNO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → IN_RESEARCH (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → IN_RESEARCH (Jun '26) → ALMOST (Jun '26) → NO (Jun '26)
Presiding JudgeHon. B. Liskov-Chen
II. Cumulative Tally Across Sessions

Across 10 sessions, 31 jurors have heard this case. Combined tally: 1 YES · 18 ALMOST · 12 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 0 — 1, the panel returns a verdict of NO, with verdict confidence of 100%. The court so orders. Verdict downgraded from prior session.

IV. Declaraciones del tribunal
Jurado I No

"No publicly known AI system can autonomously discover, weaponize, and deploy zero-day exploits against critical infrastructure."

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

B. Liskov-Chen
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 52% · Sí 36% · Quizás 12% 25 votes
No · 52%
Sí · 36%
Quizás · 12%
16 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

10 jury checks · más reciente hace 3 días
25 Jun 2026 1 juror · no puede no puede
20 Jun 2026 3 jurors · indeciso, no puede, indeciso indeciso
14 Jun 2026 2 jurors · no puede, indeciso indeciso
09 Jun 2026 4 jurors · indeciso, no puede, puede, indeciso indeciso
03 Jun 2026 3 jurors · no puede, indeciso, indeciso indeciso
29 May 2026 2 jurors · no puede, indeciso indeciso
24 May 2026 4 jurors · indeciso, no puede, indeciso, indeciso indeciso
18 May 2026 5 jurors · indeciso, no puede, indeciso, indeciso, indeciso indeciso
14 May 2026 4 jurors · indeciso, no puede, indeciso, indeciso indeciso estado cambiado
12 May 2026 3 jurors · no puede, no puede, no puede no puede estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en warfare

¿Nos faltó uno?

Revisamos semanalmente.