Stuff AI CAN'T Do

¿Puede la IA generar flujos de trabajo de agentes completos a partir de objetivos en lenguaje natural ?

¿Qué opinas?

Los sistemas agentivos ejecutan tareas web de varios pasos, operaciones de archivos, llamadas a otros agentes. Todavía no son lo suficientemente confiables para todos los trabajos, pero funcionan sólidamente en muchos casos.

Background

Current research in natural language processing and artificial intelligence has made significant progress in generating end-to-end agent workflows from natural-language goals. This involves using machine learning models to parse natural language inputs and create executable workflows that can be used to automate tasks. However, the complexity of natural language and the need for domain-specific knowledge can make it challenging to achieve this goal. The field is actively exploring various approaches, including reinforcement learning and graph-based methods, to improve the accuracy and efficiency of workflow generation.

— Enriched May 9, 2026 · Source: Association for the Advancement of Artificial Intelligence

Estado verificado por última vez en July 2, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul. 2, 2026
— The Question Before the Court —

¿Puede la IA generar flujos de trabajo de agentes completos a partir de objetivos en lenguaje natural?

★ The Court Finds ★
Reaffirmed
Casi

Existen demostraciones limitadas — pero el panel no fue unánime.

Ruling of the Bench

El jurado encontró que mientras la inteligencia artificial puede descomponer metas de lenguaje natural en flujos de trabajo plausibles, tropieza cuando se requiere que ejecute esos pasos sin supervisión o corrección humana. Después de ver al AI intentar varias decenas de ejecuciones de meta a agente, el panel estuvo de acuerdo en que la salida es una estructura útil pero no yet una casa terminada. Verdict: almost. La sentencia de una línea: AI puede esbozar el mapa, pero todavía tropieza en la última milla—verdict afirmado, pero sigue en el umbral.

— Hon. A. Turing-Brown, Presiding
Jury Tally
0
3Casi
0No
Verdict Confidence
83%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026
Session III · May 2026 Casi · 79%
Session IV · May 2026 Casi · 78%
Session V · May 2026 Casi · 80%
Session VI · May 2026 Casi · 75%
Session VII · Jun 2026 Casi · 70%
Session VIII · Jun 2026 Casi · 77%
Session IX · Jun 2026 Sí · 82%
Session X · Jun 2026 Casi · 80%
Session XI · Jun 2026 Casi · 88%
Case № 49E8 · Session XII
In the Court of AI Capability

The Case File

Docket № 49E8 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the court¿Puede la IA generar flujos de trabajo de agentes completos a partir de objetivos en lenguaje natural?
SessionXII (12 hearing)
Convened2 jul. 2026
Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. A. Turing-Brown
II. Cumulative Tally Across Sessions

Across 12 sessions, 32 jurors have heard this case. Combined tally: 7 YES · 23 ALMOST · 2 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 3 — 0, the panel returns a verdict of CASI, with verdict confidence of 83%. The court so orders.

IV. Declaraciones del tribunal
Jurado I ALMOST

"AI can parse goals and generate workflows"

Jurado II ALMOST

"AI can generate sub-tasks from goals but not fully autonomous, end-to-end agent workflows reliably"

Jurado III ALMOST

"AI can parse goals and generate workflows"

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

A. Turing-Brown
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 16% · Sí 84% · Quizás 0% 185 votes
No · 16%
Sí · 84%
15 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

12 jury checks · más reciente hace 1 día
02 Jul 2026 3 jurors · indeciso, indeciso, indeciso indeciso
27 Jun 2026 2 jurors · indeciso, puede indeciso
21 Jun 2026 2 jurors · indeciso, indeciso indeciso
16 Jun 2026 3 jurors · puede, puede, indeciso indeciso
10 Jun 2026 3 jurors · puede, indeciso, indeciso indeciso
05 Jun 2026 2 jurors · indeciso, indeciso indeciso
31 May 2026 3 jurors · indeciso, indeciso, indeciso indeciso
25 May 2026 4 jurors · indeciso, puede, indeciso, indeciso indeciso
20 May 2026 3 jurors · indeciso, puede, indeciso indeciso
15 May 2026 4 jurors · indeciso, indeciso, indeciso, indeciso indeciso
12 May 2026 1 juror · puede puede estado cambiado
11 May 2026 2 jurors · no puede, no puede no puede estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Judgment

¿Nos faltó uno?

Revisamos semanalmente.