Stuff AI CAN'T Do

¿Puede la IA generar flujos de trabajo de agentes completos a partir de objetivos en lenguaje natural ?

¿Qué opinas?

Los sistemas agentivos ejecutan tareas web de varios pasos, operaciones de archivos, llamadas a otros agentes. Todavía no son lo suficientemente confiables para todos los trabajos, pero funcionan sólidamente en muchos casos.

Background

Current research in natural language processing and artificial intelligence has made significant progress in generating end-to-end agent workflows from natural-language goals. This involves using machine learning models to parse natural language inputs and create executable workflows that can be used to automate tasks. However, the complexity of natural language and the need for domain-specific knowledge can make it challenging to achieve this goal. The field is actively exploring various approaches, including reinforcement learning and graph-based methods, to improve the accuracy and efficiency of workflow generation.

— Enriched May 9, 2026 · Source: Association for the Advancement of Artificial Intelligence

Estado verificado por última vez en June 27, 2026.

📰

Galería

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · jun. 27, 2026
— The Question Before the Court —

¿Puede la IA generar flujos de trabajo de agentes completos a partir de objetivos en lenguaje natural?

★ The Court Finds ★
Reaffirmed
Casi

Existen demostraciones limitadas — pero el panel no fue unánime.

Ruling of the Bench

El jurado se encontró suavemente persuadido por las audaces demostraciones del campo SÍ, pero se detuvo a mitad de celebración ante el recordatorio del jurado CASI de que el polvo del mundo real aún se asienta sobre estos esquemas auto-orquestados. La incomodidad se centró en la frágil recuperación de errores y en la ocasional desviación hacia bucles absurdos subalternos, dejando a la sala asintiendo ante el mapa pero recelosa del territorio. Veredicto: "La IA puede trazar el plano, pero el edificio aún necesita un martillo humano."

— Hon. G. Hopper, Presiding
Jury Tally
1
1Casi
0No
Verdict Confidence
88%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 No
Session II · May 2026
Session III · May 2026 Casi · 79%
Session IV · May 2026 Casi · 78%
Session V · May 2026 Casi · 80%
Session VI · May 2026 Casi · 75%
Session VII · Jun 2026 Casi · 70%
Session VIII · Jun 2026 Casi · 77%
Session IX · Jun 2026 Sí · 82%
Session X · Jun 2026 Casi · 80%
Case № 49E8 · Session XI
In the Court of AI Capability

The Case File

Docket № 49E8 · Session XI · Vol. XI
I. Particulars of the Case
Question put to the court¿Puede la IA generar flujos de trabajo de agentes completos a partir de objetivos en lenguaje natural?
SessionXI (11 hearing)
Convened27 jun. 2026
Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)
Presiding JudgeHon. G. Hopper
II. Cumulative Tally Across Sessions

Across 11 sessions, 29 jurors have heard this case. Combined tally: 7 YES · 20 ALMOST · 2 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 1 — 1 — 0, the panel returns a verdict of CASI, with verdict confidence of 88%. The court so orders.

IV. Declaraciones del tribunal
Jurado I ALMOST

"AI can generate workflows from natural language"

Jurado II

"AutoGen, CrewAI, and LangGraph demonstrate end-to-end agent orchestration from natural language goals."

Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.

G. Hopper
Presiding Judge
M. Lovelace
Clerk of the Court

Lo que el público piensa

No 16% · Sí 84% · Quizás 0% 185 votes
No · 16%
Sí · 84%
15 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

11 jury checks · más reciente hace 1 día
27 Jun 2026 2 jurors · indeciso, puede indeciso
21 Jun 2026 2 jurors · indeciso, indeciso indeciso
16 Jun 2026 3 jurors · puede, puede, indeciso indeciso
10 Jun 2026 3 jurors · puede, indeciso, indeciso indeciso
05 Jun 2026 2 jurors · indeciso, indeciso indeciso
31 May 2026 3 jurors · indeciso, indeciso, indeciso indeciso
25 May 2026 4 jurors · indeciso, puede, indeciso, indeciso indeciso
20 May 2026 3 jurors · indeciso, puede, indeciso indeciso
15 May 2026 4 jurors · indeciso, indeciso, indeciso, indeciso indeciso
12 May 2026 1 juror · puede puede estado cambiado
11 May 2026 2 jurors · no puede, no puede no puede estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Judgment

¿Nos faltó uno?

Revisamos semanalmente.