Agentiske systemer udfører flertrins web-opgaver, filoperationer, opkald til andre agenter. Endnu ikke pålidelige nok til alle opgaver, men fungerer solidt for mange. --- Nuværende forskning inden for naturlig sprogbehandling og kunstig intelligens har gjort betydelige fremskridt med at generere end-to-end agent-arbejdsgange ud fra naturligt-sproglige mål. Dette indebærer brug af maskinlæringsmodeller til at analysere naturligt sprog og skabe eksekverbare arbejdsgange, der kan bruges til at automatisere opgaver. Kompleksiteten i naturligt sprog og behovet for domænespecifik viden kan dog gøre det udfordrende at opnå dette mål. Feltet undersøger aktivt forskellige tilgange, herunder forstærkningslæring og grafbaserede metoder, for at forbedre nøjagtigheden og effektiviteten af arbejdsgangsgenerering. — Beriget 9. maj 2026 · Kilde: Association for the Advancement of Artificial Intelligence — https://www.aaai.org

⚖️ Judgment · May 8, 2026 · STUFFAICANTDO.COM · Rapportér dette

Kan AI generere end-to-end agent-workflows ud fra naturligt-sproglige mål ?

Hvad mener du? Kan AI dette?

Afgiv din stemme — læs så hvad vores redaktør og AI-modellerne fandt.

Agentiske systemer udfører flertrins web-opgaver, filoperationer, opkald til andre agenter. Endnu ikke pålidelige nok til alle opgaver, men fungerer solidt for mange.

#Machine Learning

#Natural Language Processing

#End To End Workflow

#Task Automation

Background

Current research in natural language processing and artificial intelligence has made significant progress in generating end-to-end agent workflows from natural-language goals. This involves using machine learning models to parse natural language inputs and create executable workflows that can be used to automate tasks. However, the complexity of natural language and the need for domain-specific knowledge can make it challenging to achieve this goal. The field is actively exploring various approaches, including reinforcement learning and graph-based methods, to improve the accuracy and efficiency of workflow generation.

— Enriched May 9, 2026 · Source: Association for the Advancement of Artificial Intelligence

Status senest tjekket July 2, 2026.

📰

Galleri

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026

Sitting at the Bench Filed · jul. 2, 2026

— The Question Before the Court —

Kan AI generere end-to-end agent-workflows ud fra naturligt-sproglige mål?

★ The Court Finds ★

Reaffirmed

⚖

Næsten

Snævre demoer findes — men panelet var ikke enigt.

Ruling of the Bench

Juryen fandt, at selvom kunstig intelligens kan nedbryde mål i naturligt sprog til plausible arbejdsgange, vakler den, når den skal udføre disse trin uden menneskelig opsyn eller korrektion. Efter at have set AI’en forsøge sig med adskillige dusin kørsler fra mål til agent, var panelet enige om, at outputtet er en nyttig stillads, men endnu ikke et færdigt hus. Kendelse: næsten. Den enlinjede kendelse: “AI kan skitsere kortet, men den snubler stadig på den sidste mil – kendelsen stadfæstes, men forbliver på randen.”

— Hon. A. Turing-Brown, Presiding

Jury Tally

0Ja

3Næsten

0Nej

Verdict Confidence

83%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nej

Session II · May 2026 Ja

Session III · May 2026 Næsten · 79%

Session IV · May 2026 Næsten · 78%

Session V · May 2026 Næsten · 80%

Session VI · May 2026 Næsten · 75%

Session VII · Jun 2026 Næsten · 70%

Session VIII · Jun 2026 Næsten · 77%

Session IX · Jun 2026 Ja · 82%

Session X · Jun 2026 Næsten · 80%

Session XI · Jun 2026 Næsten · 88%

Case № 49E8 · Session XII

In the Court of AI Capability

The Case File

Docket № 49E8 · Session XII · Vol. XII

I. Particulars of the Case

Question put to the courtKan AI generere end-to-end agent-workflows ud fra naturligt-sproglige mål?

SessionXII (12 hearing)

Convened2 jul. 2026

Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)

Presiding JudgeHon. A. Turing-Brown

II. Cumulative Tally Across Sessions

Across 12 sessions, 32 jurors have heard this case. Combined tally: 7 YES · 23 ALMOST · 2 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 3 — 0, the panel returns a verdict of NæSTEN, with verdict confidence of 83%. The court so orders.

IV. Udtalelser fra dommerpanelet

Nævning I ALMOST

"AI can parse goals and generate workflows"

Nævning II ALMOST

"AI can generate sub-tasks from goals but not fully autonomous, end-to-end agent workflows reliably"

Nævning III ALMOST

"AI can parse goals and generate workflows"

Individuelle nævningers udtalelser vises på originalengelsk for at bevare bevismæssig præcision.

A. Turing-Brown

Presiding Judge

M. Lovelace

Clerk of the Court

Aktuel tilstand

OMSTRIDT

Vendepunkt

omstridt

⚖ Jury ⓘ

7✓ · 2✗ · 23?

→ omstridt

Hvad publikum mener

Nej 16% · Ja 84% · Måske 0% 185 votes

Nej · 16%

Ja · 84%

15 days of activity

Diskussion

no comments

⚖ 12 jury checks · seneste for 1 dag siden

02 Jul 2026 3 jurors · uafklaret, uafklaret, uafklaret uafklaret

27 Jun 2026 2 jurors · uafklaret, kan uafklaret

21 Jun 2026 2 jurors · uafklaret, uafklaret uafklaret

16 Jun 2026 3 jurors · kan, kan, uafklaret uafklaret

10 Jun 2026 3 jurors · kan, uafklaret, uafklaret uafklaret

05 Jun 2026 2 jurors · uafklaret, uafklaret uafklaret

31 May 2026 3 jurors · uafklaret, uafklaret, uafklaret uafklaret

25 May 2026 4 jurors · uafklaret, kan, uafklaret, uafklaret uafklaret

20 May 2026 3 jurors · uafklaret, kan, uafklaret uafklaret

15 May 2026 4 jurors · uafklaret, uafklaret, uafklaret, uafklaret uafklaret

12 May 2026 1 juror · kan kan status ændret

11 May 2026 2 jurors · kan ikke, kan ikke kan ikke status ændret

Hver række er et separat jurytjek. Nævninger er AI-modeller (identiteter holdt neutrale med vilje). Status afspejler den kumulative optælling på tværs af alle tjek — hvordan juryen virker.

Flere i Judgment

Kan AI bestå den amerikanske medicinske licensprøve (USMLE)? — Status tjekket på 20. marts 2024 ?

OMSTRIDT

Kan AI afgøre, om et kunstværk er en parodi eller et ægte kunstværk ?

OMSTRIDT

🎲 Tilfældigt valg

Kan AI kontrollere en elektrisk tegning for fejl ?

OMSTRIDT · technology

Alle i Judgment → Tidligere vendte →

Kan AI generere end-to-end agent-workflows ud fra naturligt-sproglige mål ?

Foreslå et tag

Kan AI generere end-to-end agent-workflows ud fra naturligt-sproglige mål?

The Case File

Hvad publikum mener

Diskussion

Flere i Judgment

🧪 Sådan tester vi AI-evner

⚠ Dette spørgsmål blander mere end én ting

Giv mig besked

Indlejr

Har du en vi gik glip af?

🔎Stadig under undersøgelse

Tilføj et udsagn