🔥 Hot topics · KAN IKKE · Kan · § The Court · Seneste omvendinger · 📈 Tidslinje · Spørg · Ledere · 🔥 Hot topics · KAN IKKE · Kan · § The Court · Seneste omvendinger · 📈 Tidslinje · Spørg · Ledere
Stuff AI CAN'T Do

Kan AI generere end-to-end agent-workflows ud fra naturligt-sproglige mål ?

Hvad mener du?

Agentiske systemer udfører flertrins web-opgaver, filoperationer, opkald til andre agenter. Endnu ikke pålidelige nok til alle opgaver, men fungerer solidt for mange.

Background

Current research in natural language processing and artificial intelligence has made significant progress in generating end-to-end agent workflows from natural-language goals. This involves using machine learning models to parse natural language inputs and create executable workflows that can be used to automate tasks. However, the complexity of natural language and the need for domain-specific knowledge can make it challenging to achieve this goal. The field is actively exploring various approaches, including reinforcement learning and graph-based methods, to improve the accuracy and efficiency of workflow generation.

— Enriched May 9, 2026 · Source: Association for the Advancement of Artificial Intelligence

Status senest tjekket July 2, 2026.

📰

Galleri

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · jul. 2, 2026
— The Question Before the Court —

Kan AI generere end-to-end agent-workflows ud fra naturligt-sproglige mål?

★ The Court Finds ★
Reaffirmed
Næsten

Snævre demoer findes — men panelet var ikke enigt.

Ruling of the Bench

Juryen fandt, at selvom kunstig intelligens kan nedbryde mål i naturligt sprog til plausible arbejdsgange, vakler den, når den skal udføre disse trin uden menneskelig opsyn eller korrektion. Efter at have set AI’en forsøge sig med adskillige dusin kørsler fra mål til agent, var panelet enige om, at outputtet er en nyttig stillads, men endnu ikke et færdigt hus. Kendelse: næsten. Den enlinjede kendelse: “AI kan skitsere kortet, men den snubler stadig på den sidste mil – kendelsen stadfæstes, men forbliver på randen.”

— Hon. A. Turing-Brown, Presiding
Jury Tally
0Ja
3Næsten
0Nej
Verdict Confidence
83%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Nej
Session II · May 2026 Ja
Session III · May 2026 Næsten · 79%
Session IV · May 2026 Næsten · 78%
Session V · May 2026 Næsten · 80%
Session VI · May 2026 Næsten · 75%
Session VII · Jun 2026 Næsten · 70%
Session VIII · Jun 2026 Næsten · 77%
Session IX · Jun 2026 Ja · 82%
Session X · Jun 2026 Næsten · 80%
Session XI · Jun 2026 Næsten · 88%
Case № 49E8 · Session XII
In the Court of AI Capability

The Case File

Docket № 49E8 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtKan AI generere end-to-end agent-workflows ud fra naturligt-sproglige mål?
SessionXII (12 hearing)
Convened2 jul. 2026
Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → YES (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. A. Turing-Brown
II. Cumulative Tally Across Sessions

Across 12 sessions, 32 jurors have heard this case. Combined tally: 7 YES · 23 ALMOST · 2 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 3 — 0, the panel returns a verdict of NæSTEN, with verdict confidence of 83%. The court so orders.

IV. Udtalelser fra dommerpanelet
Nævning I ALMOST

"AI can parse goals and generate workflows"

Nævning II ALMOST

"AI can generate sub-tasks from goals but not fully autonomous, end-to-end agent workflows reliably"

Nævning III ALMOST

"AI can parse goals and generate workflows"

Individuelle nævningers udtalelser vises på originalengelsk for at bevare bevismæssig præcision.

A. Turing-Brown
Presiding Judge
M. Lovelace
Clerk of the Court

Hvad publikum mener

Nej 16% · Ja 84% · Måske 0% 185 votes
Nej · 16%
Ja · 84%
15 days of activity

Diskussion

no comments

Kommentarer og billeder gennemgår admin-godkendelse før de vises offentligt.

12 jury checks · seneste for 1 dag siden
02 Jul 2026 3 jurors · uafklaret, uafklaret, uafklaret uafklaret
27 Jun 2026 2 jurors · uafklaret, kan uafklaret
21 Jun 2026 2 jurors · uafklaret, uafklaret uafklaret
16 Jun 2026 3 jurors · kan, kan, uafklaret uafklaret
10 Jun 2026 3 jurors · kan, uafklaret, uafklaret uafklaret
05 Jun 2026 2 jurors · uafklaret, uafklaret uafklaret
31 May 2026 3 jurors · uafklaret, uafklaret, uafklaret uafklaret
25 May 2026 4 jurors · uafklaret, kan, uafklaret, uafklaret uafklaret
20 May 2026 3 jurors · uafklaret, kan, uafklaret uafklaret
15 May 2026 4 jurors · uafklaret, uafklaret, uafklaret, uafklaret uafklaret
12 May 2026 1 juror · kan kan status ændret
11 May 2026 2 jurors · kan ikke, kan ikke kan ikke status ændret

Hver række er et separat jurytjek. Nævninger er AI-modeller (identiteter holdt neutrale med vilje). Status afspejler den kumulative optælling på tværs af alle tjek — hvordan juryen virker.

Flere i Judgment

Har du en vi gik glip af?

Tilføj et udsagn til atlasset. Vi gennemgår ugentligt.