🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře · 🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře
Stuff AI CAN'T Do

Může AI spolehlivě identifikovat sarkasmus v psaném textu ?

Co si myslíš?

Dlouho obtížný problém; většinou vyřešený v roce 2023 kontextovými LLMs. Zůstávají okrajové případy, ale každodenní detekce je funkční.

Background

State-of-the-art models such as PaLM 2 and LLaMA 3 show measurable improvements in detecting sarcasm when fine-tuned on curated datasets like the Sarcasm on Reddit corpus, outperforming earlier systems by roughly 12–15 percentage points on balanced test sets. Evidence from controlled benchmarks indicates that accuracy can reach the mid-70 % range when models are trained on explicit contextual markers and user history annotations, yet these gains evaporate when sarcasm relies on shared cultural references that lie outside the training domain. Named systems including RoBERTa-base and DeBERTa-v3 have set milestones by leveraging contrastive attention over incongruent sentiment spans, while newer variants such as Mistral-7B-Instruct achieve better zero-shot transfer by treating sarcasm detection as a multi-hop inference task. A key limitation remains the scarcity of large, diverse, and culturally inclusive datasets, as current resources over-represent Western English forums and under-sample ironic expressions in low-resource languages or niche communities.

SOURCE: Nature, 2024

Stav naposledy zkontrolován July 2, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jul 2026
Sitting at the Bench Filed · čvc 2, 2026
— The Question Before the Court —

Může AI spolehlivě identifikovat sarkasmus v psaném textu?

★ The Court Finds ★
Reaffirmed
Téměř

Existují omezené ukázky — ale porota nebyla jednomyslná.

Ruling of the Bench

Porota shledala umělou inteligenci schopnou hrubé aproximace, nikoli však mistrovství, přičemž jejich „téměř“ hlasy se rozdělily mezi obdiv k rychlému pokroku a frustraci z přetrvávající nejednoznačnosti. Ačkoli modely dokážou označit sarkasmus s vyšší pravděpodobností než náhoda, soud se shodl, že kontext stále proklouzává jako špatně zavěšená opona. Rozsudek: Soudní dvůr vyhlašuje nerozhodný úder kladívkem – dost blízko na to, aby věděli, že tam je, dost blízko na to, aby propásli vtip.

— Hon. D. Knuth-Hale, Presiding
Jury Tally
0Ano
3Téměř
0Ne
Verdict Confidence
77%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Ne
Session II · May 2026 Ne
Session III · May 2026 Téměř · 72%
Session IV · May 2026 Téměř · 76%
Session V · May 2026 Téměř · 78%
Session VI · May 2026 Téměř · 73%
Session VII · Jun 2026 Téměř · 73%
Session VIII · Jun 2026 Téměř · 70%
Session IX · Jun 2026 Téměř · 73%
Session X · Jun 2026 Téměř · 78%
Session XI · Jun 2026 Téměř · 78%
Case № DE44 · Session XII
In the Court of AI Capability

The Case File

Docket № DE44 · Session XII · Vol. XII
I. Particulars of the Case
Question put to the courtMůže AI spolehlivě identifikovat sarkasmus v psaném textu?
SessionXII (12 hearing)
Convened2 čvc 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jul '26)
Presiding JudgeHon. D. Knuth-Hale
II. Cumulative Tally Across Sessions

Across 12 sessions, 34 jurors have heard this case. Combined tally: 0 YES · 28 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 3 — 0, the panel returns a verdict of TéMěř, with verdict confidence of 77%. The court so orders.

IV. Prohlášení soudců
Porotce I ALMOST

"sarcasm detection remains unreliable even in narrow cases due to context dependence"

Porotce II ALMOST

"State-of-art models achieve high accuracy"

Porotce III ALMOST

"State-of-art models struggle with context"

Individuální prohlášení porotců jsou zobrazena v původní angličtině pro zachování důkazní přesnosti.

D. Knuth-Hale
Presiding Judge
M. Lovelace
Clerk of the Court

Co si myslí publikum

Ne 16% · Ano 84% · Možná 0% 306 votes
Ne · 16%
Ano · 84%
15 days of activity

Diskuze

no comments

Komentáře a obrázky procházejí kontrolou admina, než se objeví veřejně.

12 jury checks · nejnovější před 2 dny
02 Jul 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
26 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
21 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
15 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
10 Jun 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
04 Jun 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
30 May 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
25 May 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
19 May 2026 4 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
15 May 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto stav změněn
12 May 2026 3 jurors · neumí, neumí, neumí neumí
11 May 2026 3 jurors · neumí, neumí, neumí neumí stav změněn

Každý řádek je samostatná kontrola poroty. Porotci jsou AI modely (identity záměrně neutrální). Stav odráží kumulativní součet všech kontrol — jak porota funguje.

Další v Judgment

Máte nějakou, kterou jsme přehlédli?

Přidejte tvrzení do atlasu. Kontrolujeme týdně.