🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře · 🔥 Hot topics · NEUMÍ · Umí · § The Court · Nedávná překlopení · 📈 Časová osa · Zeptat se · Komentáře
Stuff AI CAN'T Do

Může AI spolehlivě identifikovat sarkasmus v psaném textu ?

Co si myslíš?

Dlouho obtížný problém; většinou vyřešený v roce 2023 kontextovými LLMs. Zůstávají okrajové případy, ale každodenní detekce je funkční.

Background

State-of-the-art models such as PaLM 2 and LLaMA 3 show measurable improvements in detecting sarcasm when fine-tuned on curated datasets like the Sarcasm on Reddit corpus, outperforming earlier systems by roughly 12–15 percentage points on balanced test sets. Evidence from controlled benchmarks indicates that accuracy can reach the mid-70 % range when models are trained on explicit contextual markers and user history annotations, yet these gains evaporate when sarcasm relies on shared cultural references that lie outside the training domain. Named systems including RoBERTa-base and DeBERTa-v3 have set milestones by leveraging contrastive attention over incongruent sentiment spans, while newer variants such as Mistral-7B-Instruct achieve better zero-shot transfer by treating sarcasm detection as a multi-hop inference task. A key limitation remains the scarcity of large, diverse, and culturally inclusive datasets, as current resources over-represent Western English forums and under-sample ironic expressions in low-resource languages or niche communities.

SOURCE: Nature, 2024

Stav naposledy zkontrolován June 26, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · čvn 26, 2026
— The Question Before the Court —

Může AI spolehlivě identifikovat sarkasmus v psaném textu?

★ The Court Finds ★
Reaffirmed
Téměř

Existují omezené ukázky — ale porota nebyla jednomyslná.

Ruling of the Bench

Porota shledala, že úkol spolehlivě identifikovat sarkasmus ve všech psaných textech je lákavě na dosah, avšak v praxi frustrující a těžko uchopitelný, přičemž porotci připustili, že současné modely dokážou sarkasmus odhalit v úzce vymezených situacích, ale zakopávají, když se setkají s divokou, neuspořádanou prózou každodenního života. Mezi opatrným optimismem a praktickými limity vznikla lehkovážná patová situace, aniž by se ozval hlas, který by popíral existenci problému či vyzýval k dalšímu vyloučení. Soudní pravidla znějí: Umělá inteligence slyší odfrknutí, ale stále propásne polovinu sarkasmu v místnosti.

— Hon. G. Hopper, Presiding
Jury Tally
0Ano
2Téměř
0Ne
Verdict Confidence
78%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Ne
Session II · May 2026 Ne
Session III · May 2026 Téměř · 72%
Session IV · May 2026 Téměř · 76%
Session V · May 2026 Téměř · 78%
Session VI · May 2026 Téměř · 73%
Session VII · Jun 2026 Téměř · 73%
Session VIII · Jun 2026 Téměř · 70%
Session IX · Jun 2026 Téměř · 73%
Session X · Jun 2026 Téměř · 78%
Case № DE44 · Session XI
In the Court of AI Capability

The Case File

Docket № DE44 · Session XI · Vol. XI
I. Particulars of the Case
Question put to the courtMůže AI spolehlivě identifikovat sarkasmus v psaném textu?
SessionXI (11 hearing)
Convened26 čvn 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)
Presiding JudgeHon. G. Hopper
II. Cumulative Tally Across Sessions

Across 11 sessions, 31 jurors have heard this case. Combined tally: 0 YES · 25 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 2 — 0, the panel returns a verdict of TéMěř, with verdict confidence of 78%. The court so orders.

IV. Prohlášení soudců
Porotce I ALMOST

"State-of-art models can detect sarcasm in limited contexts"

Porotce II ALMOST

"sarcasm detection works in limited contexts but not reliably across general text."

Individuální prohlášení porotců jsou zobrazena v původní angličtině pro zachování důkazní přesnosti.

G. Hopper
Presiding Judge
M. Lovelace
Clerk of the Court

Co si myslí publikum

Ne 16% · Ano 84% · Možná 0% 306 votes
Ne · 16%
Ano · 84%
15 days of activity

Diskuze

no comments

Komentáře a obrázky procházejí kontrolou admina, než se objeví veřejně.

11 jury checks · nejnovější před 2 dny
26 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
21 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
15 Jun 2026 2 jurors · nerozhodnuto, nerozhodnuto nerozhodnuto
10 Jun 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
04 Jun 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
30 May 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
25 May 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
19 May 2026 4 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto
15 May 2026 3 jurors · nerozhodnuto, nerozhodnuto, nerozhodnuto nerozhodnuto stav změněn
12 May 2026 3 jurors · neumí, neumí, neumí neumí
11 May 2026 3 jurors · neumí, neumí, neumí neumí stav změněn

Každý řádek je samostatná kontrola poroty. Porotci jsou AI modely (identity záměrně neutrální). Stav odráží kumulativní součet všech kontrol — jak porota funguje.

Další v Judgment

Máte nějakou, kterou jsme přehlédli?

Přidejte tvrzení do atlasu. Kontrolujeme týdně.