🔥 Hot topics · Ne peut PAS faire · Peut faire · § The Court · Bascules récentes · 📈 Calendrier · Demander · Éditoriaux · 🔥 Hot topics · Ne peut PAS faire · Peut faire · § The Court · Bascules récentes · 📈 Calendrier · Demander · Éditoriaux
Stuff AI CAN'T Do

L'IA peut-elle identifier le sarcasme dans un texte écrit de manière fiable ?

Qu'en penses-tu ?

Longtemps un problème difficile ; principalement résolu par les LLMs contextuels de 2023. Les cas limites persistent, mais la détection quotidienne est opérationnelle.

Background

State-of-the-art models such as PaLM 2 and LLaMA 3 show measurable improvements in detecting sarcasm when fine-tuned on curated datasets like the Sarcasm on Reddit corpus, outperforming earlier systems by roughly 12–15 percentage points on balanced test sets. Evidence from controlled benchmarks indicates that accuracy can reach the mid-70 % range when models are trained on explicit contextual markers and user history annotations, yet these gains evaporate when sarcasm relies on shared cultural references that lie outside the training domain. Named systems including RoBERTa-base and DeBERTa-v3 have set milestones by leveraging contrastive attention over incongruent sentiment spans, while newer variants such as Mistral-7B-Instruct achieve better zero-shot transfer by treating sarcasm detection as a multi-hop inference task. A key limitation remains the scarcity of large, diverse, and culturally inclusive datasets, as current resources over-represent Western English forums and under-sample ironic expressions in low-resource languages or niche communities.

SOURCE: Nature, 2024

Statut vérifié le June 26, 2026.

📰

Galerie

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026
Sitting at the Bench Filed · juin 26, 2026
— The Question Before the Court —

L'IA peut-elle identifier le sarcasme dans un texte écrit de manière fiable ?

★ The Court Finds ★
Reaffirmed
Presque

Des démonstrations limitées existent — mais le jury n'était pas unanime.

Ruling of the Bench

Le jury a estimé que la tâche d'identifier de manière fiable le sarcasme dans tous les textes écrits était séduisante et à portée de main, mais qu'en pratique, elle restait désespérément insaisissable, les jurés reconnaissant que les modèles actuels peuvent détecter le sarcasme dans des contextes restreints mais butent face à la prose sauvage et désordonnée de la vie quotidienne. Une impasse légère s'est formée entre un optimisme prudent et les limites pratiques, sans qu'aucune voix ne s'élève pour un déni catégorique ou une demande de récusation supplémentaire. Le tribunal statue : l'IA peut entendre le roulis des yeux, mais rate encore la moitié du sarcasme dans la pièce.

— Hon. G. Hopper, Presiding
Jury Tally
0Oui
2Presque
0Non
Verdict Confidence
78%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Non
Session II · May 2026 Non
Session III · May 2026 Presque · 72%
Session IV · May 2026 Presque · 76%
Session V · May 2026 Presque · 78%
Session VI · May 2026 Presque · 73%
Session VII · Jun 2026 Presque · 73%
Session VIII · Jun 2026 Presque · 70%
Session IX · Jun 2026 Presque · 73%
Session X · Jun 2026 Presque · 78%
Case № DE44 · Session XI
In the Court of AI Capability

The Case File

Docket № DE44 · Session XI · Vol. XI
I. Particulars of the Case
Question put to the courtL'IA peut-elle identifier le sarcasme dans un texte écrit de manière fiable ?
SessionXI (11 hearing)
Convened26 juin 2026
Previously ruledNO (May '26) → NO (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)
Presiding JudgeHon. G. Hopper
II. Cumulative Tally Across Sessions

Across 11 sessions, 31 jurors have heard this case. Combined tally: 0 YES · 25 ALMOST · 6 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 2 — 0, the panel returns a verdict of PRESQUE, with verdict confidence of 78%. The court so orders.

IV. Déclarations du tribunal
Juré I ALMOST

"State-of-art models can detect sarcasm in limited contexts"

Juré II ALMOST

"sarcasm detection works in limited contexts but not reliably across general text."

Les déclarations individuelles des jurés sont affichées dans leur anglais d'origine afin de préserver la précision probatoire.

G. Hopper
Presiding Judge
M. Lovelace
Clerk of the Court

Ce que le public pense

Non 16% · Oui 84% · Peut-être 0% 306 votes
Non · 16%
Oui · 84%
15 days of activity

Discussion

no comments

Les commentaires et les images passent par une révision administrative avant d'apparaître publiquement.

11 jury checks · plus récent il y a 2 jours
26 Jun 2026 2 jurors · indécis, indécis indécis
21 Jun 2026 2 jurors · indécis, indécis indécis
15 Jun 2026 2 jurors · indécis, indécis indécis
10 Jun 2026 3 jurors · indécis, indécis, indécis indécis
04 Jun 2026 3 jurors · indécis, indécis, indécis indécis
30 May 2026 3 jurors · indécis, indécis, indécis indécis
25 May 2026 3 jurors · indécis, indécis, indécis indécis
19 May 2026 4 jurors · indécis, indécis, indécis, indécis indécis
15 May 2026 3 jurors · indécis, indécis, indécis indécis statut modifié
12 May 2026 3 jurors · ne peut pas, ne peut pas, ne peut pas ne peut pas
11 May 2026 3 jurors · ne peut pas, ne peut pas, ne peut pas ne peut pas statut modifié

Chaque ligne est une vérification du jury distincte. Les jurés sont des modèles d'IA (identités gardées neutres à dessein). Le statut reflète le décompte cumulé sur toutes les vérifications — comment fonctionne le jury.

Plus dans Judgment

Une que nous avons oubliée ?

Nous faisons une revue hebdomadaire.