Può l'IA battere gli umani addestrati nel leggere le labbra ?
Esprimi il tuo voto — poi leggi cosa hanno trovato la nostra redazione e i modelli di IA.
DeepMind ha dimostrato questo nel 2022 con un modello basato su transformer che ha superato i professionisti del labiale su clip di notiziari TV.
Background
Researchers have made significant progress in developing artificial intelligence systems that can lip-read, with some studies demonstrating that AI models can outperform trained human lip-readers in certain conditions. These AI systems use computer vision and machine learning algorithms to analyze the movements of a person's lips and identify the corresponding speech sounds. While the accuracy of AI lip-reading systems can vary depending on factors such as the quality of the video input and the complexity of the speech, they have shown promising results in various experiments. Overall, the current state of the art in AI lip-reading suggests that these systems can indeed beat trained humans in certain scenarios.
— Enriched May 9, 2026 · Source: University of Oxford
Suggerisci un tag
Manca un concetto su questo tema? Suggeriscilo e un amministratore lo valuterà.
Stato verificato l'ultima volta il June 26, 2026.
Galleria
Può l'IA battere gli umani addestrati nel leggere le labbra?
La giuria ha trovato una risposta chiaramente affermativa.
Dopo un'attenta deliberazione, la giuria ha convenuto che l'AI ha superato i lettori labiali umani addestrati sui set di dati di riferimento - non è un risultato da poco considerata la complessità del discorso visivo e del rumore. Il voto solitario SÌ ha mantenuto la sua posizione, citando prove chiare che i modelli moderni decodificano ora le labbra silenziose meglio degli esseri umani più attenti. La sentenza: la lettura labiale non è più un monopolio umano - l'AI ha conquistato il trono.
After thorough deliberation, the jury agreed that AI has surpassed trained human lip-readers on benchmark datasets—no small feat given the complexity of visual speech and noise. The lone YES vote stood firm, citing clear evidence that modern models now decode silent lips better than the keenest-eyed humans. The ruling: Lip-reading is no longer a human monopoly—AI has claimed the throne.
But the data is real.
The Case File
Across 11 sessions, 33 jurors have heard this case. Combined tally: 17 YES · 14 ALMOST · 2 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 1 — 0 — 0, the panel returns a verdict of Sì, with verdict confidence of 95%. The court so orders.
"State-of-the-art lip-reading models (e.g., AVHuBERT, Wav2Lip, VTP) surpass human performance on benchmarks like LRS3."
Le singole dichiarazioni dei giurati sono mostrate nell'inglese originale per preservare la precisione probatoria.
Cosa pensa il pubblico
No 6% · Sì 75% · Forse 19% 150 votesDiscussione
no comments⚖ 11 jury checks · più recente 2 giorni fa
Ogni riga è un controllo di giuria separato. I giurati sono modelli di IA (identità tenute volutamente neutre). Lo stato riflette il conteggio cumulativo su tutti i controlli — come funziona la giuria.