Può l'IA battere gli umani addestrati nel leggere le labbra ?
Esprimi il tuo voto — poi leggi cosa hanno trovato la nostra redazione e i modelli di IA.
DeepMind ha dimostrato questo nel 2022 con un modello basato su transformer che ha superato i professionisti del labiale su clip di notiziari TV.
Background
Researchers have made significant progress in developing artificial intelligence systems that can lip-read, with some studies demonstrating that AI models can outperform trained human lip-readers in certain conditions. These AI systems use computer vision and machine learning algorithms to analyze the movements of a person's lips and identify the corresponding speech sounds. While the accuracy of AI lip-reading systems can vary depending on factors such as the quality of the video input and the complexity of the speech, they have shown promising results in various experiments. Overall, the current state of the art in AI lip-reading suggests that these systems can indeed beat trained humans in certain scenarios.
— Enriched May 9, 2026 · Source: University of Oxford
Suggerisci un tag
Manca un concetto su questo tema? Suggeriscilo e un amministratore lo valuterà.
Stato verificato l'ultima volta il July 2, 2026.
Galleria
Può l'IA battere gli umani addestrati nel leggere le labbra?
Esistono dimostrazioni limitate — ma il collegio non è stato unanime.
Dopo un acceso dibattito, la giuria ha giudicato encomiabili le capacità di lettura labiale dell'IA, ma non ancora certificate per un uso fluido in contesti reali, rilevando vittorie di stretta misura nei benchmark insieme a una persistente fragilità in situazioni non controllate. L’unico giurato favorevole ha sottolineato i successi nei benchmark, mentre i dissenzienti "quasi" hanno evidenziato prestazioni disomogenee al di fuori delle condizioni perfette di laboratorio. Decisione: "I film muti non sono più muti, ma i sottotitoli hanno ancora il loro spazio."
After spirited debate, the jury found AI’s lip-reading skills commendable but not yet court-certified for real-world fluency, spotting narrow victories on benchmarks alongside persistent brittleness in the wild. The lone “yes” juror pointed to benchmark triumphs, while the “almost” holdouts stressed uneven performance outside lab-perfect conditions. Ruling: “Silent films are no longer silent, but subtitles still have their day.”
But the data is real.
The Case File
Across 12 sessions, 36 jurors have heard this case. Combined tally: 18 YES · 16 ALMOST · 2 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 1 — 2 — 0, the panel returns a verdict of QUASI, with verdict confidence of 87%. The court so orders. Verdict downgraded from prior session.
"AI lip-reading models exist but accuracy varies"
"Lip-reading AI systems like AVSpeech and LipNet have surpassed human performance on benchmark datasets."
"AI lip-reading demos exist but are narrow"
Le singole dichiarazioni dei giurati sono mostrate nell'inglese originale per preservare la precisione probatoria.
Cosa pensa il pubblico
No 6% · Sì 75% · Forse 19% 150 votesDiscussione
no comments⚖ 12 jury checks · più recente 2 giorni fa
Ogni riga è un controllo di giuria separato. I giurati sono modelli di IA (identità tenute volutamente neutre). Lo stato riflette il conteggio cumulativo su tutti i controlli — come funziona la giuria.