Czy AI może pokonać wyszkolonych ludzi w czytaniu z ruchu warg ?
Oddaj swój głos — potem przeczytaj, co znalazł nasz redaktor i modele SI.
DeepMind zaprezentowało to w 2022 roku przy użyciu modelu opartego na transformerach, który przewyższył zawodowych czytelników z ust na fragmentach wiadomości telewizyjnych.
Background
Researchers have made significant progress in developing artificial intelligence systems that can lip-read, with some studies demonstrating that AI models can outperform trained human lip-readers in certain conditions. These AI systems use computer vision and machine learning algorithms to analyze the movements of a person's lips and identify the corresponding speech sounds. While the accuracy of AI lip-reading systems can vary depending on factors such as the quality of the video input and the complexity of the speech, they have shown promising results in various experiments. Overall, the current state of the art in AI lip-reading suggests that these systems can indeed beat trained humans in certain scenarios.
— Enriched May 9, 2026 · Source: University of Oxford
Zaproponuj tag
Brakuje pojęcia w tym temacie? Zaproponuj je, a administrator je rozważy.
Status sprawdzony ostatnio July 2, 2026.
Galeria
Czy AI może pokonać wyszkolonych ludzi w czytaniu z ruchu warg?
Istnieją wąskie dema — ale skład nie był jednomyślny.
Po burzliwej debacie ławy przysięgłych, umiejętności czytania z ruchu warg przez AI uznano za godne pochwały, jednak nie certyfikowano jeszcze ich do praktycznego stosowania w sądzie ze względu na brak płynności w realnych warunkach. Zauważono wąskie zwycięstwa w testach porównawczych, ale także trwałą zawodność w sytuacjach poza laboratoryjnymi. Jedyny ławnik głosujący „tak” wskazywał na sukcesy w testach, podczas gdy pozostali, którzy głosowali „prawie”, podkreślali nierówną wydajność poza idealnymi warunkami laboratoryjnymi. Orzeczenie: „Filmy nieme nie są już nieme, ale napisy wciąż mają swoje miejsce.”
After spirited debate, the jury found AI’s lip-reading skills commendable but not yet court-certified for real-world fluency, spotting narrow victories on benchmarks alongside persistent brittleness in the wild. The lone “yes” juror pointed to benchmark triumphs, while the “almost” holdouts stressed uneven performance outside lab-perfect conditions. Ruling: “Silent films are no longer silent, but subtitles still have their day.”
But the data is real.
The Case File
Across 12 sessions, 36 jurors have heard this case. Combined tally: 18 YES · 16 ALMOST · 2 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 1 — 2 — 0, the panel returns a verdict of PRAWIE, with verdict confidence of 87%. The court so orders. Verdict downgraded from prior session.
"AI lip-reading models exist but accuracy varies"
"Lip-reading AI systems like AVSpeech and LipNet have surpassed human performance on benchmark datasets."
"AI lip-reading demos exist but are narrow"
Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.
Co myśli publiczność
Nie 6% · Tak 75% · Może 19% 150 votesDyskusja
no comments⚖ 12 jury checks · najnowsze 2 dni temu
Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.
Więcej w Sensory
Czy AI może replikować ludzki śmiech z 95% postrzeganą autentycznością w krótkim fragmencie audio ?
Czy AI może rozpoznać gatunki ptaków na podstawie 1-sekundowego nagrania dźwiękowego ?
Czy AI może ugotować pięciodaniowe menu degustacyjne w prawdziwej działającej kuchni, samodzielnie ?