Czy AI może pokonać wyszkolonych ludzi w czytaniu z ruchu warg ?
Oddaj swój głos — potem przeczytaj, co znalazł nasz redaktor i modele SI.
DeepMind zaprezentowało to w 2022 roku przy użyciu modelu opartego na transformerach, który przewyższył zawodowych czytelników z ust na fragmentach wiadomości telewizyjnych.
Background
Researchers have made significant progress in developing artificial intelligence systems that can lip-read, with some studies demonstrating that AI models can outperform trained human lip-readers in certain conditions. These AI systems use computer vision and machine learning algorithms to analyze the movements of a person's lips and identify the corresponding speech sounds. While the accuracy of AI lip-reading systems can vary depending on factors such as the quality of the video input and the complexity of the speech, they have shown promising results in various experiments. Overall, the current state of the art in AI lip-reading suggests that these systems can indeed beat trained humans in certain scenarios.
— Enriched May 9, 2026 · Source: University of Oxford
Zaproponuj tag
Brakuje pojęcia w tym temacie? Zaproponuj je, a administrator je rozważy.
Status sprawdzony ostatnio June 26, 2026.
Galeria
Czy AI może pokonać wyszkolonych ludzi w czytaniu z ruchu warg?
Jury udzieliło jednoznacznie twierdzącej odpowiedzi.
Po dokładnej analizie jury uznało, że AI przewyższył wykfalifikowanych ludzkich czytelników z ust na benchmarkowych zbiorach danych - nie mały wyczyn biorąc pod uwagę złożoność mowy wizualnej i hałasu. Jedyna głosowanie TAK stało twardo, cytując wyraźne dowody, że nowoczesne modele teraz dekodują milczące usta lepiej niż najbardziej bystrzy ludzie. Werdykt: czytanie z ust nie jest już monopolistycznie ludzkie - AI zdobył tron.
After thorough deliberation, the jury agreed that AI has surpassed trained human lip-readers on benchmark datasets—no small feat given the complexity of visual speech and noise. The lone YES vote stood firm, citing clear evidence that modern models now decode silent lips better than the keenest-eyed humans. The ruling: Lip-reading is no longer a human monopoly—AI has claimed the throne.
But the data is real.
The Case File
Across 11 sessions, 33 jurors have heard this case. Combined tally: 17 YES · 14 ALMOST · 2 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 1 — 0 — 0, the panel returns a verdict of TAK, with verdict confidence of 95%. The court so orders.
"State-of-the-art lip-reading models (e.g., AVHuBERT, Wav2Lip, VTP) surpass human performance on benchmarks like LRS3."
Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.
Co myśli publiczność
Nie 6% · Tak 75% · Może 19% 150 votesDyskusja
no comments⚖ 11 jury checks · najnowsze 2 dni temu
Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.