Kan AI lippen lezen uit stille video ?
Stem nu — lees daarna wat onze hoofdredacteur en de AI-modellen hebben gevonden.
AI kan gesproken woorden reconstrueren puur op basis van videobeelden van lipbewegingen, zelfs zonder toegang tot geluidsopnames.
Background
Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.
Stel een tag voor
Ontbreekt een concept bij dit onderwerp? Stel het voor en de beheerder bekijkt het.
Status voor het laatst gecontroleerd op June 24, 2026.
Galerie
Kan AI lippen lezen uit stille video?
Er bestaan beperkte demonstraties — maar het panel was niet unaniem.
Na het onderzoeken van het bewijsmateriaal kwam de jury tot de conclusie dat, hoewel het technisch mogelijk is om van lip te lezen vanuit een stille video, de nauwkeurigheid onzeker blijft in alles behalve ideale omstandigheden. De enige jurylid die "Bijna" stemde, wees op beginnende modellen die struikelen over accenten, slechte verlichting of snelle sprekers. Uitspraak voor "Bijna", met de hoopvolle herinnering dat de struikelpunten van vandaag de ondertiteling van morgen zijn. Onze uitspraak: Lip-leesmodellen kunnen een woord oppikken, maar nog steeds de zin missen.
After reviewing the evidence, the jury found that while lip-reading from silent video is technically possible, its accuracy remains shaky in anything but ideal conditions. The lone juror voting "Almost" pointed to fledgling models that stumble on accents, poor lighting, or quick speakers. Verdict for the "Almost," with the hopeful reminder that today’s stumbles are tomorrow’s subtitles. Our ruling: Lip-reading models can catch a word, but still miss the sentence.
But the data is real.
The Case File
Across 10 sessions, 32 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 3 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 1 — 0, the panel returns a verdict of BIJNA, with verdict confidence of 85%. The court so orders.
"Lip-reading models exist but are unreliable outside controlled settings."
Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.
Wat het publiek denkt
Nee 35% · Ja 43% · Misschien 22% 23 votesDiscussie
no comments⚖ 10 jury checks · meest recent 3 dagen geleden
Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.
Meer in Sensory
Kan AI beter getrainde mensen verslaan in liplezen ?
Kan AI een virtuele realiteitservaring creëren die de sensatie van geur en smaak op een realistische manier simuleert, waardoor gebruikers virtuele omgevingen op een meer meeslepende manier kunnen verkennen en ermee kunnen interageren ?
Kan AI radiologen overtreffen op bepaalde tumor-detectiebenchmarks ?