Kan AI lippen lezen uit stille video ?
Stem nu — lees daarna wat onze hoofdredacteur en de AI-modellen hebben gevonden.
AI kan gesproken woorden reconstrueren puur op basis van videobeelden van lipbewegingen, zelfs zonder toegang tot geluidsopnames.
Background
Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.
Stel een tag voor
Ontbreekt een concept bij dit onderwerp? Stel het voor en de beheerder bekijkt het.
Status voor het laatst gecontroleerd op June 30, 2026.
Galerie
Kan AI lippen lezen uit stille video?
Er bestaan beperkte demonstraties — maar het panel was niet unaniem.
De jury erkende opmerkelijke vooruitgang in lip-leessystemen, met werkende demo's en nauwkeurigheid met een beperkt vocabulaire, maar vond dat hun bereik nog steeds te smal is voor brede betrouwbaarheid. Zonder afwijkende meningen en zonder volledige ontkenning, verdeelden ze zich alleen over hoe ver de technologie is gekomen, niet of deze is aangekomen. Het vonnis is een van voorzichtige verwondering die nog steeds haar voetstap test. Lip-lezen van stille video staat op de drempel van belofte, maar blijft net voor de deur hangen.
The jury acknowledged remarkable progress in lip-reading systems, with working demos and limited-vocabulary accuracy, but found their reach still too narrow for broad reliability. With no dissenters and no outright denials, they split only on how far the technology has come, not whether it has arrived. The verdict is one of cautious wonder still testing its footing. Lip-reading from silent video stands at the threshold of promise, yet lingers just shy of the door.
But the data is real.
The Case File
Across 11 sessions, 35 jurors have heard this case. Combined tally: 12 YES · 20 ALMOST · 3 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 3 — 0, the panel returns a verdict of BIJNA, with verdict confidence of 83%. The court so orders.
"Lip reading models exist but accuracy varies"
"Lip-reading from silent video works for limited vocabularies and controlled conditions but not broadly reliably."
"Working demos exist but accuracy varies"
Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.
Wat het publiek denkt
Nee 35% · Ja 43% · Misschien 22% 23 votesDiscussie
no comments⚖ 11 jury checks · meest recent 4 dagen geleden
Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.
Meer in Sensory
Kan AI een gepersonaliseerde ASMR-ervaring creëren die een ontspannende reactie bij een luisteraar oproept ?
Kan AI alle individuele gesprekken extraheren uit opnames van een menigte mensen ?
Kan AI depressie detecteren aan de hand van subtiele veranderingen in gezichtsmicro-expressies bij videogesprekken ?