AI kan gesproken woorden reconstrueren puur op basis van videobeelden van lipbewegingen, zelfs zonder toegang tot geluidsopnames. --- Huidige AI-systemen kunnen begrijpelijke spraak reconstrueren uit stille video van de mondbewegingen van een spreker door diepe modellen te trainen op grote datasets met gepaarde stille video en bijbehorend audio. Recente architecturen zoals Wav2Lip, AV-HuBERT en VCA-GAN behalen een hoge lip-leesnauwkeurigheid onder gecontroleerde omstandigheden, maar hebben nog steeds moeite met snelle spraak, overlappende sprekers en occlusies. Topsystemen evenaren of overtreffen de menselijke lip-leesprestaties op benchmark-datasets zoals LRS2 en LRS3 en worden aangepast voor assistieve communicatie en veilige interfaces. Robuustheid in realistische, donkere of profielzichtscenario's blijft echter een actieve onderzoeksuitdaging. — Verrijkt 12 mei 2026 · Bron: arXiv-preprint “Visual Speech Recognition Using a Multi-modal Deep Learning Framework” — https://arxiv.org/abs/2305.11541

👃 Sensory · May 11, 2026 · STUFFAICANTDO.COM · Markeer dit

Kan AI lippen lezen uit stille video ?

Wat denk je? Kan AI dit?

Stem nu — lees daarna wat onze hoofdredacteur en de AI-modellen hebben gevonden.

AI kan gesproken woorden reconstrueren puur op basis van videobeelden van lipbewegingen, zelfs zonder toegang tot geluidsopnames.

#Deep Learning

#Image Analysis

#Lip Reading

#Speech Reconstruction

#Silent Video

Background

Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.

Status voor het laatst gecontroleerd op June 30, 2026.

📰

Galerie

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026

Sitting at the Bench Filed · jun. 30, 2026

— The Question Before the Court —

Kan AI lippen lezen uit stille video?

★ The Court Finds ★

Reaffirmed

⚖

Bijna

Er bestaan beperkte demonstraties — maar het panel was niet unaniem.

Ruling of the Bench

De jury erkende opmerkelijke vooruitgang in lip-leessystemen, met werkende demo's en nauwkeurigheid met een beperkt vocabulaire, maar vond dat hun bereik nog steeds te smal is voor brede betrouwbaarheid. Zonder afwijkende meningen en zonder volledige ontkenning, verdeelden ze zich alleen over hoe ver de technologie is gekomen, niet of deze is aangekomen. Het vonnis is een van voorzichtige verwondering die nog steeds haar voetstap test. Lip-lezen van stille video staat op de drempel van belofte, maar blijft net voor de deur hangen.

— Hon. E. Dijkstra-Patel, Presiding

Jury Tally

0Ja

3Bijna

0Nee

Verdict Confidence

83%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nee

Session II · May 2026 Ja

Session III · May 2026 Bijna · 80%

Session IV · May 2026 Bijna · 82%

Session V · May 2026 Bijna · 78%

Session VI · Jun 2026 Bijna · 79%

Session VII · Jun 2026 Bijna · 73%

Session VIII · Jun 2026 Bijna · 81%

Session IX · Jun 2026 Bijna · 83%

Session X · Jun 2026 Bijna · 85%

Case № BE8B · Session XI

In the Court of AI Capability

The Case File

Docket № BE8B · Session XI · Vol. XI

I. Particulars of the Case

Question put to the courtKan AI lippen lezen uit stille video?

SessionXI (11 hearing)

Convened30 jun. 2026

Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)

Presiding JudgeHon. E. Dijkstra-Patel

II. Cumulative Tally Across Sessions

Across 11 sessions, 35 jurors have heard this case. Combined tally: 12 YES · 20 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 3 — 0, the panel returns a verdict of BIJNA, with verdict confidence of 83%. The court so orders.

IV. Verklaringen van het college

Jurylid I ALMOST

"Lip reading models exist but accuracy varies"

Jurylid II ALMOST

"Lip-reading from silent video works for limited vocabularies and controlled conditions but not broadly reliably."

Jurylid III ALMOST

"Working demos exist but accuracy varies"

Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.

E. Dijkstra-Patel

Presiding Judge

M. Lovelace

Clerk of the Court

Huidige status

BETWIST

Keerpunt

in de running

⚖ Jury ⓘ

12✓ · 3✗ · 20?

→ betwist

Wat het publiek denkt

Nee 35% · Ja 43% · Misschien 22% 23 votes

Nee · 35%

Ja · 43%

Misschien · 22%

53 days of activity

Discussie

no comments

⚖ 11 jury checks · meest recent 4 dagen geleden

30 Jun 2026 3 jurors · onbeslist, onbeslist, onbeslist onbeslist

24 Jun 2026 1 juror · onbeslist onbeslist

19 Jun 2026 3 jurors · onbeslist, onbeslist, kan onbeslist

13 Jun 2026 4 jurors · kan, kan, onbeslist, onbeslist onbeslist

08 Jun 2026 2 jurors · kan, onbeslist onbeslist

03 Jun 2026 5 jurors · onbeslist, kan, onbeslist, onbeslist, onbeslist onbeslist

28 May 2026 3 jurors · kan, onbeslist, onbeslist onbeslist

23 May 2026 3 jurors · kan, onbeslist, onbeslist onbeslist

17 May 2026 4 jurors · kan, onbeslist, onbeslist, onbeslist onbeslist

14 May 2026 4 jurors · kan, kan, kan, kan kan status gewijzigd

11 May 2026 3 jurors · kan niet, kan niet, kan niet kan niet status gewijzigd

Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.

Meer in Sensory

Kan AI een gepersonaliseerde ASMR-ervaring creëren die een ontspannende reactie bij een luisteraar oproept ?

BETWIST

Kan AI alle individuele gesprekken extraheren uit opnames van een menigte mensen ?

BETWIST

🎲 Willekeurige selectie

Kan AI depressie detecteren aan de hand van subtiele veranderingen in gezichtsmicro-expressies bij videogesprekken ?

BETWIST · Emotional

Alles in Sensory → Eerder omgedraaid →

Kan AI lippen lezen uit stille video ?

Stel een tag voor

Kan AI lippen lezen uit stille video?

The Case File

Wat het publiek denkt

Discussie

Meer in Sensory

🧪 Hoe we AI-capaciteiten testen

⚠ Deze vraag mengt meer dan één ding

Waarschuw mij

Insluiten

Hebben we er één gemist?

🔎Nog in onderzoek

Stelling toevoegen