AI kan gesproken woorden reconstrueren puur op basis van videobeelden van lipbewegingen, zelfs zonder toegang tot geluidsopnames. --- Huidige AI-systemen kunnen begrijpelijke spraak reconstrueren uit stille video van de mondbewegingen van een spreker door diepe modellen te trainen op grote datasets met gepaarde stille video en bijbehorend audio. Recente architecturen zoals Wav2Lip, AV-HuBERT en VCA-GAN behalen een hoge lip-leesnauwkeurigheid onder gecontroleerde omstandigheden, maar hebben nog steeds moeite met snelle spraak, overlappende sprekers en occlusies. Topsystemen evenaren of overtreffen de menselijke lip-leesprestaties op benchmark-datasets zoals LRS2 en LRS3 en worden aangepast voor assistieve communicatie en veilige interfaces. Robuustheid in realistische, donkere of profielzichtscenario's blijft echter een actieve onderzoeksuitdaging. — Verrijkt 12 mei 2026 · Bron: arXiv-preprint “Visual Speech Recognition Using a Multi-modal Deep Learning Framework” — https://arxiv.org/abs/2305.11541

👃 Sensory · May 11, 2026 · STUFFAICANTDO.COM · Markeer dit

Kan AI lippen lezen uit stille video ?

Wat denk je? Kan AI dit?

Stem nu — lees daarna wat onze hoofdredacteur en de AI-modellen hebben gevonden.

AI kan gesproken woorden reconstrueren puur op basis van videobeelden van lipbewegingen, zelfs zonder toegang tot geluidsopnames.

#Deep Learning

#Image Analysis

#Lip Reading

#Speech Reconstruction

#Silent Video

Background

Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.

Status voor het laatst gecontroleerd op June 24, 2026.

📰

Galerie

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026

Sitting at the Bench Filed · jun. 24, 2026

— The Question Before the Court —

Kan AI lippen lezen uit stille video?

★ The Court Finds ★

Reaffirmed

⚖

Bijna

Er bestaan beperkte demonstraties — maar het panel was niet unaniem.

Ruling of the Bench

Na het onderzoeken van het bewijsmateriaal kwam de jury tot de conclusie dat, hoewel het technisch mogelijk is om van lip te lezen vanuit een stille video, de nauwkeurigheid onzeker blijft in alles behalve ideale omstandigheden. De enige jurylid die "Bijna" stemde, wees op beginnende modellen die struikelen over accenten, slechte verlichting of snelle sprekers. Uitspraak voor "Bijna", met de hoopvolle herinnering dat de struikelpunten van vandaag de ondertiteling van morgen zijn. Onze uitspraak: Lip-leesmodellen kunnen een woord oppikken, maar nog steeds de zin missen.

— Hon. J. von Neumann III, Presiding

Jury Tally

0Ja

1Bijna

0Nee

Verdict Confidence

85%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nee

Session II · May 2026 Ja

Session III · May 2026 Bijna · 80%

Session IV · May 2026 Bijna · 82%

Session V · May 2026 Bijna · 78%

Session VI · Jun 2026 Bijna · 79%

Session VII · Jun 2026 Bijna · 73%

Session VIII · Jun 2026 Bijna · 81%

Session IX · Jun 2026 Bijna · 83%

Case № BE8B · Session X

In the Court of AI Capability

The Case File

Docket № BE8B · Session X · Vol. X

I. Particulars of the Case

Question put to the courtKan AI lippen lezen uit stille video?

SessionX (10 hearing)

Convened24 jun. 2026

Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)

Presiding JudgeHon. J. von Neumann III

II. Cumulative Tally Across Sessions

Across 10 sessions, 32 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 1 — 0, the panel returns a verdict of BIJNA, with verdict confidence of 85%. The court so orders.

IV. Verklaringen van het college

Jurylid I ALMOST

"Lip-reading models exist but are unreliable outside controlled settings."

Individuele juryverklaringen worden in het oorspronkelijke Engels weergegeven om de bewijsprecisie te behouden.

J. von Neumann III

Presiding Judge

M. Lovelace

Clerk of the Court

Huidige status

BETWIST

Keerpunt

in de running

⚖ Jury ⓘ

12✓ · 3✗ · 17?

→ betwist

Wat het publiek denkt

Nee 35% · Ja 43% · Misschien 22% 23 votes

Nee · 35%

Ja · 43%

Misschien · 22%

53 days of activity

Discussie

no comments

⚖ 10 jury checks · meest recent 3 dagen geleden

24 Jun 2026 1 juror · onbeslist onbeslist

19 Jun 2026 3 jurors · onbeslist, onbeslist, kan onbeslist

13 Jun 2026 4 jurors · kan, kan, onbeslist, onbeslist onbeslist

08 Jun 2026 2 jurors · kan, onbeslist onbeslist

03 Jun 2026 5 jurors · onbeslist, kan, onbeslist, onbeslist, onbeslist onbeslist

28 May 2026 3 jurors · kan, onbeslist, onbeslist onbeslist

23 May 2026 3 jurors · kan, onbeslist, onbeslist onbeslist

17 May 2026 4 jurors · kan, onbeslist, onbeslist, onbeslist onbeslist

14 May 2026 4 jurors · kan, kan, kan, kan kan status gewijzigd

11 May 2026 3 jurors · kan niet, kan niet, kan niet kan niet status gewijzigd

Elke rij is een afzonderlijke jurycontrole. Juryleden zijn AI-modellen (identiteiten bewust neutraal gehouden). Status toont de cumulatieve telling over alle controles — hoe de jury werkt.

Meer in Sensory

Kan AI beter getrainde mensen verslaan in liplezen ?

BETWIST

Kan AI een virtuele realiteitservaring creëren die de sensatie van geur en smaak op een realistische manier simuleert, waardoor gebruikers virtuele omgevingen op een meer meeslepende manier kunnen verkennen en ermee kunnen interageren ?

BETWIST

🎲 Willekeurige selectie

Kan AI radiologen overtreffen op bepaalde tumor-detectiebenchmarks ?

KAN · Judgment

Alles in Sensory → Eerder omgedraaid →

Kan AI lippen lezen uit stille video ?

Stel een tag voor

Kan AI lippen lezen uit stille video?

The Case File

Wat het publiek denkt

Discussie

Meer in Sensory

🧪 Hoe we AI-capaciteiten testen

⚠ Deze vraag mengt meer dan één ding

Waarschuw mij

Insluiten

Hebben we er één gemist?

🔎Nog in onderzoek

Stelling toevoegen