AI kan rekonstruera talade ord enbart från videomaterial av läpprörelser, även utan tillgång till ljudinspelningar. --- Nuvarande AI-system kan rekonstruera begripligt tal från ljudlös video av en talares läpprörelser genom att träna djupa modeller på stora dataset med par av ljudlös video och motsvarande ljud. Nya arkitekturer som Wav2Lip, AV-HuBERT och VCA-GAN uppnår hög läppläsningsnoggrannhet under kontrollerade förhållanden men har fortfarande svårt med snabbt tal, överlappande talare och ocklusioner. De främsta systemen matchar eller överträffar mänsklig läppläsningsprestation på benchmark-dataset som LRS2 och LRS3, och anpassas för hjälpmedelskommunikation och säkra gränssnitt. Robusthet i verkliga scenarier, låg ljus eller profilvy förblir dock en aktiv forskningsutmaning. — Uppdaterad 12 maj 2026 · Källa: arXiv förtryck "Visual Speech Recognition Using a Multi-modal Deep Learning Framework" — https://arxiv.org/abs/2305.11541

👃 Sensory · May 11, 2026 · STUFFAICANTDO.COM · Rapportera detta

Kan AI läsa läppar från ljudlös video ?

Vad tycker du? Kan AI detta?

Lägg din röst — läs sedan vad vår redaktör och AI-modellerna hittat.

AI kan rekonstruera talade ord enbart från videomaterial av läpprörelser, även utan tillgång till ljudinspelningar.

#Deep Learning

#Image Analysis

#Lip Reading

#Speech Reconstruction

#Silent Video

Background

Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.

Status senast kontrollerad June 30, 2026.

📰

Galleri

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026

Sitting at the Bench Filed · jun 30, 2026

— The Question Before the Court —

Kan AI läsa läppar från ljudlös video?

★ The Court Finds ★

Reaffirmed

⚖

Nästan

Begränsade demonstrationer finns — men juryn var inte enig.

Ruling of the Bench

Juryn erkände anmärkningsamma framsteg inom läppläsningssystem, med fungerande demonstrationer och begränsad vokabulärnoggrannhet, men fann att deras räckvidd fortfarande är för snäv för bred tillförlitlighet. Utan några avvikande röster och inga totala förnekanden delade de endast i hur långt tekniken har kommit, inte om den har anlänt. Domen är en av försiktig förundran som fortfarande testar sin fotfäste. Att läsa läppar från tyst video står på tröskeln till löfte, men dröjer sig kvar precis innanför dörren.

— Hon. E. Dijkstra-Patel, Presiding

Jury Tally

0Ja

3Nästan

0Nej

Verdict Confidence

83%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nej

Session II · May 2026 Ja

Session III · May 2026 Nästan · 80%

Session IV · May 2026 Nästan · 82%

Session V · May 2026 Nästan · 78%

Session VI · Jun 2026 Nästan · 79%

Session VII · Jun 2026 Nästan · 73%

Session VIII · Jun 2026 Nästan · 81%

Session IX · Jun 2026 Nästan · 83%

Session X · Jun 2026 Nästan · 85%

Case № BE8B · Session XI

In the Court of AI Capability

The Case File

Docket № BE8B · Session XI · Vol. XI

I. Particulars of the Case

Question put to the courtKan AI läsa läppar från ljudlös video?

SessionXI (11 hearing)

Convened30 jun 2026

Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)

Presiding JudgeHon. E. Dijkstra-Patel

II. Cumulative Tally Across Sessions

Across 11 sessions, 35 jurors have heard this case. Combined tally: 12 YES · 20 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 3 — 0, the panel returns a verdict of NäSTAN, with verdict confidence of 83%. The court so orders.

IV. Uttalanden från rätten

Jurymedlem I ALMOST

"Lip reading models exist but accuracy varies"

Jurymedlem II ALMOST

"Lip-reading from silent video works for limited vocabularies and controlled conditions but not broadly reliably."

Jurymedlem III ALMOST

"Working demos exist but accuracy varies"

Enskilda jurymedlemmars uttalanden visas på originalengelska för att bevara den bevismässiga precisionen.

E. Dijkstra-Patel

Presiding Judge

M. Lovelace

Clerk of the Court

Aktuellt läge

OMTVISTAT

Vändpunkt

omdebatterat

⚖ Jury ⓘ

12✓ · 3✗ · 20?

→ omtvistat

Vad publiken tycker

Nej 35% · Ja 43% · Kanske 22% 23 votes

Nej · 35%

Ja · 43%

Kanske · 22%

53 days of activity

Diskussion

no comments

⚖ 11 jury checks · senaste för 4 dagar sedan

30 Jun 2026 3 jurors · oavgjort, oavgjort, oavgjort oavgjort

24 Jun 2026 1 juror · oavgjort oavgjort

19 Jun 2026 3 jurors · oavgjort, oavgjort, kan oavgjort

13 Jun 2026 4 jurors · kan, kan, oavgjort, oavgjort oavgjort

08 Jun 2026 2 jurors · kan, oavgjort oavgjort

03 Jun 2026 5 jurors · oavgjort, kan, oavgjort, oavgjort, oavgjort oavgjort

28 May 2026 3 jurors · kan, oavgjort, oavgjort oavgjort

23 May 2026 3 jurors · kan, oavgjort, oavgjort oavgjort

17 May 2026 4 jurors · kan, oavgjort, oavgjort, oavgjort oavgjort

14 May 2026 4 jurors · kan, kan, kan, kan kan status ändrad

11 May 2026 3 jurors · kan inte, kan inte, kan inte kan inte status ändrad

Varje rad är en separat jurykontroll. Jurymedlemmar är AI-modeller (identiteter avsiktligt neutrala). Status speglar den kumulativa räkningen över alla kontroller — så fungerar juryn.

Fler i Sensory

Kan AI se vilka frukter i en livsmedelsbutik som snart kommer att bli dåliga ?

OMTVISTAT

Kan AI identifiera fågelarter från en 1-sekunders ljudinspelning ?

KAN

🎲 Slumpvist val

Kan AI förutsäga resultatet av ett lands nationella val baserat på sociala mediers sentiment och ekonomiska indikatorer ?

OMTVISTAT · politics

Alla i Sensory → Tidigare vända →

Kan AI läsa läppar från ljudlös video ?

Föreslå en tagg

Kan AI läsa läppar från ljudlös video?

The Case File

Vad publiken tycker

Diskussion

Fler i Sensory

🧪 Hur vi testar AI-förmågor

⚠ Denna fråga blandar mer än en sak

Varna mig

Bädda in

Har du en vi missat?

🔎Undersöker fortfarande

Lägg till ett påstående