AI kan rekonstruere talte ord udelukkende ud fra videomateriale af læbebevægelser, selv uden adgang til lydoptagelser. --- Nuværende AI-systemer kan rekonstruere forståelig tale ud fra tavse videoer af en talers mundbevægelser ved at træne dybe modeller på store datasæt med parrede tavse videoer og tilhørende lyd. Seneste arkitekturer som Wav2Lip, AV-HuBERT og VCA-GAN opnår høj læbeaflæsningsnøjagtighed under kontrollerede forhold, men kæmper stadig med hurtig tale, overlappende talere og okklusioner. Top-systemer matcher eller overgår menneskelig læbeaflæsningspræstation på benchmark-datasæt som LRS2 og LRS3 og tilpasses til assisterende kommunikation og sikre grænseflader. Dog forbliver robusthed i virkelige scenarier med lav belysning eller profilvisninger en aktiv forskningsudfordring. — Opdateret 12. maj 2026 · Kilde: arXiv-fortryk “Visual Speech Recognition Using a Multi-modal Deep Learning Framework” — https://arxiv.org/abs/2305.11541

👃 Sensory · May 11, 2026 · STUFFAICANTDO.COM · Rapportér dette

Kan AI læse læber fra lydløs video ?

Hvad mener du? Kan AI dette?

Afgiv din stemme — læs så hvad vores redaktør og AI-modellerne fandt.

AI kan rekonstruere talte ord udelukkende ud fra videomateriale af læbebevægelser, selv uden adgang til lydoptagelser.

#Deep Learning

#Image Analysis

#Lip Reading

#Speech Reconstruction

#Silent Video

Background

Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.

Status senest tjekket June 30, 2026.

📰

Galleri

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026

Sitting at the Bench Filed · jun. 30, 2026

— The Question Before the Court —

Kan AI læse læber fra lydløs video?

★ The Court Finds ★

Reaffirmed

⚖

Næsten

Snævre demoer findes — men panelet var ikke enigt.

Ruling of the Bench

Juryen anerkendte bemærkelsesværdige fremskridt inden for læbebevægelseslæssystemer med fungerende demonstrationer og begrænset-ordforråd-nøjagtighed, men fandt deres rækkevidde stadig for snæver til bred pålidelighed. Med ingen uenige og ingen direkte afvisninger splittede de kun om, hvor langt teknologien er kommet, ikke om den er ankommet. Dommen er en af forsigtig undren, der stadig tester sin fodfæste. Læbebevægelseslæsning fra tavs video står ved løftets tærskel, men lurer lige uden for døren.

— Hon. E. Dijkstra-Patel, Presiding

Jury Tally

0Ja

3Næsten

0Nej

Verdict Confidence

83%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nej

Session II · May 2026 Ja

Session III · May 2026 Næsten · 80%

Session IV · May 2026 Næsten · 82%

Session V · May 2026 Næsten · 78%

Session VI · Jun 2026 Næsten · 79%

Session VII · Jun 2026 Næsten · 73%

Session VIII · Jun 2026 Næsten · 81%

Session IX · Jun 2026 Næsten · 83%

Session X · Jun 2026 Næsten · 85%

Case № BE8B · Session XI

In the Court of AI Capability

The Case File

Docket № BE8B · Session XI · Vol. XI

I. Particulars of the Case

Question put to the courtKan AI læse læber fra lydløs video?

SessionXI (11 hearing)

Convened30 jun. 2026

Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)

Presiding JudgeHon. E. Dijkstra-Patel

II. Cumulative Tally Across Sessions

Across 11 sessions, 35 jurors have heard this case. Combined tally: 12 YES · 20 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 3 — 0, the panel returns a verdict of NæSTEN, with verdict confidence of 83%. The court so orders.

IV. Udtalelser fra dommerpanelet

Nævning I ALMOST

"Lip reading models exist but accuracy varies"

Nævning II ALMOST

"Lip-reading from silent video works for limited vocabularies and controlled conditions but not broadly reliably."

Nævning III ALMOST

"Working demos exist but accuracy varies"

Individuelle nævningers udtalelser vises på originalengelsk for at bevare bevismæssig præcision.

E. Dijkstra-Patel

Presiding Judge

M. Lovelace

Clerk of the Court

Aktuel tilstand

OMSTRIDT

Vendepunkt

omstridt

⚖ Jury ⓘ

12✓ · 3✗ · 20?

→ omstridt

Hvad publikum mener

Nej 35% · Ja 43% · Måske 22% 23 votes

Nej · 35%

Ja · 43%

Måske · 22%

53 days of activity

Diskussion

no comments

⚖ 11 jury checks · seneste for 4 dage siden

30 Jun 2026 3 jurors · uafklaret, uafklaret, uafklaret uafklaret

24 Jun 2026 1 juror · uafklaret uafklaret

19 Jun 2026 3 jurors · uafklaret, uafklaret, kan uafklaret

13 Jun 2026 4 jurors · kan, kan, uafklaret, uafklaret uafklaret

08 Jun 2026 2 jurors · kan, uafklaret uafklaret

03 Jun 2026 5 jurors · uafklaret, kan, uafklaret, uafklaret, uafklaret uafklaret

28 May 2026 3 jurors · kan, uafklaret, uafklaret uafklaret

23 May 2026 3 jurors · kan, uafklaret, uafklaret uafklaret

17 May 2026 4 jurors · kan, uafklaret, uafklaret, uafklaret uafklaret

14 May 2026 4 jurors · kan, kan, kan, kan kan status ændret

11 May 2026 3 jurors · kan ikke, kan ikke, kan ikke kan ikke status ændret

Hver række er et separat jurytjek. Nævninger er AI-modeller (identiteter holdt neutrale med vilje). Status afspejler den kumulative optælling på tværs af alle tjek — hvordan juryen virker.

Flere i Sensory

Kan AI finde meningsfulde mønstre i hjerneaktivitet ?

OMSTRIDT

Kan AI identificere en sang ud fra et 5-sekunders lydklip ?

KAN

🎲 Tilfældigt valg

Kan AI løse standardiserede logikpuslespil på top-procentniveau ?

KAN · Judgment

Alle i Sensory → Tidligere vendte →

Kan AI læse læber fra lydløs video ?

Foreslå et tag

Kan AI læse læber fra lydløs video?

The Case File

Hvad publikum mener

Diskussion

Flere i Sensory

🧪 Sådan tester vi AI-evner

⚠ Dette spørgsmål blander mere end én ting

Giv mig besked

Indlejr

Har du en vi gik glip af?

🔎Stadig under undersøgelse

Tilføj et udsagn