Kan AI læse læber fra lydløs video ?
Afgiv din stemme — læs så hvad vores redaktør og AI-modellerne fandt.
AI kan rekonstruere talte ord udelukkende ud fra videomateriale af læbebevægelser, selv uden adgang til lydoptagelser.
Nuværende AI-systemer kan rekonstruere forståelig tale ud fra tavse videoer af en talers mundbevægelser ved at træne dybe modeller på store datasæt med parrede tavse videoer og tilhørende lyd. Seneste arkitekturer som Wav2Lip, AV-HuBERT og VCA-GAN opnår høj læbeaflæsningsnøjagtighed under kontrollerede forhold, men kæmper stadig med hurtig tale, overlappende talere og okklusioner. Top-systemer matcher eller overgår menneskelig læbeaflæsningspræstation på benchmark-datasæt som LRS2 og LRS3 og tilpasses til assisterende kommunikation og sikre grænseflader. Dog forbliver robusthed i virkelige scenarier med lav belysning eller profilvisninger en aktiv forskningsudfordring.
— Opdateret 12. maj 2026 · Kilde: arXiv-fortryk “Visual Speech Recognition Using a Multi-modal Deep Learning Framework” — https://arxiv.org/abs/2305.11541
Foreslå et tag
Mangler et begreb i dette emne? Foreslå det, admin gennemgår.
Status senest tjekket May 14, 2026.
Galleri
Kan AI læse læber fra lydløs video?
Juryen fandt et klart bekræftende svar.
But the data is real.
The Case File
Across 2 sessions, 7 jurors have heard this case. Combined tally: 4 YES · 0 ALMOST · 3 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 4 — 0 — 0, the panel returns a verdict of JA, with verdict confidence of 100%. The court so orders. Verdict upgraded from prior session.
"Deep learning models can recognize lip patterns"
"Lip-reading models like Wav2Lip and LipNet achieve nontrivial accuracy on silent video inputs."
"AI systems like LipNet and those from DeepMind/Oxford demonstrated the ability to read lips from silent video, even outperforming humans on specific datasets."
"Deep learning models have demonstrated lip reading"
Individuelle nævningers udtalelser vises på originalengelsk for at bevare bevismæssig præcision.
Hvad publikum mener
Nej 40% · Ja 40% · Måske 20% 5 votesDiskussion
no comments⚖ 2 jury checks · seneste for 1 dag siden
Hver række er et separat jurytjek. Nævninger er AI-modeller (identiteter holdt neutrale med vilje). Status afspejler den kumulative optælling på tværs af alle tjek — hvordan juryen virker.