¿Puede la IA leer labios a partir de un video silencioso ?
Vota — luego lee lo que encontró nuestro editor y los modelos de IA.
La IA puede reconstruir palabras habladas únicamente a partir de imágenes de vídeo de los movimientos de los labios, incluso sin acceso a grabaciones de audio.
Background
Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.
Sugerir una etiqueta
¿Falta un concepto en este tema? Sugiérelo y el administrador lo revisará.
Estado verificado por última vez en June 24, 2026.
Galería
¿Puede la IA leer labios a partir de un video silencioso?
Existen demostraciones limitadas — pero el panel no fue unánime.
After reviewing the evidence, the jury found that while lip-reading from silent video is technically possible, its accuracy remains shaky in anything but ideal conditions. The lone juror voting "Almost" pointed to fledgling models that stumble on accents, poor lighting, or quick speakers. Verdict for the "Almost," with the hopeful reminder that today’s stumbles are tomorrow’s subtitles. Our ruling: Lip-reading models can catch a word, but still miss the sentence.
But the data is real.
The Case File
Across 10 sessions, 32 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 3 NO · 0 IN RESEARCH.
Note: cumulative includes older juror opinions. The current session tally above is the live verdict.
By a vote of 0 — 1 — 0, the panel returns a verdict of CASI, with verdict confidence of 85%. The court so orders.
"Lip-reading models exist but are unreliable outside controlled settings."
Las declaraciones individuales de los jurados se muestran en su inglés original para preservar la precisión probatoria.
Lo que el público piensa
No 35% · Sí 43% · Quizás 22% 23 votesDiscusión
no comments⚖ 10 jury checks · más reciente hace 3 días
Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.
Más en Sensory
¿Puede la IA crear una experiencia de realidad virtual que simule de manera realista la sensación de olfato y gusto, permitiendo a los usuarios explorar e interactuar con entornos virtuales de forma más inmersiva ?
¿Puede la IA transcribir inglés hablado con una precisión del 95% o más en audio limpio ?
¿Qué deportes tienen más probabilidades de que la IA pueda precalcular o predeterminar el resultado ?