Stuff AI CAN'T Do

¿Puede la IA leer labios a partir de un video silencioso ?

¿Qué opinas?

La IA puede reconstruir palabras habladas únicamente a partir de imágenes de vídeo de los movimientos de los labios, incluso sin acceso a grabaciones de audio.


Los sistemas actuales de IA pueden reconstruir el habla inteligible a partir de vídeo mudo de los movimientos de la boca de un hablante mediante el entrenamiento de modelos profundos en grandes conjuntos de datos de vídeo mudo emparejado y audio correspondiente. Arquitecturas recientes como Wav2Lip, AV-HuBERT y VCA-GAN logran una alta precisión en lectura de labios en condiciones controladas, pero aún tienen dificultades con el habla rápida, hablantes superpuestos y oclusiones. Los mejores sistemas igualan o superan el rendimiento humano en lectura de labios en conjuntos de datos de referencia como LRS2 y LRS3, y se están adaptando para comunicación asistencial e interfaces seguras. Sin embargo, la robustez en escenarios del mundo real, con poca luz o vistas de perfil sigue siendo un desafío activo de investigación.

— Enriched 12 de mayo de 2026 · Fuente: preimpresión de arXiv "Reconocimiento Visual del Habla Usando un Marco de Aprendizaje Profundo Multimodal" — https://arxiv.org/abs/2305.11541

Estado verificado por última vez en May 11, 2026.

📰

Galería

AI NO PUEDE hacer esto todavía. · No estoy de acuerdo. envíenos pruebas

Lo que el público piensa

No 50% · Sí 25% · Quizás 25% 4 votes
No · 50%
Sí · 25%
Quizás · 25%
24 days of activity

Discusión

no comments

Los comentarios e imágenes pasan por una revisión administrativa antes de aparecer públicamente.

1 jury check · más reciente hace 2 días
11 May 2026 3 jurors · no puede, no puede, no puede no puede estado cambiado

Cada fila es una comprobación de jurado independiente. Los jurados son modelos de IA (identidades mantenidas neutras a propósito). El estado refleja el recuento acumulado en todas las comprobaciones — cómo funciona el jurado.

Más en Sensory

¿Nos faltó uno?

Revisamos semanalmente.