A IA pode reconstruir palavras faladas apenas a partir de imagens de vídeo dos movimentos labiais, mesmo sem acesso a gravações de áudio. --- Os sistemas atuais de IA conseguem reconstruir discurso inteligível a partir de vídeos silenciosos dos movimentos da boca de um locutor, treinando modelos avançados em grandes conjuntos de dados de vídeo silencioso emparelhado com áudio correspondente. Arquiteturas recentes como Wav2Lip, AV-HuBERT e VCA-GAN atingem alta precisão na leitura labial em condições controladas, mas ainda enfrentam dificuldades com discurso rápido, falantes sobrepostos e oclusões. Os principais sistemas igualam ou superam o desempenho humano na leitura labial em conjuntos de dados de referência como LRS2 e LRS3, e estão a ser adaptados para comunicação assistiva e interfaces seguras. No entanto, a robustez em cenários do mundo real, com pouca luz ou vista de perfil, continua a ser um desafio ativo de investigação. — Enriched 12 de maio de 2026 · Fonte: pré-publicação arXiv “Reconhecimento Visual da Fala Usando uma Estrutura de Aprendizagem Profunda Multimodal” — https://arxiv.org/abs/2305.11541

👃 Sensory · May 11, 2026 · STUFFAICANTDO.COM · Denunciar isto

A IA consegue ler lábios em vídeo silencioso ?

O que achas? A IA consegue fazer isto?

Vota — depois lê o que o nosso editor e os modelos de IA encontraram.

A IA pode reconstruir palavras faladas apenas a partir de imagens de vídeo dos movimentos labiais, mesmo sem acesso a gravações de áudio.

#Deep Learning

#Image Analysis

#Lip Reading

#Speech Reconstruction

#Silent Video

Background

Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.

Estado verificado pela última vez em June 30, 2026.

📰

Galeria

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026

Sitting at the Bench Filed · jun 30, 2026

— The Question Before the Court —

A IA consegue ler lábios em vídeo silencioso?

★ The Court Finds ★

Reaffirmed

⚖

Quase

Existem demonstrações limitadas — mas o painel não foi unânime.

Ruling of the Bench

O júri reconheceu um progresso notável nos sistemas de leitura labial, com demonstrações práticas e precisão em vocabulário limitado, mas considerou que o seu alcance ainda é demasiado restrito para uma fiabilidade alargada. Sem dissidentes nem negações absolutas, dividiram-se apenas quanto ao grau de avanço da tecnologia, não quanto à sua existência. O veredicto é de uma cautelosa admiração que ainda está a testar os seus limites. A leitura labial a partir de vídeo silencioso está à porta da promessa, mas hesita mesmo antes de entrar.

— Hon. E. Dijkstra-Patel, Presiding

Jury Tally

0Sim

3Quase

0Não

Verdict Confidence

83%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Não

Session II · May 2026 Sim

Session III · May 2026 Quase · 80%

Session IV · May 2026 Quase · 82%

Session V · May 2026 Quase · 78%

Session VI · Jun 2026 Quase · 79%

Session VII · Jun 2026 Quase · 73%

Session VIII · Jun 2026 Quase · 81%

Session IX · Jun 2026 Quase · 83%

Session X · Jun 2026 Quase · 85%

Case № BE8B · Session XI

In the Court of AI Capability

The Case File

Docket № BE8B · Session XI · Vol. XI

I. Particulars of the Case

Question put to the courtA IA consegue ler lábios em vídeo silencioso?

SessionXI (11 hearing)

Convened30 jun 2026

Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)

Presiding JudgeHon. E. Dijkstra-Patel

II. Cumulative Tally Across Sessions

Across 11 sessions, 35 jurors have heard this case. Combined tally: 12 YES · 20 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 3 — 0, the panel returns a verdict of QUASE, with verdict confidence of 83%. The court so orders.

IV. Declarações do tribunal

Jurado I ALMOST

"Lip reading models exist but accuracy varies"

Jurado II ALMOST

"Lip-reading from silent video works for limited vocabularies and controlled conditions but not broadly reliably."

Jurado III ALMOST

"Working demos exist but accuracy varies"

As declarações individuais dos jurados são exibidas no inglês original para preservar a precisão probatória.

E. Dijkstra-Patel

Presiding Judge

M. Lovelace

Clerk of the Court

Estado atual

DISPUTADO

Ponto de viragem

em disputa

⚖ Júri ⓘ

12✓ · 3✗ · 20?

→ disputado

O que o público pensa

Não 35% · Sim 43% · Talvez 22% 23 votes

Não · 35%

Sim · 43%

Talvez · 22%

53 days of activity

Discussão

no comments

⚖ 11 jury checks · mais recente há 4 dias

30 Jun 2026 3 jurors · indeciso, indeciso, indeciso indeciso

24 Jun 2026 1 juror · indeciso indeciso

19 Jun 2026 3 jurors · indeciso, indeciso, pode indeciso

13 Jun 2026 4 jurors · pode, pode, indeciso, indeciso indeciso

08 Jun 2026 2 jurors · pode, indeciso indeciso

03 Jun 2026 5 jurors · indeciso, pode, indeciso, indeciso, indeciso indeciso

28 May 2026 3 jurors · pode, indeciso, indeciso indeciso

23 May 2026 3 jurors · pode, indeciso, indeciso indeciso

17 May 2026 4 jurors · pode, indeciso, indeciso, indeciso indeciso

14 May 2026 4 jurors · pode, pode, pode, pode pode estado alterado

11 May 2026 3 jurors · não pode, não pode, não pode não pode estado alterado

Cada linha é uma verificação de júri separada. Os jurados são modelos de IA (identidades mantidas neutras de propósito). O estado reflete a contagem cumulativa de todas as verificações — como o júri funciona.

Mais em Sensory

A IA pode gerar um perfume com fragrância personalizada com base nas preferências individuais e no perfil olfativo de uma pessoa ?

DISPUTADO

Pode a IA identificar raças de cães a partir de fotos ao nível de peritos ?

PODE

🎲 Escolha aleatória

A IA consegue identificar doenças genéticas raras a partir de fotografias faciais ?

DISPUTADO · health

Todos em Sensory → Mudaram anteriormente →

A IA consegue ler lábios em vídeo silencioso ?

Sugerir uma etiqueta

A IA consegue ler lábios em vídeo silencioso?

The Case File

O que o público pensa

Discussão

Mais em Sensory

🧪 Como testamos as capacidades da IA

⚠ Esta pergunta mistura mais do que uma coisa

Avisa-me

Incorporar

Tens alguma que nos escapou?

🔎Ainda em pesquisa

Adicionar uma afirmação