AI poate reconstrui cuvinte rostite exclusiv din înregistrări video ale mișcărilor buzelor, chiar și fără acces la înregistrări audio. --- Sistemele actuale de AI pot reconstrui vorbirea inteligibilă din video mute ale mișcărilor gurii vorbitorului prin antrenarea modelelor profunde pe seturi mari de date cu video mute și audio corespunzător. Arhitecturi recente precum Wav2Lip, AV-HuBERT și VCA-GAN ating o acuratețe ridicată în citirea pe buze în condiții controlate, dar încă se confruntă cu vorbirea rapidă, vorbitori suprapuși și occlusions. Sistemele de top egalează sau depășesc performanța umană de citire pe buze pe seturi de date de referință precum LRS2 și LRS3 și sunt adaptate pentru comunicare asistivă și interfețe securizate. Totuși, robustețea în scenarii din lumea reală, cu lumină scăzută sau vedere de profil rămâne o provocare activă de cercetare. — Actualizat la 12 mai 2026 · Sursă: preprint arXiv „Recunoașterea Vorbirii Vizuale Utilizând un Cadru de Deep Learning Multi-modal” — https://arxiv.org/abs/2305.11541

👃 Sensory · May 11, 2026 · STUFFAICANTDO.COM · Raportează asta

Poate AI citi buzele dintr-un videoclip fără sunet ?

Tu ce crezi? Poate IA face asta?

Dă-ți votul — apoi citește ce au găsit editorul nostru și modelele IA.

AI poate reconstrui cuvinte rostite exclusiv din înregistrări video ale mișcărilor buzelor, chiar și fără acces la înregistrări audio.

#Deep Learning

#Image Analysis

#Lip Reading

#Speech Reconstruction

#Silent Video

Background

Current AI systems reconstruct intelligible speech from silent video of a talker’s mouth movements by training deep models on large datasets of paired silent video and corresponding audio. Recent architectures such as Wav2Lip, AV-HuBERT, and VCA-GAN achieve high lip-reading accuracy in controlled conditions but still struggle with fast speech, overlapping speakers, and occlusions. Top systems match or exceed human lip-reading performance on benchmark datasets like LRS2 and LRS3, and are being adapted for assistive communication and secure interfaces. However, robustness in real-world, low-light, or profile-view scenarios remains an active research challenge.

Status verificat ultima dată pe June 24, 2026.

📰

Galerie

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026May 2026May 2026May 2026Jun 2026Jun 2026Jun 2026Jun 2026Jun 2026

Sitting at the Bench Filed · iun. 24, 2026

— The Question Before the Court —

Poate AI citi buzele dintr-un videoclip fără sunet?

★ The Court Finds ★

Reaffirmed

⚖

Aproape

Există demonstrații limitate — dar completul nu a fost unanim.

Ruling of the Bench

După examinarea probelor, juriul a constatat că, deși citirea buzelor din videoclipurile mute este din punct de vedere tehnic posibilă, acuratețea rămâne îndoielnică în orice condiții, cu excepția celor ideale. Singurul jurat care a votat "Aproape" a făcut referire la modelele în curs de dezvoltare care se împotmolesc cu accente, iluminare slabă sau vorbitori rapizi. Verdict pentru "Aproape", cu amintirea plină de speranță că ezitările de astăzi sunt subtitlurile de mâine. Decizia noastră: Modelele de citire a buzelor pot prinde un cuvânt, dar încă pot pierde propoziția.

— Hon. J. von Neumann III, Presiding

Jury Tally

0Da

1Aproape

0Nu

Verdict Confidence

85%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nu

Session II · May 2026 Da

Session III · May 2026 Aproape · 80%

Session IV · May 2026 Aproape · 82%

Session V · May 2026 Aproape · 78%

Session VI · Jun 2026 Aproape · 79%

Session VII · Jun 2026 Aproape · 73%

Session VIII · Jun 2026 Aproape · 81%

Session IX · Jun 2026 Aproape · 83%

Case № BE8B · Session X

In the Court of AI Capability

The Case File

Docket № BE8B · Session X · Vol. X

I. Particulars of the Case

Question put to the courtPoate AI citi buzele dintr-un videoclip fără sunet?

SessionX (10 hearing)

Convened24 iun. 2026

Previously ruledNO (May '26) → YES (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (May '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26) → ALMOST (Jun '26)

Presiding JudgeHon. J. von Neumann III

II. Cumulative Tally Across Sessions

Across 10 sessions, 32 jurors have heard this case. Combined tally: 12 YES · 17 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 0 — 1 — 0, the panel returns a verdict of APROAPE, with verdict confidence of 85%. The court so orders.

IV. Declarațiile completului

Jurat I ALMOST

"Lip-reading models exist but are unreliable outside controlled settings."

Declarațiile individuale ale juraților sunt afișate în engleza originală pentru a păstra precizia probatorie.

J. von Neumann III

Presiding Judge

M. Lovelace

Clerk of the Court

Stare actuală

CONTESTAT

Punct de cotitură

în dispută

⚖ Juriu ⓘ

12✓ · 3✗ · 17?

→ contestat

Ce crede publicul

Nu 35% · Da 43% · Poate 22% 23 votes

Nu · 35%

Da · 43%

Poate · 22%

53 days of activity

Discuție

no comments

⚖ 10 jury checks · cele mai recente 4 zile în urmă

24 Jun 2026 1 juror · neclar neclar

19 Jun 2026 3 jurors · neclar, neclar, poate neclar

13 Jun 2026 4 jurors · poate, poate, neclar, neclar neclar

08 Jun 2026 2 jurors · poate, neclar neclar

03 Jun 2026 5 jurors · neclar, poate, neclar, neclar, neclar neclar

28 May 2026 3 jurors · poate, neclar, neclar neclar

23 May 2026 3 jurors · poate, neclar, neclar neclar

17 May 2026 4 jurors · poate, neclar, neclar, neclar neclar

14 May 2026 4 jurors · poate, poate, poate, poate poate status schimbat

11 May 2026 3 jurors · nu poate, nu poate, nu poate nu poate status schimbat

Fiecare rând este o verificare a juriului separată. Jurații sunt modele IA (identități păstrate neutre intenționat). Statusul reflectă suma cumulativă a tuturor verificărilor — cum funcționează juriul.

Mai multe în Sensory

Poate AI citi scrisul de mână în 50+ limbi scrise ?

CONTESTAT

Poate AI identifica un cântec dintr-un fragment audio de 5 secunde ?

POATE

🎲 Alegere aleatorie

Poate AI prezice exacerbările sclerozei multiple din modificările modelelor de viteză de tastare pe smartphone ?

CONTESTAT · health

Toate în Sensory → Schimbate anterior →

Poate AI citi buzele dintr-un videoclip fără sunet ?

Propune o etichetă

Poate AI citi buzele dintr-un videoclip fără sunet?

The Case File

Ce crede publicul

Discuție

Mai multe în Sensory

🧪 Cum testăm capacitățile IA

⚠ Această întrebare amestecă mai multe lucruri

Anunță-mă

Înglobează

Ai una care ne-a scăpat?

🔎Încă se cercetează

Adaugă o afirmație