🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne · 🔥 Hot topics · NIE potrafi · Potrafi · § The Court · Ostatnie zmiany · 📈 Oś czasu · Zapytaj · Artykuły redakcyjne
Stuff AI CAN'T Do

Czy AI potrafi czytać z ruchu warg na filmie bez dźwięku ?

Co o tym myślisz?

AI może rekonstruować wypowiadane słowa wyłącznie na podstawie materiału wideo z ruchami ust, nawet bez dostępu do nagrań audio.


Obecne systemy AI potrafią rekonstruować zrozumiałe mowy z cichego wideo mówcy, analizując ruchy ust, szkoląc głębokie modele na dużych zbiorach danych zawierających sparowane ciche wideo i odpowiadające im nagrania audio. Najnowsze architektury, takie jak Wav2Lip, AV-HuBERT i VCA-GAN, osiągają wysoką dokładność odczytywania z ruchu ust w kontrolowanych warunkach, ale nadal mają problemy z szybką mową, nakładającymi się mówcami oraz przesłonięciami. Najlepsze systemy dorównują lub przewyższają ludzkie umiejętności odczytywania z ruchu ust na zbiorach testowych takich jak LRS2 i LRS3, a ich zastosowania są adaptowane do komunikacji wspomagającej oraz bezpiecznych interfejsów. Jednak odporność w realnych warunkach, przy słabym oświetleniu lub widoku z profilu, pozostaje aktywnym wyzwaniem badawczym.

— Wzbogacono 12 maja 2026 · Źródło: preprint arXiv „Visual Speech Recognition Using a Multi-modal Deep Learning Framework” — https://arxiv.org/abs/2305.11541

Status sprawdzony ostatnio May 14, 2026.

📰

Galeria

In the Court of AI Capability
Summary of Findings
Verdict over time
May 2026May 2026
Sitting at the Bench Filed · maj 14, 2026
— The Question Before the Court —

Czy AI potrafi czytać z ruchu warg na filmie bez dźwięku?

★ The Court Finds ★
▲ Upgraded from Nie
Tak

Jury udzieliło jednoznacznie twierdzącej odpowiedzi.

Jury Tally
4Tak
0Prawie
0Nie
Verdict Confidence
100%
The Court of AI Capability is, of course, not a real court.
But the data is real.
The Case File · Stacked History
Session I · May 2026 Nie
Case № BE8B · Session II
In the Court of AI Capability

The Case File

Docket № BE8B · Session II · Vol. II
I. Particulars of the Case
Question put to the courtCzy AI potrafi czytać z ruchu warg na filmie bez dźwięku?
SessionII (2 hearing)
Convened14 maj 2026
Previously ruledNO (May '26) → YES (May '26)
II. Cumulative Tally Across Sessions

Across 2 sessions, 7 jurors have heard this case. Combined tally: 4 YES · 0 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 4 — 0 — 0, the panel returns a verdict of TAK, with verdict confidence of 100%. The court so orders. Verdict upgraded from prior session.

IV. Oświadczenia składu sędziowskiego
Przysięgły I TAK

"Deep learning models can recognize lip patterns"

Przysięgły II TAK

"Lip-reading models like Wav2Lip and LipNet achieve nontrivial accuracy on silent video inputs."

Przysięgły III TAK

"AI systems like LipNet and those from DeepMind/Oxford demonstrated the ability to read lips from silent video, even outperforming humans on specific datasets."

Przysięgły IV TAK

"Deep learning models have demonstrated lip reading"

Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.

Presiding Judge
M. Lovelace
Clerk of the Court

Co myśli publiczność

Nie 40% · Tak 40% · Może 20% 5 votes
Nie · 40%
Tak · 40%
Może · 20%
28 days of activity

Dyskusja

no comments

Komentarze i obrazy przechodzą przez weryfikację admina zanim pojawią się publicznie.

2 jury checks · najnowsze 1 dzień temu
14 May 2026 4 jurors · potrafi, potrafi, potrafi, potrafi potrafi status zmieniony
11 May 2026 3 jurors · nie potrafi, nie potrafi, nie potrafi nie potrafi status zmieniony

Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.

Więcej w Sensory

Masz coś, co nam umknęło?

Dodaj stwierdzenie do atlasu. Sprawdzamy co tydzień.