👃 Sensory · May 11, 2026 · STUFFAICANTDO.COM · Zgłoś to

Czy AI potrafi czytać z ruchu warg na filmie bez dźwięku ?

Co o tym myślisz? Czy SI to potrafi?

Oddaj swój głos — potem przeczytaj, co znalazł nasz redaktor i modele SI.

AI może rekonstruować wypowiadane słowa wyłącznie na podstawie materiału wideo z ruchami ust, nawet bez dostępu do nagrań audio.

#Deep Learning

#Image Analysis

#Lip Reading

#Speech Reconstruction

#Silent Video

Obecne systemy AI potrafią rekonstruować zrozumiałe mowy z cichego wideo mówcy, analizując ruchy ust, szkoląc głębokie modele na dużych zbiorach danych zawierających sparowane ciche wideo i odpowiadające im nagrania audio. Najnowsze architektury, takie jak Wav2Lip, AV-HuBERT i VCA-GAN, osiągają wysoką dokładność odczytywania z ruchu ust w kontrolowanych warunkach, ale nadal mają problemy z szybką mową, nakładającymi się mówcami oraz przesłonięciami. Najlepsze systemy dorównują lub przewyższają ludzkie umiejętności odczytywania z ruchu ust na zbiorach testowych takich jak LRS2 i LRS3, a ich zastosowania są adaptowane do komunikacji wspomagającej oraz bezpiecznych interfejsów. Jednak odporność w realnych warunkach, przy słabym oświetleniu lub widoku z profilu, pozostaje aktywnym wyzwaniem badawczym.

— Wzbogacono 12 maja 2026 · Źródło: preprint arXiv „Visual Speech Recognition Using a Multi-modal Deep Learning Framework” — https://arxiv.org/abs/2305.11541

Status sprawdzony ostatnio May 14, 2026.

📰

Galeria

In the Court of AI Capability

Summary of Findings

Verdict over time

May 2026May 2026

Sitting at the Bench Filed · maj 14, 2026

— The Question Before the Court —

Czy AI potrafi czytać z ruchu warg na filmie bez dźwięku?

★ The Court Finds ★

▲ Upgraded from Nie

⚖

Tak

Jury udzieliło jednoznacznie twierdzącej odpowiedzi.

Jury Tally

4Tak

0Prawie

0Nie

Verdict Confidence

100%

The Court of AI Capability is, of course, not a real court.
But the data is real.

The Case File · Stacked History

Session I · May 2026 Nie

Case № BE8B · Session II

In the Court of AI Capability

The Case File

Docket № BE8B · Session II · Vol. II

I. Particulars of the Case

Question put to the courtCzy AI potrafi czytać z ruchu warg na filmie bez dźwięku?

SessionII (2 hearing)

Convened14 maj 2026

Previously ruledNO (May '26) → YES (May '26)

II. Cumulative Tally Across Sessions

Across 2 sessions, 7 jurors have heard this case. Combined tally: 4 YES · 0 ALMOST · 3 NO · 0 IN RESEARCH.

Note: cumulative includes older juror opinions. The current session tally above is the live verdict.

III. Verdict

By a vote of 4 — 0 — 0, the panel returns a verdict of TAK, with verdict confidence of 100%. The court so orders. Verdict upgraded from prior session.

IV. Oświadczenia składu sędziowskiego

Przysięgły I TAK

"Deep learning models can recognize lip patterns"

Przysięgły II TAK

"Lip-reading models like Wav2Lip and LipNet achieve nontrivial accuracy on silent video inputs."

Przysięgły III TAK

"AI systems like LipNet and those from DeepMind/Oxford demonstrated the ability to read lips from silent video, even outperforming humans on specific datasets."

Przysięgły IV TAK

"Deep learning models have demonstrated lip reading"

Indywidualne oświadczenia przysięgłych są pokazywane w oryginalnym języku angielskim, by zachować precyzję dowodową.

—

Presiding Judge

M. Lovelace

Clerk of the Court

Aktualny stan

SPORNE

Punkt zwrotny

w sporze

⚖ Jury ⓘ

4✓ · 3✗

→ sporne

Co myśli publiczność

Nie 40% · Tak 40% · Może 20% 5 votes

Nie · 40%

Tak · 40%

Może · 20%

28 days of activity

Dyskusja

no comments

⚖ 2 jury checks · najnowsze 1 dzień temu

14 May 2026 4 jurors · potrafi, potrafi, potrafi, potrafi potrafi status zmieniony

11 May 2026 3 jurors · nie potrafi, nie potrafi, nie potrafi nie potrafi status zmieniony

Każdy wiersz to oddzielna kontrola jury. Jurorzy to modele SI (tożsamości celowo neutralne). Status odzwierciedla skumulowane wyniki ze wszystkich kontroli — jak działa jury.

Więcej w Sensory

Czy AI może identyfikować markery depresji w próbkach pisemnych ?

POTRAFI

Czy AI może opracować system tłumaczący wokalizacje zwierząt na język ludzki, umożliwiając ludziom zrozumienie komunikacji zwierząt ?

SPORNE

🎲 Losowy wybór

Czy AI potrafi rozwiązać kostkę Rubika w mniej niż sekundę przy użyciu robota ?

POTRAFI · Physical

Wszystkie w Sensory → Wcześniej zmienione →

Czy AI potrafi czytać z ruchu warg na filmie bez dźwięku ?

Zaproponuj tag

Czy AI potrafi czytać z ruchu warg na filmie bez dźwięku?

The Case File

Co myśli publiczność

Dyskusja

Więcej w Sensory

🧪 Jak testujemy zdolności SI

⚠ To pytanie miesza więcej niż jedną rzecz

Powiadom mnie

Osadź

Masz coś, co nam umknęło?

🔎Wciąż badamy

Dodaj stwierdzenie