Czy AI może pokonać wyszkolonych ludzi w czytaniu z ruchu warg ?
Cast your vote — then read what our editor and the AI models found.
DeepMind zaprezentowało to w 2022 roku przy użyciu modelu opartego na transformerach, który przewyższył zawodowych czytelników z ust na fragmentach wiadomości telewizyjnych.
Naukowcy poczynili znaczące postępy w rozwoju systemów sztucznej inteligencji zdolnych do czytania z ust, a niektóre badania wykazały, że modele AI mogą przewyższać wyszkolonych ludzkich czytelników z ust w określonych warunkach. Systemy AI wykorzystują techniki widzenia komputerowego i algorytmy uczenia maszynowego do analizowania ruchów ust danej osoby i identyfikowania odpowiadających im dźwięków mowy. Chociaż dokładność systemów AI do czytania z ust może się różnić w zależności od czynników takich jak jakość obrazu wejściowego i złożoność mowy, to w różnych eksperymentach osiągnęły obiecujące wyniki. Ogólnie rzecz biorąc, obecny stan sztuki w dziedzinie AI do czytania z ust sugeruje, że systemy te mogą rzeczywiście pokonać wyszkolonych ludzi w określonych scenariuszach.
— Wzbogacono 9 maja 2026 · Źródło: University of Oxford — https://www.ox.ac.uk/news/science-blog/lip-reading-ai
Galeria
Jeszcze nie ma żadnych obrazów — wgraj jeden poniżej, aby rozpocząć galerię.
Nie zgadzasz się? Zostaw swój komentarz poniżej.