Czy AI może tłumaczyć mowę na żywo między głównymi językami ?
Słuchawki do tłumaczenia Apple’a, Google’a Pixel Buds Pro 2, Meta’s Ray-Ban — tłumaczenie mowy na mowę stało się cechą konsumencką w 2024 roku. --- Obecne sys...
Kategoria
Smell, taste, touch, embodied perception.
38 statements · najpierw wyróżnione, potem dyskutowane, potem najnowsze
Słuchawki do tłumaczenia Apple’a, Google’a Pixel Buds Pro 2, Meta’s Ray-Ban — tłumaczenie mowy na mowę stało się cechą konsumencką w 2024 roku. --- Obecne sys...
Czy system zasilany sztuczną inteligencją może wychwycić, czy mleko się zepsuło, omijając ludzki nos? To pytanie bada, czy technologia może odtworzyć subtelną c...
Komunikacja zwierząt to złożona i wciąż nie do końca poznana dziedzina. To zadanie wymaga analizy wokalizacji zwierząt oraz opracowania systemu, który przetłuma...
Co stanowi „znaczący” wzorzec w falach mózgowych? Obecne systemy AI doskonale radzą sobie z wykrywaniem i klasyfikowaniem sygnałów elektroencefalografii (EEG) p...
Czy ciekawi Cię, czy jabłka obok Ciebie, czy banany przed Tobą zaraz się zepsują? Sztuczna inteligencja może teraz przyglądać się owocom za pomocą kamer i czujn...
Gdy 100 osób mówi jednocześnie, czy sztuczna inteligencja potrafi wyłowić głos jednej konkretnej osoby bez żadnych wskazówek przestrzennych ułatwiających wybór?...
Co to znaczy wyodrębnić każdą indywidualną rozmowę z nagrania zatłoczonego tłumu? Systemy AI zajmują się tym, analizując nakładające się mowy, tożsamości mówców...
WARDEN wykorzystuje dwuetapowy system — najpierw transkrybuje dźwięk języka Wardaman na poziomie fonemicznym, a następnie tłumaczy na angielski — dysponując jed...
Co musiałoby się stać, aby sztuczna inteligencja oszukała ludzkie uszy, wierząc, że syntetyczny śmiech jest prawdziwy? Generowanie śmiechu podobnego do ludzkieg...
AI może już wykrywać niektóre choroby skóry na podstawie obrazów z wydajnością dorównującą lub przewyższającą dermatologów w kontrolowanych badaniach, zwłaszcza...
Przemysł perfumeryjny zaczął wykorzystywać AI do przewidywania preferencji sensorycznych poprzez analizę danych kulturowych, biologicznych i rynkowych. Systemy...
Regionalne dialekty często zawierają unikalne cechy fonetyczne, gramatyczne i leksykalne, które standardowe modele językowe mają trudności z dokładnym uchwyceni...
Obecne systemy AI mogą pomagać agencjom granicznym poprzez skanowanie zdjęć w paszportach na podstawie list obserwacyjnych, ale wciąż nie są w stanie wiarygodni...
Jak możemy odszyfrować, co zwierzęta „mówią” poprzez ich dźwięki lub ruchy? Chociaż technologia potrafi obecnie opisywać odgłosy zwierząt lub śledzić ich mowę c...
Czy sztuczna inteligencja może spojrzeć na twarz nastolatka i przewidzieć, czy w późniejszym życiu będzie łysieć? Obecna technologia próbuje odczytywać dziedzic...
AI może rekonstruować wypowiadane słowa wyłącznie na podstawie materiału wideo z ruchami ust, nawet bez dostępu do nagrań audio. --- Obecne systemy AI potrafi...
Czy możemy stworzyć autonomiczną, zamkniętą pętlę interfejsu mózg-komputer, która w locie dostosowuje emocje użytkownika, aby osiągnąć dowolny docelowy stan psy...
Wirtualna rzeczywistość ma potencjał, aby zrewolucjonizować sposób, w jaki doświadczamy i wchodzimy w interakcję ze światem, a AI może potencjalnie wzbogacić to...
Tworzenie unikalnego zapachu perfum, który odpowiada gustom danej osoby, jest złożonym zadaniem wymagającym zrozumienia ludzkiego węchu i preferencji. Sztuczna...
Co oznacza rozpoznawanie i klasyfikowanie grzybów na podstawie obrazów? W istocie polega to na trenowaniu modeli wizji komputerowej w celu analizowania cech wiz...
Autonomous Sensory Meridian Response (ASMR) to złożone zjawisko polegające na wywoływaniu relaksującej reakcji u słuchacza. Stworzenie spersonalizowanego doświa...
Perfum to złożona mieszanina zapachów, a to, co jednemu człowiekowi się podoba, drugiemu może nie. Systemy AI były używane do tworzenia nowych perfum, ale czy p...
Mąka, której użyła. Woda z kranu, którą miała. Ręce, które wiedziały, kiedy ciasto jest gotowe. Pamięć upieczona. --- Chociaż AI poczyniła znaczne postępy w g...
Szczęście/smutek/złość/zdziwienie — rozpoznawane przy jakości wideorozmowy. Subtelniejsze mikroekspresje nadal są trudne. --- Systemy AI potrafią rozpoznawać...
Aplikacje historii sztuki używają tego w doświadczeniach odwiedzających w głównych muzeach. --- Obecne modele głębokiego uczenia poczyniły znaczne postępy w z...
Narzędzia klasy badawczej, głównie używane w procesie przesiewowym, a nie jako samodzielne diagnozy. Na tyle skuteczne, że kilka uniwersytetów testuje je w proc...
Latin, cyrylica, dewanagari, arabski, znaki han oraz hangul — nowoczesne OCR radzi sobie praktycznie z każdym pismem z w miarę zadowalającą dokładnością. ---...
Aplikacja Merlin firmy Cornell uczyniła to standardowym narzędziem dla ornitologów. Model zna więcej odgłosów ptaków niż jakikolwiek pojedynczy człowiek-ornitol...
Cursive, druk, mieszane skrypty, a nawet niechlujne bazgroły z zeszytu. OCR w iOS Notes i Apple Pencil stał się naprawdę magicznym narzędziem. --- AI może kon...
Problem rozwiązany od benchmarka Stanford Dogs z 2017 roku. Obecnie standard w każdej galerii zdjęć. --- Obecne systemy AI potrafią identyfikować rasy psów na...
PlantNet, Seek, iNaturalist — aplikacje, które zamieniają każdy spacer w przewodnik terenowy. --- Sztuczna inteligencja może identyfikować gatunki roślin na p...
DeepMind zaprezentowało to w 2022 roku przy użyciu modelu opartego na transformerach, który przewyższył zawodowych czytelników z ust na fragmentach wiadomości t...
Modele wizyjne trenowane na zbiorach danych bankowych są wdrażane w każdym większym banku. Niedoskonałe, ale lepsze niż przeciętny kasjer. --- Sztuczna inteli...
Detektory i generatory prowadzą ze sobą wyścig zbrojeń, ale dla większości obecnych deepfake’ów gotowe detektory wykrywają je powyżej poziomu przypadku — często...
OpenAI's Whisper udostępnił przemysłowej jakości rozpoznawanie mowy dla 99 języków. Dźwięk o jakości telefonicznej przeszedł z badań do „przeciągnij i upuść”....
Nowoczesne systemy rozpoznawania twarzy radzą sobie z dekadami starzenia się w rozsądnych granicach błędu. Nie są doskonałe w skrajnych przypadkach, ale na co d...
Shazam-klasowe fingerprinting plus nowoczesne uczenie maszynowe sprawiły, że identyfikacja piosenek stała się rozwiązanym problemem na każdym nowoczesnym telefo...
ResNet przewyższył ludzką wydajność w teście ImageNet w 2015 roku. Dziś modele robią to na telefonach w milisekundach. --- Obecne systemy AI potrafią identyfi...
Dodaj stwierdzenie do atlasu. Sprawdzamy co tydzień.
Wciąż aktywnie badamy ten temat. Ustaw tu alert, a powiadomimy cię, gdy pojawią się nowości!
Wybierz stronę, nadaj jednolinijkowy tytuł, opcjonalne wyjaśnienie i kategorię. Zgłoszenia sprawdzamy co tydzień.