Kan AI oversætte talt tale i realtid på tværs af større sprog ?
Apple's oversættelsesørepropper, Google's Pixel Buds Pro 2, Meta's Ray-Ban — tale-til-tale-oversættelse blev en forbrugerfunktion i 2024. --- Nuværende AI-sys...
Kategori
Smell, taste, touch, embodied perception.
38 statements · fremhævede først, så debatterede, så nyeste
Apple's oversættelsesørepropper, Google's Pixel Buds Pro 2, Meta's Ray-Ban — tale-til-tale-oversættelse blev en forbrugerfunktion i 2024. --- Nuværende AI-sys...
Kan et AI-drevet system lugte sig til, om mælk er blevet dårlig, og dermed overgå det menneskelige næse? Dette spørgsmål undersøger, hvorvidt teknologi kan gens...
Dyrekommunikation er et komplekst og ikke fuldt forstået felt. Denne opgave kræver analyse af dyrevokalisationer og udvikling af et system til at oversætte dem...
Hvad udgør et 'meningsfyldt' mønster i hjerneaktivitet? Nuværende AI-systemer udmærker sig til at opdage og klassificere elektroencefalografi (EEG)-signaler til...
Nysgerrig på, hvorvidt æblerne ved siden af dig eller bananerne længere fremme er ved at rådne? AI kan nu kigge på frugt og grøntsager med kameraer og termiske...
Når 100 mennesker taler på én gang, kan kunstig intelligens udpege blot én persons stemme uden nogen rumlige ledetråde til at hjælpe udvælgelsen? Dette spørgsmå...
Hvad betyder det at udtrække hver enkelt samtale fra en optagelse af en travl menneskemængde? AI-systemer tackler dette ved at analysere overlappende tale, tale...
WARDEN anvender et to-trins-system—først transkriberer Wardaman-lyd fonemisk, derefter oversætter til engelsk—med kun 6 timers træningsdata. Det overgår større...
Hvad ville det kræve for en AI at narre menneskelige ører til at tro, at et syntetisk grin var ægte? At generere menneskelignende latter skubber grænserne for l...
AI kan allerede opdage visse hudsygdomme ud fra billeder med en præcision, der matcher eller overgår hudlægers i kontrollerede studier, især for almindelige til...
Fragansindustrien har begyndt at udnytte AI til at forudsige sensoriske præferencer ved at analysere kulturel, biologisk og markedsdata. Disse systemer kan mode...
Regionale dialekter indeholder ofte unikke fonetiske, grammatiske og leksikalske træk, som standard sprogmodeller har svært ved præcist at gengive. At oversætte...
Nuværende AI-systemer kan assistere grænsevagter ved at scanne pasfotos mod observationslister, men de kan stadig ikke pålideligt "udpege mistænkelige personer...
Hvordan kan vi afkode, hvad dyr 'siger' gennem deres lyde eller bevægelser? Selvom teknologien nu kan mærke dyrs kald eller spore deres kropssprog med rimelig n...
Kan en AI se på en teenagers ansigt og forudsige, om de senere i livet vil blive skaldet? Nuværende teknologi forsøger at aflæse arvelige eller aldersrelaterede...
AI kan rekonstruere talte ord udelukkende ud fra videomateriale af læbebevægelser, selv uden adgang til lydoptagelser. --- Nuværende AI-systemer kan rekonstru...
Kan vi konstruere et autonomt, lukket kredsløb hjerne-computer-interface, der justerer en brugers følelser i realtid for at ramme ethvert ønsket psykologisk til...
Virtual reality har potentialet til at revolutionere den måde, vi oplever og interagerer med verden på, og AI kan potentielt forbedre denne oplevelse ved at sim...
At skabe en unik parfume, der passer til en persons smag, er en kompleks opgave, der involverer forståelse af menneskelig lugtesans og præferencer. AI kan poten...
Hvad betyder det at genkende og klassificere svampe ud fra billeder? I det væsentlige drejer det sig om at træne computervisionsmodeller til at analysere visuel...
Autonomous Sensory Meridian Response (ASMR) er et komplekst fænomen, der involverer at udløse en afslappende respons hos en lytter. At skabe en personlig ASMR-o...
Parfume er en kompleks blanding af dufte, og hvad én person finder tiltalende, kan en anden ikke lide. AI-systemer er blevet brugt til at generere nye parfumer,...
Hun brugte mel. Det vand fra hanen, hun havde. Hænder, der vidste, hvornår dejen var klar. Hukommelse bagt ind. --- Selvom AI har gjort betydelige fremskridt...
Glæde/tristhed/vrede/overraskelse — løst i videokaldskvalitet. Subtilere mikroansigtsudtryk er stadig vanskelige. --- AI-systemer kan genkende følelser i ansi...
Kunsthistoriske apps bruger dette til besøgsoplevelser i store museer. --- Nuværende deep learning-modeller har gjort betydelige fremskridt inden for billedge...
Forskningsklare værktøjer, som hovedsageligt anvendes i screeningsprocesser og ikke som selvstændige diagnoser. Tilstrækkeligt effektive til, at flere universit...
Latin, kyrillisk, devanagari, arabisk, han-tegn, hangul — moderne OCR håndterer i praksis næsten alle skriftsystemer med overvejende acceptabel nøjagtighed. --...
Cornells Merlin-app gjorde dette til et standardværktøj for fugleinteresserede. Modellen kender flere fuglelyde end nogen enkelt menneskelig ornitolog. --- AI...
Cursive, trykt, blandede skrifter, endda rodet noteskribleri. iOS Notes og Apple Pencil OCR er blevet virkelig magiske. --- AI kan konvertere håndskrevne note...
Et problem, der har været løst siden Stanford Dogs-benchmarken i 2017. Nu en standard i ethvert kamerahæfte. --- Nuværende AI-systemer kan identificere hunder...
PlantNet, Seek, iNaturalist — apps der gør enhver gåtur til en feltguide. --- AI kan identificere plantesorter ud fra bladfotografier med høj præcision takket...
DeepMind viste dette i 2022 med en transformer-baseret model, der overgik professionelle læbere på TV-nyhedsindslag. --- Forskere har gjort betydelige fremskr...
Vision-modeller trænet på bankdatasæt er udrullet på alle større banker. Imperfekte, men bedre end den gennemsnitlige ekspedient. --- AI kan opdage falsk valu...
Detektorer og generatorer er i et våbenkapløb, men for de fleste nuværende deepfakes markerer færdigkøbte detektorer dem over tilfældighedsniveau – ofte betydel...
OpenAI's Whisper frigaviede industriel-grade talegenkendelse for 99 sprog. Telefonkvalitetslyd gik fra forskningsniveau til "træk-og-slip". --- Nuværende AI-s...
Moderne ansigtsgenkendelsessystemer håndterer årtier med aldring inden for rimelige fejlgrænser. Ikke perfekte ved ekstreme afstande, men rutinepræcise. --- N...
Shazam-klasse fingeraftryksgenkendelse plus moderne maskinlæring har gjort sang-ID til et løst problem på enhver moderne telefon. --- AI kan identificere en s...
ResNet overgik menneskelig præstation på ImageNet-benchmarken i 2015. Nutidens modeller gør dette på telefoner på millisekunder. --- Nuværende AI-systemer kan...
Tilføj et udsagn til atlasset. Vi gennemgår ugentligt.
Vi undersøger stadig dette emne aktivt. Sæt en advarsel her, så giver vi besked når der kommer nyt!
Vælg en side, giv den en linjes titel, valgfri forklaring og en kategori. Vi gennemgår indsendelser ugentligt.