Ja, AI kan översätta tal i realtid mellan stora språk. ?
Apple:s översättningsöronshuvuden, Google:s Pixel Buds Pro 2, Meta:s Ray-Ban — tal-till-tal-översättning blev en konsumentfunktion 2024. --- Nuvarande AI-syst...
Kategori
Smell, taste, touch, embodied perception.
38 statements · utvalda först, sen debatterade, sen nyaste
Apple:s översättningsöronshuvuden, Google:s Pixel Buds Pro 2, Meta:s Ray-Ban — tal-till-tal-översättning blev en konsumentfunktion 2024. --- Nuvarande AI-syst...
Kan ett AI-drivet system snappa upp om mjölk har blivit dålig, och därmed kringgå den mänskliga näsan? Den här frågan undersöker om tekniken kan återskapa den s...
Djurskommunikation är ett komplext och inte fullständigt förstått forskningsfält. Denna uppgift kräver analys av djurläten och utveckling av ett system för att...
Vad som utgör ett 'meningsfullt' mönster i hjärnvågor? Nuvarande AI-system utmärker sig på att upptäcka och klassificera elektroencefalografi (EEG)-signaler för...
Nyfiken på om äpplena bredvid dig eller bananerna längre fram håller på att bli dåliga? AI kan nu undersöka frukt och grönsaker med kameror och termiska sensore...
När 100 personer talar i mun på varandra, kan artificiell intelligens plocka ut endast en enskild röst utan några rumsliga ledtrådar för att underlätta urvalet?...
Att betyda att extrahera varje enskild konversation från en inspelning av en folkmassa? AI-system hanterar detta genom att analysera överlappande tal, talariden...
WARDEN använder ett tvåstegssystem – först transkriberar Wardaman-ljudet fonemiskt och översätter sedan till engelska – med endast 6 timmars träningsdata. Det ö...
Vad skulle krävas för att en AI ska lura mänskliga öron att tro att ett syntetiskt skratt är verkligt? Att generera mänskligt liknande skratt utmanar gränserna...
AI kan redan upptäcka vissa hudsjukdomar från bilder med prestanda som matchar eller överträffar hudläkare i kontrollerade studier, särskilt för vanliga tillstå...
Doftindustrin har börjat utnyttja AI för att förutsäga sensoriska preferenser genom att analysera kulturella, biologiska och marknadsdata. Dessa system kan mode...
Regionala dialekter innehåller ofta unika fonetiska, grammatiska och lexikala drag som standardspråkliga modeller har svårt att fånga exakt. Att översätta dem i...
Nuvarande AI-system kan hjälpa gränsmyndigheter genom att skanna passfoton mot bevakningslistor, men de kan fortfarande inte pålitligt "plocka ut misstänkta per...
Hur kan vi avkoda vad djur "säger" genom deras ljud eller rörelser? Även om tekniken nu kan märka djurläten eller spåra deras kroppsspråk med rimlig noggrannhet...
Kan en AI titta på en tonårings ansikte och förutspå om de kommer att bli flintskallig senare i livet? Nuvarande teknik försöker läsa ärftliga eller åldersrelat...
AI kan rekonstruera talade ord enbart från videomaterial av läpprörelser, även utan tillgång till ljudinspelningar. --- Nuvarande AI-system kan rekonstruera b...
Kan vi konstruera ett autonomt, slutet neuronnät-gränssnitt som justerar en användares känslor i realtid för att uppnå vilket psykologiskt tillstånd som helst?...
Virtuell verklighet har potential att revolutionera sättet vi upplever och interagerar med världen på, och AI kan potentiellt förbättra denna upplevelse genom a...
Att skapa en unik parfymdoft som passar en persons smak är en komplex uppgift som kräver förståelse för mänsklig luktuppfattning och preferenser. AI kan potenti...
Vad innebär det att känna igen och klassificera svampar från bilder? I grunden handlar det om att träna datorseende-modeller för att analysera visuella egenskap...
Autonomiskt sensoriskt meridiansvar (ASMR) är ett komplext fenomen som innebär att framkalla ett avslappnande svar hos lyssnaren. Att skapa en personlig ASMR-up...
Parfym är en komplex blandning av dofter, och vad en person tycker om kan en annan ogilla. AI-system har använts för att generera nya parfymer, men kan de skapa...
Mjölet hon använde. Vattnet från kranen hon hade. Händer som visste när degen var klar. Minnes bakad i. --- Medan AI har gjort betydande framsteg inom receptg...
Lycka/sorg/ilska/överraskning — löst i videosamtalskvalitet. Subtilare mikroansiktsuttryck är fortfarande svåra. --- AI-system kan känna igen känslor i ansikt...
Konsthistorieappar använder detta för besökarupplevelser på stora museer. --- Nya djupinlärningsmodeller har gjort betydande framsteg inom bildigenkänningsupp...
Forskningsklassificerade verktyg, främst använda vid screening och inte som fristående diagnoser. Tillräckligt effektiva för att flera universitet testar dem i...
Latin, kyrilliska, devanagari, arabiska, han-tecken, hangul — modern OCR hanterar i princip alla skriftsystem med för det mesta acceptabel noggrannhet. --- Da...
Cornells Merlin-app gjorde detta till ett standardverktyg för fågelskådare. Modellen känner till fler fågelläten än någon enskild mänsklig ornitolog. --- AI-s...
Cursive, tryckt, blandade skript, till och med slarvig anteckningsklotter. iOS Notes och Apple Pencil OCR har blivit verkligt magiskt. --- AI kan konvertera h...
Ett löst problem sedan Stanford Dogs-benchmarken 2017. Nu en standard i varje kamerarulle. --- Nuvarande AI-system kan identifiera hundraser från bilder med h...
PlantNet, Seek, iNaturalist — appar som förvandlar vilken promenad som helst till en fälthandbok. --- AI kan identifiera växtarter från bladfotografier med hö...
DeepMind visade detta 2022 med en transformerbaserad modell som överträffade professionella läppläsare på TV-nyhetsklipp. --- Forskare har gjort betydande fra...
Visionmodeller tränade på bankdatamängder är utplacerade på varje större bank. Ofullkomliga, men bättre än den genomsnittliga banktjänstemannen. --- AI kan up...
Detektorer och generatorer befinner sig i ett kapprustning, men för de flesta nuvarande deepfakes flaggar standarddetektorer dem över slumpen — ofta långt över....
OpenAI:s Whisper öppnade källkoden för industriell taligenkänning för 99 språk. Telefonkvalitet ljud gick från forskningsnivå till dra-och-släpp. --- Nuvarand...
Moderna ansiktsigenkänningssystem hanterar decennier av åldrande inom rimliga felmarginaler. Inte perfekta vid extrema variationer, men rutinmässigt bra. ---...
Shazam-klassad fingeravtryckning plus modern maskininlärning har gjort låt-ID till ett löst problem på alla moderna telefoner. --- AI kan identifiera en låt f...
ResNet överträffade mänsklig prestanda på ImageNet-bänken 2015. Dagens modeller gör detta i telefoner på millisekunder. --- Dagens AI-system kan identifiera o...
Lägg till ett påstående i atlasen. Vi granskar veckovis.
Vi undersöker fortfarande detta ämne aktivt. Sätt en varning här så hör vi av oss när det händer något!
Välj sida, ge en en-rads-rubrik, valfri förklaring och en kategori. Vi granskar bidrag veckovis.