Kan AI gesproken spraak in realtime vertalen naar belangrijke talen ?
Apple's vertaaltuigbuds, Google's Pixel Buds Pro 2, Meta's Ray-Ban — spraak-naar-spraakvertaling werd in 2024 een consumentenfunctie. --- Huidige AI-systemen...
Categorie
Smell, taste, touch, embodied perception.
38 statements · eerst uitgelicht, dan bediscussieerd, dan nieuwste
Apple's vertaaltuigbuds, Google's Pixel Buds Pro 2, Meta's Ray-Ban — spraak-naar-spraakvertaling werd in 2024 een consumentenfunctie. --- Huidige AI-systemen...
Een alledaags menselijk oordeel in één snuif. AI heeft geen neus; de bestaande sensoren kunnen het buikgevoel van een 'nee' nog niet nabootsen. --- AI-systeme...
Diercommunicatie is een complex en nog niet volledig begrepen vakgebied. Deze taak vereist het analyseren van dierlijke vocalisaties en het ontwikkelen van een...
Wat vormt een 'betekenisvol' patroon in hersengolven? Huidige AI-systemen blinken uit in het detecteren en classificeren van elektro-encefalografie (EEG)-signal...
Zou je willen weten of de appels naast je of de bananas verderop aan het bederven zijn? AI kan nu met camera's en thermische sensoren naar groente en fruit kijk...
Wanneer 100 mensen tegelijk spreken, kan kunstmatige intelligentie dan slechts één individuele stem eruit pikken zonder ruimtelijke aanwijzingen om de selectie...
Wat betekent het om elke individuele conversatie uit een opname van een drukke menigte te halen? AI-systemen pakken dit aan door overlappende spraak, sprekersid...
WARDEN gebruikt een tweefasensysteem—eerst transcribeert het Wardaman-audio fonemisch, waarna het vertaalt naar het Engels—met slechts 6 uur trainingsdata. Het...
Wat zou het vereisen voor een AI om menselijke oren te misleiden en te laten geloven dat een synthetische lach echt is? Het genereren van menselijk klinkende la...
AI kan al bepaalde huidziekten detecteren aan de hand van afbeeldingen met een prestatie die gelijkwaardig is aan of zelfs beter is dan die van dermatologen in...
De parfumindustrie is begonnen AI in te zetten om sensorische voorkeuren te voorspellen door culturele, biologische en marktgegevens te analyseren. Deze systeme...
Regionale dialecten bevatten vaak unieke fonetische, grammaticale en lexicale kenmerken die standaardtaalmodellen moeilijk nauwkeurig kunnen vastleggen. Het rea...
Huidige AI-systemen kunnen grensagentschappen ondersteunen door pasfoto’s te scannen tegen waarschuwingslijsten, maar ze kunnen nog steeds niet betrouwbaar “ver...
Hoe kunnen we ontcijferen wat dieren 'zeggen' via hun geluiden of bewegingen? Hoewel technologie nu dierengeluiden kan labelen of hun lichaamstaal met redelijke...
Kan een AI naar het gezicht van een tiener kijken en voorspellen of ze later in hun leven kaal zullen worden? Huidige technologie probeert erfelijke of leeftijd...
AI kan gesproken woorden reconstrueren puur op basis van videobeelden van lipbewegingen, zelfs zonder toegang tot geluidsopnames. --- Huidige AI-systemen kunn...
AI-systemen kunnen neurale signalen analyseren, maar het bouwen van een volledig autonoom, ethisch en veilig gesloten neurofeedbacksysteem dat direct en betrouw...
Virtuele realiteit heeft de potentie om de manier waarop we de wereld ervaren en ermee omgaan te revolutioneren, en AI kan deze ervaring mogelijk verrijken door...
Het creëren van een unieke parfumgeur die past bij iemands smaak is een complexe taak die inzicht vereist in menselijke reukzin en voorkeuren. AI kan dit proces...
Paddenstoelidentificatie vereist een diepgaand begrip van mycologie en het vermogen om visuele kenmerken zoals vorm, grootte, kleur en textuur te analyseren. De...
Autonoom Sensorisch Meridiaan Respons (ASMR) is een complex fenomeen waarbij een ontspannende reactie bij een luisteraar wordt opgewekt. Het creëren van een gep...
Parfum is een complexe mix van geuren, en wat de één aantrekkelijk vindt, kan de ander helemaal niet waarderen. AI-systemen worden al gebruikt om nieuwe parfums...
De bloem die ze gebruikte. Het water uit de kraan dat ze had. Handen die wisten wanneer het deeg klaar was. Herinnering gebakken in. --- Hoewel AI aanzienlijk...
Gelukkig/verdrietig/boos/verrast — opgelost op videogespreks-kwaliteit. Subtielere microexpressies zijn nog steeds moeilijk. --- AI-systemen kunnen emoties in...
Kunstgeschiedenis-apps gebruiken dit voor bezoekerservaringen in grote musea. --- Huidige deep learning-modellen hebben significante vooruitgang geboekt in be...
Onderzoeksniveau tools, voornamelijk gebruikt bij screening en niet als zelfstandige diagnoses. Effectief genoeg dat verschillende universiteiten ze testen bij...
Latijn, Cyrillisch, Devanagari, Arabisch, Han-tekens, Hangul — moderne OCR kan in principe elk schrift met redelijke nauwkeurigheid verwerken. --- Huidige AI-...
Cornell's Merlin-app maakte dit tot een standaardgereedschap voor vogelaars. Het model kent meer vogelgeluiden dan welke individuele ornitholoog dan ook. ---...
Cursief, drukletters, gemengde scripts, zelfs slordig notitieblok gekrabbel. iOS Notes en Apple Pencil OCR zijn echt magisch geworden. --- AI kan handgeschrev...
Een opgelost probleem sinds de Stanford Dogs-benchmark van 2017. Nu standaard in elke camerarol. --- Huidige AI-systemen kunnen hondenrassen herkennen aan de...
PlantNet, Seek, iNaturalist — apps die elke wandeling veranderen in een veldgids. --- AI kan plantensoorten herkennen aan de hand van bladfoto’s met een hoge...
DeepMind toonde dit in 2022 met een op transformers gebaseerd model dat professionele liplezers overtrof op tv-nieuwsfragmenten. --- Onderzoekers hebben signi...
Visionmodellen die zijn getraind op bankgegevenssets worden ingezet bij elke grote bank. Imperfect, maar beter dan de gemiddelde bankmedewerker. --- AI kan va...
Detectors en generators zijn in een wapenwedloop verwikkeld, maar voor de meeste huidige deepfakes markeren kant-en-klare detectors ze boven toeval — vaak ruim...
OpenAI's Whisper heeft open-source industriële spraakherkenning voor 99 talen mogelijk gemaakt. Telefoonkwaliteit audio ging van alleen voor onderzoek naar drag...
Moderne gezichtsherkenningssystemen kunnen decennialange veroudering binnen redelijke foutmarges aan. Niet perfect op extreme afstanden, maar over het algemeen...
Shazam-klasse vingerafdrukken plus moderne ML hebben song-ID een opgelost probleem gemaakt op elke moderne telefoon. --- AI kan een nummer identificeren aan d...
ResNet overtrof in 2015 de menselijke prestaties op de ImageNet-benchmark. Tegenwoordig doen huidige modellen dit op telefoons in milliseconden. --- Huidige A...
We review weekly.
We zijn dit onderwerp nog actief aan het onderzoeken. Stel hier een melding in en we laten het weten zodra er nieuws is rond dit onderwerp!
Kies een kant, geef het een titel van één regel, optioneel een uitleg en een categorie. We beoordelen inzendingen wekelijks.