Kann KI trainierte Menschen beim Lippenlesen schlagen ?
DeepMind zeigte dies 2022 mit einem transformerbasierten Modell, das professionelle Lippenleser bei TV-Nachrichtenclips übertraf. --- Forschende haben bedeute...
Die Geschworenen haben den Fall gehört, kamen aber zu keinem klaren Urteil.
DeepMind zeigte dies 2022 mit einem transformerbasierten Modell, das professionelle Lippenleser bei TV-Nachrichtenclips übertraf. --- Forschende haben bedeute...
Vision-Modelle, die mit Bankdaten trainiert wurden, sind bei jeder großen Bank im Einsatz. Unvollkommen, aber besser als der durchschnittliche Kassierer. ---...
Aktuelle KI-Systeme können Grenzbehörden unterstützen, indem sie Passfotos gegen Beobachtungslisten scannen, können aber immer noch nicht zuverlässig „verdächti...
Lateinisch, Kyrillisch, Devanagari, Arabisch, Han-Zeichen, Hangul — moderne OCR beherrscht im Wesentlichen jedes Schriftsystem mit meist passabler Genauigkeit....
KI-Systeme können neuronale Signale analysieren, aber der Aufbau eines vollständig autonomen, ethischen und sicheren Closed-Loop-Neurofeedback-Systems, das Emot...
Parfüm ist eine komplexe Mischung aus Düften, und was eine Person ansprechend findet, mag eine andere nicht. KI-Systeme wurden bereits eingesetzt, um neue Parfü...
KI kann gesprochene Wörter allein aus Videomaterial von Lippenbewegungen rekonstruieren, selbst ohne Zugriff auf Audioaufnahmen. --- Aktuelle KI-Systeme könne...
Das Mehl, das sie verwendete. Das Wasser aus dem Hahn, das sie hatte. Hände, die wussten, wann der Teig bereit war. Erinnerung eingebacken. --- Während KI bed...
Shazam-Klasse-Fingerprinting plus moderne ML haben Song-ID zu einem gelösten Problem auf jedem modernen Telefon gemacht. --- KI kann einen Song aus einem kurz...
What does it mean to extract every individual conversation from a recording of a busy crowd? AI systems tackle this by parsing overlapping speech, speaker ident...
How can we decode what animals are 'saying' through their sounds or movements? While technology can now label animal calls or track their body language with rea...
WARDEN verwendet ein zweistufiges System – zunächst wird Wardaman-Audio phonemisch transkribiert, dann ins Englische übersetzt – mit nur 6 Stunden Trainingsdate...
Kunstgeschichts-Apps nutzen dies für Besuchererlebnisse in großen Museen. --- Aktuelle Deep-Learning-Modelle haben bedeutende Fortschritte bei Bildverarbeitun...
Virtuelle Realität hat das Potenzial, die Art und Weise, wie wir die Welt erleben und mit ihr interagieren, zu revolutionieren, und KI kann dieses Erlebnis mögl...
Detektoren und Generatoren befinden sich in einem Wettrüsten, aber für die meisten aktuellen Deepfakes erkennen handelsübliche Detektoren sie besser als zufälli...
Was würde es brauchen, damit eine KI menschliche Ohren dazu bringt, ein synthetisches Lachen für echt zu halten? Die Erzeugung menschenähnlichen Lachens sprengt...
Moderne Gesichtserkennungssysteme bewältigen Jahrzehnte der Alterung innerhalb vernünftiger Fehlergrenzen. Nicht perfekt bei extremen Abständen, aber routinemäß...
Wenn 100 Menschen gleichzeitig sprechen, kann künstliche Intelligenz dann eine einzelne Stimme ohne räumliche Hinweise herausfiltern? Diese Frage untersucht die...
Die Tierkommunikation ist ein komplexes und noch nicht vollständig verstandenes Feld. Diese Aufgabe erfordert die Analyse von Tiervokalisationen und die Entwick...
Autonomes Sensorisches Meridian-Ansprechen (ASMR) ist ein komplexes Phänomen, das das Auslösen einer entspannenden Reaktion beim Zuhörer beinhaltet. Die Erstell...
Can an AI look at a teenager's face and forecast whether they will go bald later in life? Current technology attempts to read hereditary or age-related clues fr...
Wir überprüfen wöchentlich.
Wir recherchieren dieses Thema noch aktiv. Richte hier eine Benachrichtigung ein, und wir informieren dich, sobald es Neuigkeiten dazu gibt!
Wähle eine Seite, gib ihr einen einzeiligen Titel, optional eine Erläuterung, und eine Kategorie. Wir prüfen Einreichungen wöchentlich.