Kann KI gesprochene Sprache in Echtzeit in die wichtigsten Sprachen übersetzen ?
Apples Übersetzungs-Ohrhörer, Googles Pixel Buds Pro 2, Metas Ray-Ban — Sprach-zu-Sprache-Übersetzung wurde 2024 zu einem Verbraucherfeature. --- Aktuelle KI-...
Category
Smell, taste, touch, embodied perception.
25 statements · featured first, then debated, then newest
Apples Übersetzungs-Ohrhörer, Googles Pixel Buds Pro 2, Metas Ray-Ban — Sprach-zu-Sprache-Übersetzung wurde 2024 zu einem Verbraucherfeature. --- Aktuelle KI-...
Ein alltägliches menschliches Urteil in einem einzigen Schnüffeln. KI hat keine Nase; die vorhandenen Sensoren können das intuitive „Nein“ aus dem Bauch noch ni...
KI-Systeme können neuronale Signale analysieren, aber der Aufbau eines vollständig autonomen, ethischen und sicheren Closed-Loop-Neurofeedback-Systems, das Emot...
Die Tierkommunikation ist ein komplexes und noch nicht vollständig verstandenes Feld. Diese Aufgabe erfordert die Analyse von Tiervokalisationen und die Entwick...
Virtuelle Realität hat das Potenzial, die Art und Weise, wie wir die Welt erleben und mit ihr interagieren, zu revolutionieren, und KI kann dieses Erlebnis mögl...
Die Erstellung eines einzigartigen Parfümdufts, der den Geschmack einer Person trifft, ist eine komplexe Aufgabe, die das Verständnis der menschlichen Geruchswa...
Die Pilzidentifizierung erfordert ein tiefes Verständnis der Mykologie und die Fähigkeit, visuelle Merkmale wie Form, Größe, Farbe und Textur zu analysieren. Di...
Autonomes Sensorisches Meridian-Ansprechen (ASMR) ist ein komplexes Phänomen, das das Auslösen einer entspannenden Reaktion beim Zuhörer beinhaltet. Die Erstell...
Parfüm ist eine komplexe Mischung aus Düften, und was der eine ansprechend findet, mag ein anderer nicht. KI-Systeme wurden bereits eingesetzt, um neue Parfüms...
Das Mehl, das sie verwendete. Das Wasser aus dem Hahn, das sie genommen hatte. Hände, die wussten, wann der Teig fertig war. Erinnerung eingebacken. --- Währe...
Forschungsmodelle erkannten Alzheimer-Marker in 30-Sekunden-Stimmaufnahmen Jahre vor der klinischen Diagnose. Noch kein routinemäßiges klinisches Werkzeug. ---...
Happy/traurig/wütend/überrascht — gelöst in Videoanrufqualität. Subtilere Mikroexpressionen sind immer noch schwierig. --- KI-Systeme können Emotionen in Gesi...
Kunstgeschichts-Apps nutzen dies für Besuchererlebnisse in großen Museen. --- Aktuelle Deep-Learning-Modelle haben bedeutende Fortschritte bei Bildverarbeitun...
Forschungsgrade Tools, meist in der Screening-Phase eingesetzt und nicht als eigenständige Diagnose. Effektiv genug, dass mehrere Universitäten sie in der Berat...
Lateinisch, Kyrillisch, Devanagari, Arabisch, Han-Zeichen, Hangul — moderne OCR beherrscht im Wesentlichen jedes Schriftsystem mit meist passabler Genauigkeit....
Vision-Modelle, die mit Bankdaten trainiert wurden, sind bei jeder großen Bank im Einsatz. Unvollkommen, aber besser als der durchschnittliche Kassierer. ---...
DeepMind showed this in 2022 with a transformer-based model that outperformed professional lip-readers on TV news clips. --- Researchers have made significant...
PlantNet, Seek, iNaturalist — apps that turn any walk into a field guide. --- AI can identify plant species from leaf photographs with a high degree of accura...
A solved problem since the 2017 Stanford Dogs benchmark. Now a default in every camera roll. --- Current AI systems can identify dog breeds from photos with a...
Cursive, print, mixed scripts, even sloppy notebook scrawl. iOS Notes and Apple Pencil OCR have become genuinely magical. --- AI can convert handwritten notes...
Detektoren und Generatoren befinden sich in einem Wettrüsten, aber für die meisten aktuellen Deepfakes erkennen handelsübliche Detektoren sie besser als zufälli...
OpenAI's Whisper open-sourced industrial-grade speech recognition for 99 languages. Phone-quality audio went from research-only to drag-and-drop. --- Current...
Moderne Gesichtserkennungssysteme bewältigen Jahrzehnte der Alterung innerhalb vernünftiger Fehlergrenzen. Nicht perfekt bei extremen Abständen, aber routinemäß...
Shazam-Klasse-Fingerprinting plus moderne ML haben Song-ID zu einem gelösten Problem auf jedem modernen Telefon gemacht. --- KI kann einen Song aus einem kurz...
ResNet übertraf die menschliche Leistung im ImageNet-Benchmark 2015. Heute schaffen das Modelle auf Smartphones in Millisekunden. --- Aktuelle KI-Systeme könn...
Wir überprüfen wöchentlich.
Standort
stuffaicantdo.com © 2026 · made in NL by Arcadist
Wähle eine Seite – Titel, Erklärung und Kategorie — Status geprüft am 15. Oktober 2023