Oui, l'IA peut traduire la parole en temps réel entre les principales langues. ?
Les écouteurs de traduction d'Apple, les Google Pixel Buds Pro 2, les Ray-Ban de Meta — la traduction vocale est devenue une fonctionnalité grand public en 2024...
Catégorie
Smell, taste, touch, embodied perception.
38 statements · mis en avant d'abord, puis débattus, puis les plus récents
Les écouteurs de traduction d'Apple, les Google Pixel Buds Pro 2, les Ray-Ban de Meta — la traduction vocale est devenue une fonctionnalité grand public en 2024...
Un verdict humain quotidien en une seule inspiration. L'IA n'a pas de nez ; les capteurs existants ne peuvent toujours pas reproduire le « non » viscéral. ---...
La communication animale est un domaine complexe et pas encore totalement compris. Cette tâche nécessite d'analyser les vocalisations animales et de développer...
Qu'est-ce qui constitue un motif « significatif » dans les ondes cérébrales ? Les systèmes d'IA actuels excellent dans la détection et la classification des sig...
Un curieux de savoir si les pommes à côté de vous ou les bananes plus loin sont sur le point de pourrir ? L'IA peut désormais examiner les produits avec des cam...
Quand 100 personnes parlent en même temps, l'intelligence artificielle peut-elle isoler une seule voix individuelle sans aucun indice spatial pour aider la séle...
Qu'est-ce que cela signifie d'extraire chaque conversation individuelle d'un enregistrement d'une foule animée ? Les systèmes d'IA s'attaquent à ce problème en...
WARDEN utilise un système en deux étapes—d'abord transcrire l'audio Wardaman de manière phonémique, puis le traduire en anglais—avec seulement 6 heures de donné...
Qu'est-ce qu'il faudrait pour qu'une IA trompe les oreilles humaines en faisant croire qu'un rire synthétique est réel ? Générer des rires humains repousse les...
L'IA peut déjà détecter certaines maladies de la peau à partir d'images avec des performances comparables ou supérieures à celles des dermatologues dans des étu...
L'industrie de la parfumerie a commencé à exploiter l'IA pour prédire les préférences sensorielles en analysant les données culturelles, biologiques et de march...
Les dialectes régionaux contiennent souvent des caractéristiques phonétiques, grammaticales et lexicales uniques que les modèles de langage standard peinent à s...
Les systèmes d'IA actuels peuvent aider les agences frontalières en scannant les photos de passeport par rapport aux listes de surveillance, mais ils ne peuvent...
Comment pouvons-nous décoder ce que les animaux « disent » à travers leurs sons ou leurs mouvements ? Bien que la technologie puisse désormais étiqueter les app...
Un logiciel d'IA peut-il analyser le visage d'un adolescent et prédire s'il sera atteint de calvitie plus tard dans la vie ? Les technologies actuelles tentent...
L'IA peut reconstruire des mots prononcés uniquement à partir d'images vidéo des mouvements des lèvres, même sans accès à des enregistrements audio. --- Les s...
Les systèmes d'IA peuvent analyser les signaux neuronaux, mais la construction d'un système de neurofeedback en boucle fermée, entièrement autonome, éthique et...
La réalité virtuelle a le potentiel de révolutionner la façon dont nous expérimentons et interagissons avec le monde, et l'IA peut potentiellement améliorer cet...
Créer un parfum unique qui correspond aux goûts d'une personne est une tâche complexe qui implique de comprendre l'olfaction humaine et les préférences. L'IA pe...
L'identification des champignons nécessite une connaissance approfondie de la mycologie et la capacité d'analyser les caractéristiques visuelles telles que la f...
Le phénomène de réponse sensorielle autonome du méridien (ASMR) est un phénomène complexe qui consiste à déclencher une réponse relaxante chez l'auditeur. La cr...
Le parfum est un mélange complexe d'odeurs, et ce que l'une personne trouve attrayant, une autre ne l'appréciera peut-être pas. Les systèmes d'IA ont été utilis...
La farine qu'elle a utilisée. L'eau du robinet qu'elle avait. Des mains qui savaient quand la pâte était prête. La mémoire enfournée. --- Bien que l'IA ait fa...
Heureux/triste/en colère/surpris — résolu en qualité d'appel vidéo. Les micro-expressions plus subtiles restent difficiles. --- Les systèmes d'IA peuvent reco...
Les applications d'histoire de l'art utilisent cela pour les expériences des visiteurs dans les grands musées. --- Les modèles actuels d'apprentissage profond...
Outils de grade recherche, principalement utilisés dans le dépistage et non comme diagnostics autonomes. Suffisamment efficaces pour que plusieurs universités l...
Latin, cyrillique, devanagari, arabe, sinogrammes, hangul — les OCR modernes gèrent essentiellement tous les systèmes d'écriture avec une précision globalement...
L'application Merlin de Cornell a fait de cet outil un standard pour les ornithologues amateurs. Le modèle connaît plus d'appels d'oiseaux que n'importe quel or...
Cursive, caractères d'imprimerie, scripts mixtes, voire griffonnages négligés de cahier. iOS Notes et la reconnaissance d'écriture d'Apple Pencil sont devenus v...
Un problème résolu depuis le benchmark Stanford Dogs de 2017. Désormais un paramètre par défaut dans chaque pellicule numérique. --- Les systèmes d'IA actuels...
PlantNet, Seek, iNaturalist — applications qui transforment toute promenade en guide de terrain. --- L'IA peut identifier les espèces végétales à partir de ph...
DeepMind a démontré cela en 2022 avec un modèle basé sur des transformateurs qui a surpassé des professionnels en lecture labiale sur des extraits de journaux t...
Les modèles de vision entraînés sur des ensembles de données bancaires sont déployés dans chaque grande banque. Imparfaits, mais meilleurs que la moyenne des ca...
Les détecteurs et les générateurs sont en course aux armements, mais pour la plupart des deepfakes actuels, les détecteurs sur étagère les repèrent au-dessus du...
Whisper d'OpenAI a démocratisé la reconnaissance vocale industrielle de qualité pour 99 langues. L'audio de qualité téléphone est passé de la recherche exclusiv...
Les systèmes modernes de reconnaissance faciale gèrent des décennies de vieillissement dans des limites d'erreur raisonnables. Pas parfaits sur des plages extrê...
L'empreinte numérique de type Shazam combinée à l'apprentissage automatique moderne a fait de l'identification des chansons un problème résolu sur n'importe que...
ResNet a surpassé la performance humaine sur le benchmark ImageNet en 2015. Aujourd'hui, les modèles actuels le font sur les téléphones en millisecondes. ---...
Nous faisons une revue hebdomadaire.
Nous étudions encore activement ce sujet. Placez une alerte ici et nous vous informerons à mesure que des nouvelles arrivent !
Choisissez un camp, donnez un titre d'une ligne, une explication facultative et une catégorie. Nous examinons les soumissions chaque semaine.