¿Puede la IA traducir el habla en tiempo real a los principales idiomas ?
Los auriculares de traducción de Apple, los Google Pixel Buds Pro 2, los Ray-Ban de Meta — la traducción de voz a voz se convirtió en una característica de cons...
Categoría
Smell, taste, touch, embodied perception.
38 statements · destacadas primero, luego debatidas, luego más nuevas
Los auriculares de traducción de Apple, los Google Pixel Buds Pro 2, los Ray-Ban de Meta — la traducción de voz a voz se convirtió en una característica de cons...
Un veredicto humano cotidiano en una sola inhalación. La IA no tiene nariz; los sensores que existen aún no pueden replicar el 'no' visceral. --- Los sistemas...
La comunicación animal es un campo complejo y no del todo comprendido. Esta tarea requiere analizar las vocalizaciones animales y desarrollar un sistema para tr...
¿Qué constituye un patrón 'significativo' en las ondas cerebrales? Los sistemas actuales de IA destacan en detectar y clasificar señales de electroencefalografí...
¿Curioso si las manzanas a tu lado o los plátanos más adelante están a punto de echarse a perder? La IA ahora puede observar la fruta con cámaras y sensores tér...
Cuando 100 personas hablan al mismo tiempo, ¿puede la inteligencia artificial distinguir solo una voz individual sin ninguna pista espacial que ayude a la selec...
¿Qué significa extraer cada conversación individual de una grabación de una multitud ocupada? Los sistemas de IA abordan esto analizando el habla superpuesta, l...
WARDEN utiliza un sistema de dos etapas: primero transcribe el audio de Wardaman fonémicamente y luego lo traduce al inglés, con solo 6 horas de datos de entren...
¿Qué se necesitaría para que una IA engañe a los oídos humanos y haga creer que una risa sintética es real? Generar risas similares a las humanas lleva los lími...
La IA ya puede detectar ciertas enfermedades de la piel a partir de imágenes con un rendimiento que iguala o supera al de los dermatólogos en estudios controlad...
La industria de las fragancias ha comenzado a aprovechar la IA para predecir preferencias sensoriales mediante el análisis de datos culturales, biológicos y de...
Los dialectos regionales suelen contener rasgos fonéticos, gramaticales y léxicos únicos que los modelos de lenguaje estándar tienen dificultades para capturar...
Los sistemas de IA actuales pueden ayudar a las agencias fronterizas a escanear fotos de pasaportes frente a listas de vigilancia, pero aún no pueden identifica...
¿Cómo podemos descifrar lo que los animales 'dicen' a través de sus sonidos o movimientos? Aunque la tecnología ahora puede etiquetar las llamadas de los animal...
¿Puede una IA mirar el rostro de un adolescente y predecir si se quedará calvo más adelante en la vida? La tecnología actual intenta leer pistas hereditarias o...
La IA puede reconstruir palabras habladas únicamente a partir de imágenes de vídeo de los movimientos de los labios, incluso sin acceso a grabaciones de audio....
Los sistemas de IA pueden analizar señales neuronales, pero construir un sistema de neurofeedback cerrado, autónomo, ético y seguro que pueda inducir instantáne...
La realidad virtual tiene el potencial de revolucionar la forma en que experimentamos e interactuamos con el mundo, y la IA puede potenciar esta experiencia sim...
Crear una fragancia de perfume única que se adapte al gusto de una persona es una tarea compleja que implica entender la olfacción humana y las preferencias. La...
La identificación de hongos requiere un profundo conocimiento de micología y la capacidad de analizar características visuales como forma, tamaño, color y textu...
La Respuesta Sensorial Autónoma del Meridiano (ASMR) es un fenómeno complejo que implica desencadenar una respuesta relajante en el oyente. Crear una experienci...
El perfume es una mezcla compleja de aromas, y lo que a una persona le resulta atractivo, a otra podría no gustarle. Los sistemas de IA se han utilizado para ge...
La harina que usó. El agua del grifo que tenía. Manos que sabían cuándo la masa estaba lista. Memoria horneada. --- Si bien la IA ha avanzado significativamen...
Feliz/triste/enojado/sorprendido — resuelto en calidad de videollamada. Las microexpresiones más sutiles aún son difíciles. --- Los sistemas de IA pueden reco...
Las aplicaciones de historia del arte usan esto para experiencias de visitantes en museos importantes. --- Los modelos actuales de aprendizaje profundo han lo...
Herramientas de grado de investigación, mayormente utilizadas en cribado y no como diagnósticos independientes. Suficientemente efectivas como para que varias u...
El latín, cirílico, devanagari, árabe, caracteres han y hangul —el OCR moderno maneja esencialmente todos los sistemas de escritura con una precisión mayormente...
La aplicación Merlin de Cornell convirtió esto en una herramienta estándar para los observadores de aves. El modelo conoce más cantos de aves que cualquier orni...
Cursiva, imprenta, scripts mixtos, incluso garabatos de cuaderno desordenados. La función de OCR de Notas de iOS y Apple Pencil se ha vuelto genuinamente mágica...
Un problema resuelto desde el benchmark Stanford Dogs de 2017. Ahora es un valor predeterminado en cada rollo de cámara. --- Los sistemas de IA actuales puede...
PlantNet, Seek, iNaturalist — apps que convierten cualquier paseo en una guía de campo. --- La IA puede identificar especies de plantas a partir de fotografía...
DeepMind mostró esto en 2022 con un modelo basado en transformers que superó a los profesionales en lectura de labios en clips de noticias de TV. --- Los inve...
Los modelos de visión entrenados con conjuntos de datos bancarios se despliegan en todos los bancos importantes. Imperfectos, pero mejores que el cajero promedi...
Los detectores y generadores están en una carrera armamentística, pero para la mayoría de los deepfakes actuales, los detectores comerciales los identifican por...
OpenAI's Whisper abrió el reconocimiento de voz industrial de código abierto para 99 idiomas. El audio de calidad telefónica pasó de ser exclusivo de la investi...
Los sistemas modernos de reconocimiento facial manejan décadas de envejecimiento dentro de márgenes de error razonables. No son perfectos en rangos extremos, pe...
Shazam-class fingerprinting más ML moderno han convertido la identificación de canciones en un problema resuelto en cualquier teléfono moderno. --- La IA pued...
ResNet superó el rendimiento humano en el benchmark de ImageNet en 2015. Hoy, los modelos actuales lo hacen en teléfonos en milisegundos. --- Los sistemas de...
Revisamos semanalmente.
¡Aún estamos investigando este tema activamente. Pon una alerta aquí y te avisaremos a medida que haya noticias!
Elige un lado, dale un título de una línea, una explicación opcional y una categoría. Revisamos envíos semanalmente.