A IA consegue traduzir discurso falado em tempo real entre as principais línguas ?
Os auriculares de tradução da Apple, os Google Pixel Buds Pro 2, os Ray-Ban da Meta — a tradução de fala para fala tornou-se uma funcionalidade de consumo em 20...
Categoria
Smell, taste, touch, embodied perception.
38 statements · destacadas primeiro, depois debatidas, depois as mais recentes
Os auriculares de tradução da Apple, os Google Pixel Buds Pro 2, os Ray-Ban da Meta — a tradução de fala para fala tornou-se uma funcionalidade de consumo em 20...
Pode um sistema alimentado por IA detetar se o leite estragou, dispensando o nariz humano? Esta questão investiga se a tecnologia consegue replicar a química su...
A comunicação animal é um campo complexo e ainda não totalmente compreendido. Esta tarefa requer analisar vocalizações animais e desenvolver um sistema para as...
O que constitui um padrão 'significativo' em ondas cerebrais? Os sistemas de IA atuais destacam-se na deteção e classificação de sinais de eletroencefalografia...
Será que as maçãs ao seu lado ou as bananas à frente estão prestes a estragar? A IA consegue agora observar os produtos com câmaras e sensores térmicos para det...
Quando 100 pessoas falam ao mesmo tempo, a inteligência artificial consegue isolar apenas uma voz individual sem quaisquer pistas espaciais que ajudem na seleçã...
O que significa extrair cada conversa individual de uma gravação de uma multidão movimentada? Os sistemas de IA lidam com isso ao analisar discursos sobrepostos...
O WARDEN utiliza um sistema de duas fases—primeiro transcrevendo áudio Wardaman fonemicamente e depois traduzindo para inglês—com apenas 6 horas de dados de tre...
O que seria necessário para uma IA enganar os ouvidos humanos, fazendo com que uma risada sintética parecesse real? Gerar risadas semelhantes às humanas leva os...
A IA já consegue detetar certas doenças de pele a partir de imagens com um desempenho que iguala ou supera o de dermatologistas em estudos controlados, especial...
A indústria de fragrâncias começou a aproveitar a IA para prever preferências sensoriais ao analisar dados culturais, biológicos e de mercado. Estes sistemas co...
Os dialetos regionais muitas vezes contêm características fonéticas, gramaticais e lexicais únicas que os modelos de linguagem padrão têm dificuldade em captar...
Os sistemas de IA atuais podem ajudar as agências de fronteira a analisar fotos de passaportes em listas de vigilância, mas ainda não conseguem identificar de f...
Como podemos descodificar o que os animais estão a 'dizer' através dos seus sons ou movimentos? Embora a tecnologia consiga agora rotular chamamentos animais ou...
Pode uma IA analisar o rosto de um adolescente e prever se este ficará careca mais tarde na vida? A tecnologia atual tenta ler pistas hereditárias ou relacionad...
A IA pode reconstruir palavras faladas apenas a partir de imagens de vídeo dos movimentos labiais, mesmo sem acesso a gravações de áudio. --- Os sistemas atua...
Podemos projetar uma interface cérebro-computador autónoma e em circuito fechado que ajuste as emoções do utilizador em tempo real para atingir qualquer estado...
A realidade virtual tem o potencial de revolucionar a forma como experienciamos e interagimos com o mundo, e a IA pode potencialmente melhorar esta experiência...
Criar uma fragrância de perfume única que se adapte ao gosto de uma pessoa é uma tarefa complexa que envolve a compreensão da olfação humana e das preferências....
O que significa reconhecer e classificar cogumelos a partir de imagens? Em essência, envolve treinar modelos de visão computacional para analisar característica...
A Resposta Sensorial Autónoma do Meridiano (ASMR) é um fenómeno complexo que envolve desencadear uma resposta relaxante num ouvinte. Criar uma experiência perso...
O perfume é uma mistura complexa de fragrâncias, e o que uma pessoa acha apelativo, outra pode não gostar. Os sistemas de IA têm sido usados para gerar novos pe...
A farinha que ela usou. A água da torneira que ela tinha. Mãos que sabiam quando a massa estava pronta. Memória assada. --- Embora a IA tenha feito avanços si...
Feliz/triste/irado/surpreendido — resolvido em qualidade de videochamada. Microexpressões mais subtis ainda são difíceis. --- Os sistemas de IA conseguem reco...
As aplicações de história da arte usam isto para experiências de visitantes em grandes museus. --- Os modelos atuais de *deep learning* fizeram progressos sig...
Ferramentas de grau de investigação, maioritariamente usadas em rastreio e não como diagnóstico autónomo. Suficientemente eficazes para que várias universidades...
O Latin, Cirílico, Devanagari, Árabe, caracteres Han e Hangul — os OCR modernos lidam essencialmente com todos os sistemas de escrita com uma precisão maioritar...
A aplicação Merlin da Cornell tornou esta uma ferramenta padrão para observadores de aves. O modelo conhece mais cantos de aves do que qualquer ornitólogo human...
Cursivo, letra de imprensa, scripts mistos, até rabiscos de caderno desleixados. iOS Notes e o OCR do Apple Pencil tornaram-se verdadeiramente mágicos. --- A...
Um problema resolvido desde o benchmark Stanford Dogs de 2017. Agora um padrão em todas as galerias de fotos. --- Os sistemas de IA atuais conseguem identific...
PlantNet, Seek, iNaturalist — aplicações que transformam qualquer passeio num guia de campo. --- A IA consegue identificar espécies de plantas a partir de fot...
A DeepMind demonstrou isto em 2022 com um modelo baseado em transformers que superou leitores labiais profissionais em clipes de notícias na televisão. --- In...
Os modelos de visão treinados em conjuntos de dados bancários são implementados em todos os principais bancos. Imperfeitos, mas melhores do que o caixa médio....
Detectores e geradores estão numa corrida armamentista, mas para a maioria dos deepfakes atuais, os detectores off-the-shelf identificam-nos acima do acaso — mu...
O Whisper da OpenAI tornou o reconhecimento de fala industrial de código aberto para 99 idiomas. O áudio de qualidade telefónica passou de exclusivo para arrast...
Os sistemas modernos de reconhecimento facial lidam com décadas de envelhecimento dentro de limites de erro razoáveis. Não são perfeitos em faixas extremas, mas...
A identificação de canções por impressão digital Shazam e aprendizagem automática moderna tornou o reconhecimento de músicas um problema resolvido em qualquer t...
O ResNet superou o desempenho humano no benchmark ImageNet em 2015. Hoje, os modelos actuais fazem isto em telemóveis em milissegundos. --- Os sistemas de IA...
Adiciona uma afirmação ao atlas. Revemos semanalmente.
Ainda estamos ativamente a pesquisar este tema. Define aqui um aviso e nós avisamos-te à medida que houver novidades!
Escolhe um lado, dá-lhe um título de uma linha, uma explicação opcional e uma categoria. Revemos submissões semanalmente.