A dokáže AI překládat mluvenou řeč v reálném čase mezi hlavními jazyky ?
Appleovy překladatelské sluchátka, Google Pixel Buds Pro 2, Meta Ray-Ban — překlad řeči do řeči se v roce 2024 stal spotřebitelskou funkcí. --- Současné AI sy...
Kategorie
Smell, taste, touch, embodied perception.
38 statements · nejdřív vybraná, pak diskutovaná, pak nejnovější
Appleovy překladatelské sluchátka, Google Pixel Buds Pro 2, Meta Ray-Ban — překlad řeči do řeči se v roce 2024 stal spotřebitelskou funkcí. --- Současné AI sy...
Může systém poháněný umělou inteligencí odhalit, zda se mléko zkazilo, a obejít tak lidský čich? Tato otázka zkoumá, zda technologie dokáže napodobit jemnou che...
Komunikace zvířat je komplexní a ne zcela pochopená oblast. Tento úkol vyžaduje analýzu zvuků zvířat a vývoj systému pro jejich překlad do lidského jazyka. ---...
Co tvoří „smysluplný“ vzorec v mozkových vlnách? Současné AI systémy vynikají detekcí a klasifikací elektroencefalografických (EEG) signálů pro konkrétní úkoly,...
Zajímá vás, jestli jablka vedle vás nebo banány před vámi právě nehnijí? Umělá inteligence nyní dokáže pomocí kamer a tepelných senzorů sledovat ovoce a odhalit...
Když mluví najednou 100 lidí, dokáže umělá inteligence vybrat pouze jeden jednotlivý hlas bez jakýchkoli prostorových vodítek pro výběr? Tato otázka zkoumá limi...
Co znamená extrahovat každý jednotlivý rozhovor z nahrávky rušného davu? AI systémy se tohoto úkolu ujímají tím, že analyzují překrývající se řeč, identitu mluv...
WARDEN používá dvoufázový systém – nejprve fonemicky přepisuje zvuk Wardaman a poté překládá do angličtiny – s pouhými 6 hodinami trénovacích dat. Překonává vět...
Co by bylo potřeba, aby AI oklamala lidské uši a přesvědčila je, že syntetický smích je skutečný? Generování lidsky znějícího smíchu posouvá hranice audio synté...
AI již dokáže detekovat určité kožní nemoci z obrázků s výkonem, který se v kontrolovaných studiích vyrovná nebo překoná dermatology, zejména u běžných onemocně...
Sektor parfumerie začal využívat AI k předpovídání senzorických preferencí analýzou kulturních, biologických a tržních dat. Tyto systémy dokážou modelovat, jak...
Regionální dialekty často obsahují jedinečné fonetické, gramatické a lexikální prvky, které standardní jazykové modely obtížně přesně zachycují. Jejich překlad...
Současné AI systémy mohou pomáhat pohraničním agenturám skenováním pasových fotografií proti seznamům sledovaných osob, ale stále nedokážou spolehlivě „vybrat p...
Jak můžeme dekódovat, co zvířata „říkají“ prostřednictvím jejich zvuků nebo pohybů? Ačkoli technologie dokáže nyní označovat zvuky zvířat nebo sledovat jejich ř...
Může AI podívat se na tvář dospívajícího a předpovědět, zda později v životě bude plešatý? Současná technologie se snaží číst dědičné nebo věkem podmíněné indic...
AI dokáže rekonstruovat mluvená slova pouze z videozáznamu pohybů rtů, a to i bez přístupu k audiozáznamům. --- Současné AI systémy dokážou rekonstruovat sroz...
Můžeme navrhnout autonomní, uzavřený systém mozek-počítač, který by upravoval emoce uživatele v reálném čase tak, aby dosáhl jakéhokoli cílového psychického sta...
Virtuální realita má potenciál revolučně změnit způsob, jakým vnímáme a interagujeme se světem, a umělá inteligence může tento zážitek potenciálně vylepšit simu...
Vytvoření jedinečné parfémové vůně, která odpovídá chuti konkrétní osoby, je složitý úkol, který vyžaduje porozumění lidskému čichu a preferencím. Umělá intelig...
Co znamená rozpoznávat a klasifikovat houby z obrázků? V podstatě jde o to, že se trénují modely počítačového vidění, aby analyzovaly vizuální vlastnosti jako t...
Autonomous Sensory Meridian Response (ASMR) je komplexní jev, který zahrnuje vyvolání relaxační odezvy u posluchače. Vytvoření personalizované ASMR zkušenosti v...
Parfém je komplexní směs vůní a co se jednomu člověku líbí, jiný nemusí. AI systémy se používají k vytváření nových parfémů, ale dokážou vytvořit takový, který...
Mouku, kterou použila. Vodu z kohoutku měla. Ruce, které věděly, kdy je těsto hotové. Vzpomínka pečená v něm. --- Zatímco AI učinila významné pokroky v genero...
Šťastný/smutný/naštvaný/překvapený — rozpoznáno při hovoru přes video s přijatelnou kvalitou. Subtilnější mikrovýrazy jsou stále těžké. --- Systémy AI dokážou...
Aplikace dějin umění používají toto pro návštěvnické zážitky ve významných muzeích. --- Současné modely hlubokého učení dosáhly významného pokroku v úlohách r...
Výzkumné nástroje, většinou používané ve screeningu a nikoli jako samostatné diagnostiky. Dostatečně účinné, aby je několik univerzit pilotně nasadilo při vstup...
Latin, cyrilice, dévanágarí, arabština, znaky han, hangul — moderní OCR zvládá v podstatě každé písmo s většinově přijatelnou přesností. --- Současné AI systé...
Cornellův Merlinův app udělal z tohoto standardní nástroj pro ornitology. Model zná více ptačích zpěvů než kterýkoli jednotlivý lidský ornitolog. --- AI systé...
Kurzíva, tiskací písmo, smíšené skripty, dokonce i nepořádné škrábance z poznámkového bloku. OCR pro iOS Notes a Apple Pencil se staly opravdu kouzelnými. ---...
Problém vyřešený již od benchmarku Stanford Dogs z roku 2017. Nyní výchozí v každé galerii fotografií. --- Současné AI systémy dokážou identifikovat plemena p...
PlantNet, Seek, iNaturalist — aplikace, které promění každou procházku v terénní průvodce. --- Umělá inteligence dokáže s vysokou přesností identifikovat rost...
DeepMind ukázal toto v roce 2022 pomocí modelu založeného na transformeru, který překonal profesionální čtenáře ze rtů u televizních zpráv. --- Výzkumníci dos...
Vizní modely trénované na bankovních datasetech jsou nasazovány ve všech významných bankách. Nedokonalé, ale lepší než průměrný pokladník. --- Umělá inteligen...
Detektory a generátory jsou v závodě ve zbrojení, ale u většiny současných deepfakeů běžně dostupné detektory označují nad náhodnou úroveň – často výrazně nad n...
OpenAIho Whisper otevřel průmyslově kvalitní rozpoznávání řeči pro 99 jazyků. Telefonní kvalita zvuku se posunula z výzkumné oblasti k jednoduchému „přetáhnout...
Současné systémy rozpoznávání obličeje zvládají desítky let stárnutí s přijatelnou chybovostí. Nejsou dokonalé při extrémních rozdílech, ale běžně poskytují dob...
Shazam-třídní fingerprinting plus moderní strojové učení učinily identifikaci písní vyřešeným problémem na jakémkoli moderním telefonu. --- AI dokáže identifi...
ResNet překonal lidský výkon v benchmarku ImageNet v roce 2015. Dnešní modely to zvládají na telefonech v milisekundách. --- Současné AI systémy dokážou ident...
Přidejte tvrzení do atlasu. Kontrolujeme týdně.
Toto téma stále aktivně zkoumáme. Nastavte si zde upozornění a dáme vám vědět, jakmile přijdou novinky!
Vyberte stranu, dejte jí jednořádkový nadpis, volitelné vysvětlení a kategorii. Příspěvky kontrolujeme týdně.