Czy AI może wiarygodnie sklonować głos na podstawie 30-sekundowego próbki ?
Cast your vote — then read what our editor and the AI models found.
ElevenLabs umieścił cloning głosu o jakości nadawczej na pulpicie SaaS. Audiobooki, dubbing i wykrywanie oszukańczych połączeń całkowicie się zmieniły.
Obecne systemy AI są w stanie wiarygodnie klonować głos na podstawie stosunkowo krótkiego próbki audio, w tym nawet 30-sekundowego nagrania. Osiąga się to dzięki zastosowaniu algorytmów głębokiego uczenia, takich jak modele fali i neuralne wokodery, które mogą wyuczyć się wzorców i charakterystyki głosu na podstawie ograniczonej ilości danych. Modele te mogą następnie generować nowe audio, które naśladuje oryginalny głos, włącznie z tonem, wysokością i rytmem. Jakość sklonowanego głosu może być zaskakująco wysoka, co utrudnia odróżnienie go od oryginału.
— Wzbogacono 9 maja 2026 · Źródło: IEEE Spectrum — https://spectrum.ieee.org/ai-clones-human-voices
Galeria
Jeszcze nie ma żadnych obrazów — wgraj jeden poniżej, aby rozpocząć galerię.
Nie zgadzasz się? Zostaw swój komentarz poniżej.