Syntezatory mowy AI mogą teraz wydawać się nowatorską sztuczką, ale w miarę jak technologia staje się bardziej wyrafinowana, czy możemy zobaczyć pełną integrację ze światem marketingu?
Wygląda na to, że syntezatory audio AI mają być o wiele bardziej wyrafinowane niż generator rapu Eminema. Jakby to było nawet możliwe.
Pomimo wielu problemów etycznych związanych z rekreacyjnym wykorzystaniem sztucznej inteligencji i jej potencjałem do nikczemnych zastosowań – z nieprzyzwoleniem na pornografię deepfake, sfałszowany dezinformacja politycznai zmodyfikowane zdjęcia satelitarne wśród głównych przestępców 2021 r. – istnieją ekscytujące możliwości, aby włamać się do głównych branż szybciej niż oczekiwano.
Na tym froncie wszystkie dowody wskazują na rozrywkę jako najbardziej obiecującą drogę dla technologii.
Dopiero niedawno słyszeliśmy Patent Spotify do uczenia maszynowego, które będzie wykorzystywać sygnały dźwiękowe w naszym środowisku, aby polecać muzykę w oparciu o nasze nastroje i dom produkcyjny Lucasfilm zatrudnienie internetowego twórcy deepfake „Shamook”, aby pomógł ulepszyć dział efektów wizualnych.
Podczas gdy rok lub dwa lata temu zrobienie przeboju filmowego i „ulepszenie” jego grafiki komputerowej prawdopodobnie doprowadziłoby do nakazu zaprzestania działalności ze strony jego twórców, wydaje się, że rośnie akceptacja, że technologia stanie się nieodłączną częścią naszego zyje.
W miarę, jak coraz więcej pojawia się w tej kwestii, wśród ekspertów AI panuje przekonanie, że technologia może następnie zaatakować branżę reklamową. Wyobraź sobie syntetyczne głosy celebrytów pojawiające się w miejscach docelowych reklam lub identyfikatorach radiowych.
Jak działa głosowa sztuczna inteligencja
Podobnie jak wizualne podróbki, sztuczna inteligencja (lub synteza głosu) wykorzystuje systemy uczenia maszynowego do pobierania rozproszonego zapisu czyjegoś głosu z wielu źródeł danych.
Ten zbiór nieprzetworzonego dźwięku jest następnie przetwarzany przez algorytm, który wykorzystuje syntezatory do łączenia ich w całość i tworzenia zdania wprowadzanego przez użytkownika.
Jeśli jeszcze nie zmarnowałeś godzin, robiąc bzdury z Yody lub Davida Attenborough, poczekamy tutaj, podczas gdy Ty będziesz bawić się jednym z wielu darmowych programów botów online. Jeśli to się nie uda, sprawdź to Eminem zsyntetyzowany utwór Mark Zuckerberg diss.
Podobnie jak w powyższym przykładzie, większość materiałów do klonowania głosu w Internecie jest albo związana z fałszowaniem, albo tylko z wykorzystaniem technologii, choć nie oznacza to, że nie pojawiła się jeszcze w poważnych projektach komercyjnych.
W lipcu film dokumentalny zatytułowany Roadrunner wykorzystał sztuczną inteligencję głosową do odtworzenia wokalu szefa kuchni Anthony'ego Bourdaina i wypowiadania słów, które napisał przed śmiercią w 2018 roku. Jak możesz sobie wyobrazić, nie spodobało się to dużej części widzów.
Dalsze kontrowersje pojawiły się miesiąc później, kiedy aktor Val Kilmer użył agencji Sonantic, aby naśladować jego głos przed tracheostomią w celu usunięcia raka gardła w 2014 roku.
Podczas gdy wielu chwaliło technologię w przypadku Kilmera, Roadrunner był w dużej mierze postrzegany jako wyzyskujący – zwłaszcza, że dokument w ogóle nie ujawnił użycia syntezy głosu.