Menu Menu

Czy głosowa sztuczna inteligencja jest na skraju marketingowej eksplozji?

Syntezatory mowy AI mogą teraz wydawać się nowatorską sztuczką, ale w miarę jak technologia staje się bardziej wyrafinowana, czy możemy zobaczyć pełną integrację ze światem marketingu?

Wygląda na to, że syntezatory audio AI mają być o wiele bardziej wyrafinowane niż generator rapu Eminema. Jakby to było nawet możliwe.

Pomimo wielu problemów etycznych związanych z rekreacyjnym wykorzystaniem sztucznej inteligencji i jej potencjałem do nikczemnych zastosowań – z nieprzyzwoleniem na pornografię deepfake, sfałszowany dezinformacja politycznai zmodyfikowane zdjęcia satelitarne wśród głównych przestępców 2021 r. – istnieją ekscytujące możliwości, aby włamać się do głównych branż szybciej niż oczekiwano.

Na tym froncie wszystkie dowody wskazują na rozrywkę jako najbardziej obiecującą drogę dla technologii.

Dopiero niedawno słyszeliśmy Patent Spotify do uczenia maszynowego, które będzie wykorzystywać sygnały dźwiękowe w naszym środowisku, aby polecać muzykę w oparciu o nasze nastroje i dom produkcyjny Lucasfilm zatrudnienie internetowego twórcy deepfake „Shamook”, aby pomógł ulepszyć dział efektów wizualnych.

https://youtu.be/yK-l4gz4rUU

Podczas gdy rok lub dwa lata temu zrobienie przeboju filmowego i „ulepszenie” jego grafiki komputerowej prawdopodobnie doprowadziłoby do nakazu zaprzestania działalności ze strony jego twórców, wydaje się, że rośnie akceptacja, że ​​technologia stanie się nieodłączną częścią naszego zyje.

W miarę, jak coraz więcej pojawia się w tej kwestii, wśród ekspertów AI panuje przekonanie, że technologia może następnie zaatakować branżę reklamową. Wyobraź sobie syntetyczne głosy celebrytów pojawiające się w miejscach docelowych reklam lub identyfikatorach radiowych.


Jak działa głosowa sztuczna inteligencja

Podobnie jak wizualne podróbki, sztuczna inteligencja (lub synteza głosu) wykorzystuje systemy uczenia maszynowego do pobierania rozproszonego zapisu czyjegoś głosu z wielu źródeł danych.

Ten zbiór nieprzetworzonego dźwięku jest następnie przetwarzany przez algorytm, który wykorzystuje syntezatory do łączenia ich w całość i tworzenia zdania wprowadzanego przez użytkownika.

Jeśli jeszcze nie zmarnowałeś godzin, robiąc bzdury z Yody lub Davida Attenborough, poczekamy tutaj, podczas gdy Ty będziesz bawić się jednym z wielu darmowych programów botów online. Jeśli to się nie uda, sprawdź to Eminem zsyntetyzowany utwór Mark Zuckerberg diss.

Podobnie jak w powyższym przykładzie, większość materiałów do klonowania głosu w Internecie jest albo związana z fałszowaniem, albo tylko z wykorzystaniem technologii, choć nie oznacza to, że nie pojawiła się jeszcze w poważnych projektach komercyjnych.

W lipcu film dokumentalny zatytułowany Roadrunner wykorzystał sztuczną inteligencję głosową do odtworzenia wokalu szefa kuchni Anthony'ego Bourdaina i wypowiadania słów, które napisał przed śmiercią w 2018 roku. Jak możesz sobie wyobrazić, nie spodobało się to dużej części widzów.

Dalsze kontrowersje pojawiły się miesiąc później, kiedy aktor Val Kilmer użył agencji Sonantic, aby naśladować jego głos przed tracheostomią w celu usunięcia raka gardła w 2014 roku.

Podczas gdy wielu chwaliło technologię w przypadku Kilmera, Roadrunner był w dużej mierze postrzegany jako wyzyskujący – zwłaszcza, że ​​dokument w ogóle nie ujawnił użycia syntezy głosu.


Lukratywna przyszłość dla celebrytów i influencerów

Ogólnie rzecz biorąc, przekonanie o głównym nurcie korzystania z syntezowanych głosów i deepfake jest dalekie od jednomyślności, ale istnieje wyraźne obustronne zainteresowanie zarówno celebrytów, jak i firm, aby uzyskać licencje na ich wykorzystanie – podobnie jak prawa do wizerunku.

Zdając sobie z tego sprawę, firma o nazwie Veritone uruchomiła na początku tego roku usługę pozwalającą wpływowym, sportowcom i aktorom sprzedawać swoje wirtualne prawa do dźwięku w celu uzyskania poparcia.

Zasadniczo pozwala to celebrytom i wpływowym zarabiać bez konieczności fizycznej podróży do studia nagraniowego lub miejsca, podczas gdy płacący klient czerpie korzyści z posiadania swojego głosu na zawołanie.

Jestem pewien, że kontrakty będą bardziej kuloodporne, ale rozumiesz.

Dopóki talent jest szczęśliwy, wynajmując swoją symulakrum, prawie na pewno pojawią się w przyszłości okazje do zarabiania przez wielkie nazwiska.

Na przykład Bruce Willis wydał już licencję na wykorzystanie swojego wizerunku jako deepfake w języku rosyjskim reklamy na telefony komórkowe. Robiąc ten fakt nawet bardziej dystopijny, mówimy o młodym Willisie prosto z domu Szklana pułapka era.

Tu i teraz aplikacje takie jak Veritone są bardzo nieliczne, ale synteza głosu jest już wykorzystywana przez podcasty.

Jedna z takich firm, Descript, stworzyła funkcję o nazwie „Dogrywanie”, który umożliwia podcastom syntezę własnych głosów. W ten sposób programy i transkrypcje można bezproblemowo edytować w locie.

Rozmowy o jakichkolwiek nieautentycznych treściach zawsze będą spotykać się z obawami i krytyką, ale to nie powstrzymuje przemysłu przed podejściem do idei sztucznej inteligencji. Wręcz przeciwnie, z dnia na dzień staje się coraz bardziej zaawansowany i trudniejszy do wykrycia.

Ciekawe będzie, kto pierwszy skoczy na te okazje. Byłbym o wiele bardziej skłonny do zakupu PPI, gdyby Patrick Stewart tak powiedział.

dostępność