Meny Meny

Är röst -AI på gränsen till en marknadsföringsexplosion?

AI-talsynteser kan kännas som en ny gimmick nu, men när tekniken blir mer sofistikerad, kan vi se en fullskalig integration i marknadsföringsvärlden?

Tydligen är AI-ljudsynteser på väg att bli en hel last mer sofistikerade än Eminems rapgenerator. Som att det till och med är möjligt.

Trots de många etiska frågorna kring rekreationsanvändningen av AI och dess potential för skändlig användning – med djupfalsk porr utan samtycke, manipulerad politisk desinformation, och modifierad satellitbilder bland huvudbrottslingarna 2021 – det finns spännande möjligheter för det att bryta in i vanliga industrier snabbare än väntat.

På den fronten pekar alla bevis på att underhållning är den mest lovande vägen för tekniken.

Först nyligen har vi hört talas om Spotifys patent för maskininlärning som kommer att använda ljudsignaler i vår miljö för att rekommendera musik baserat på vårt humör och produktionshus Lucasfilm anställa online deepfake artisten "Shamook" för att hjälpa till att förbättra sin avdelning för visuella effekter.

https://youtu.be/yK-l4gz4rUU

Medan för ett eller två år sedan, att ta en storfilm och "förbättra" dess CGI sannolikt skulle ha lett till en order om att upphöra och avstå från dess skapare, verkar det finnas en växande acceptans för att tekniken kommer att bli en del av vår liv.

När fler kommer till den uppfattningen, finns det en känsla bland AI-experter att tekniken nästa kan rikta sig mot reklambranschen. Föreställ dig bara syntetiserade kändisröster som dyker upp på annonsplaceringar eller radioidentifierare.


Hur röst AI fungerar

Ungefär som visuella deepfakes, använder röst AI (eller röstsyntes) maskininlärningssystem för att hämta en spridd registrering av någons röst från flera datakällor.

Denna samling av råljud körs sedan genom en algoritm, som använder syntetiserare för att skarva ihop allt och bilda en meningsinmatning av användaren.

Om du ännu inte har slösat bort timmar på att få Yoda eller David Attenborough att spruta nonsens, väntar vi här medan du leker med ett av många gratis botprogram online. Om det misslyckas, kolla in det här Eminem syntetiserad Mark Zuckerberg diss-spår.

Liksom exemplet ovan är majoriteten av röstklonmaterial online antingen spoofrelaterat eller bara en övning av tekniken, även om det inte är att säga att det inte redan har dykt upp i seriösa kommersiella projekt.

Tillbaka i juli hette en dokumentär Roadrunner använde röst-AI för att återskapa kocken Anthony Bourdains sång och tala ut rader som han hade skrivit före sin död 2018. Som du kan föreställa dig, gick detta inte särskilt bra med en stor del av sina tittare.

Ytterligare kontroverser trummades upp en månad senare, när skådespelaren Val Kilmer använde en byrå som heter Sonantic för att efterlikna hans röst innan en trakeostomi för att ta bort halscancer 2014.

Medan många berömde tekniken i fallet Kilmer, Roadrunner sågs till stor del som exploaterande – särskilt som dokumentären inte alls avslöjade användningen av röstsyntes.


En lukrativ framtid för kändisar och influencers

Känslan för mainstreamanvändning av syntetiserade röster och deepfakes i allmänhet är långt ifrån enhällig, men det finns ett definitivt dubbelriktat intresse från både kändisar och företag att göra licenser för deras användning – ungefär på samma sätt som bildrättigheter.

Ett företag som heter Veritone lanserade tidigare i år en tjänst som gjorde det möjligt för influencers, idrottare och skådespelare att sälja sina virtuella ljudrättigheter för rekommendationer.

I grund och botten tillåter detta kändisar och influencers att tjäna pengar utan att fysiskt behöva resa till en inspelningsstudio eller plats, medan en betalande kund skördar fördelarna av att ha sin röst på kö.

Jag är säker på att kontrakt kommer att vara mer skottsäkra än så, men du förstår kärnan.

Så länge som talangen är glad att hyra ut en simulacrum av sig själva, kommer det nästan säkert att finnas framtida möjligheter för stora namn att tjäna pengar på.

Bruce Willis, till exempel, har redan licensierat sin bild för att användas som en deepfake på ryska mobilannonser. Att göra det faktum även mer dystopiskt, vi pratar unga Willis rakt ut ur VARA SEGLIVAD epok.

Här och nu är applikationer som Veritone få och långt mellan, men röstsyntes används redan av podcaster.

Ett sådant företag, Descript, har skapat en funktion som heter 'Överdubb' som låter poddsändare syntetisera sina egna röster. På så sätt kan program och transkriptioner sömlöst redigeras i farten.

Prat om oäkta innehåll kommer alltid att mötas med oro och kritik, men det hindrar inte industrier från att komma över till idén om AI. Tvärtom, det blir mer avancerat och svårare att upptäcka för varje dag.

Det ska bli intressant för vem som hoppar först vid dessa möjligheter. Jag skulle vara mycket mer villig att köpa PPI om Patrick Stewart sa det.

Tillgänglighet