AI-talsynteser kan kännas som en ny gimmick nu, men när tekniken blir mer sofistikerad, kan vi se en fullskalig integration i marknadsföringsvärlden?
Tydligen är AI-ljudsynteser på väg att bli en hel last mer sofistikerade än Eminems rapgenerator. Som att det till och med är möjligt.
Trots de många etiska frågorna kring rekreationsanvändningen av AI och dess potential för skändlig användning – med djupfalsk porr utan samtycke, manipulerad politisk desinformation, och modifierad satellitbilder bland huvudbrottslingarna 2021 – det finns spännande möjligheter för det att bryta in i vanliga industrier snabbare än väntat.
På den fronten pekar alla bevis på att underhållning är den mest lovande vägen för tekniken.
Först nyligen har vi hört talas om Spotifys patent för maskininlärning som kommer att använda ljudsignaler i vår miljö för att rekommendera musik baserat på vårt humör och produktionshus Lucasfilm anställa online deepfake artisten "Shamook" för att hjälpa till att förbättra sin avdelning för visuella effekter.
Medan för ett eller två år sedan, att ta en storfilm och "förbättra" dess CGI sannolikt skulle ha lett till en order om att upphöra och avstå från dess skapare, verkar det finnas en växande acceptans för att tekniken kommer att bli en del av vår liv.
När fler kommer till den uppfattningen, finns det en känsla bland AI-experter att tekniken nästa kan rikta sig mot reklambranschen. Föreställ dig bara syntetiserade kändisröster som dyker upp på annonsplaceringar eller radioidentifierare.
Hur röst AI fungerar
Ungefär som visuella deepfakes, använder röst AI (eller röstsyntes) maskininlärningssystem för att hämta en spridd registrering av någons röst från flera datakällor.
Denna samling av råljud körs sedan genom en algoritm, som använder syntetiserare för att skarva ihop allt och bilda en meningsinmatning av användaren.
Om du ännu inte har slösat bort timmar på att få Yoda eller David Attenborough att spruta nonsens, väntar vi här medan du leker med ett av många gratis botprogram online. Om det misslyckas, kolla in det här Eminem syntetiserad Mark Zuckerberg diss-spår.
Liksom exemplet ovan är majoriteten av röstklonmaterial online antingen spoofrelaterat eller bara en övning av tekniken, även om det inte är att säga att det inte redan har dykt upp i seriösa kommersiella projekt.
Tillbaka i juli hette en dokumentär Roadrunner använde röst-AI för att återskapa kocken Anthony Bourdains sång och tala ut rader som han hade skrivit före sin död 2018. Som du kan föreställa dig, gick detta inte särskilt bra med en stor del av sina tittare.
Ytterligare kontroverser trummades upp en månad senare, när skådespelaren Val Kilmer använde en byrå som heter Sonantic för att efterlikna hans röst innan en trakeostomi för att ta bort halscancer 2014.
Medan många berömde tekniken i fallet Kilmer, Roadrunner sågs till stor del som exploaterande – särskilt som dokumentären inte alls avslöjade användningen av röstsyntes.