Menu Menu

L'IA vocale è sull'orlo di un'esplosione di marketing?

I sintetizzatori vocali AI possono sembrare un nuovo espediente ora, ma man mano che la tecnologia diventa più sofisticata, potremmo vedere un'integrazione su vasta scala nel mondo del marketing?

Apparentemente, i sintetizzatori audio AI stanno per diventare un carico intero più sofisticato del generatore rap di Eminem. Come se fosse possibile.

Nonostante le numerose questioni etiche che circondano l'uso ricreativo dell'IA e il suo potenziale per usi nefasti, con il porno deepfake non consensuale, falsificato disinformazione politica, e modificato immagini satellitari tra i principali trasgressori del 2021: ci sono possibilità entusiasmanti che possa irrompere nelle industrie tradizionali prima del previsto.

Su questo fronte, tutte le prove indicano l'intrattenimento come la strada più promettente per la tecnologia.

Solo di recente ne abbiamo sentito parlare Il brevetto di Spotify per l'apprendimento automatico che utilizzerà segnali audio nel nostro ambiente per consigliare musica in base ai nostri stati d'animo e casa di produzione Lucasfilm assumendo l'artista di deepfake online "Shamook" per aiutare a migliorare il suo reparto di effetti visivi.

https://youtu.be/yK-l4gz4rUU

Mentre un anno o due fa, prendere un film di successo e "migliorare" la sua CGI avrebbe probabilmente portato a un ordine di cessazione e desistere da parte dei suoi creatori, sembra esserci una crescente accettazione del fatto che la tecnologia diventerà parte integrante del nostro vive.

Man mano che si avvicina di più a questa nozione, tra gli esperti di intelligenza artificiale c'è la sensazione che la tecnologia possa successivamente prendere di mira il settore pubblicitario. Immagina solo voci sintetizzate di celebrità che spuntano su posizionamenti pubblicitari o identificazioni radiofoniche.


Come funziona l'intelligenza artificiale vocale

Proprio come i deepfake visivi, l'intelligenza artificiale vocale (o sintesi vocale) utilizza sistemi di apprendimento automatico per estrarre una registrazione sparsa della voce di qualcuno da più fonti di dati.

Questa raccolta di audio non elaborato viene quindi eseguita attraverso un algoritmo, che utilizza sintetizzatori per unire il tutto e formare una frase inserita dall'utente.

Se non hai ancora sprecato ore a fare sciocchezze a Yoda o David Attenborough, aspetteremo qui mentre giochi con uno dei tanti programmi bot gratuiti online. In caso contrario, dai un'occhiata a questo Eminem traccia diss sintetizzata di Mark Zuckerberg.

Come nell'esempio sopra, la maggior parte del materiale di clonazione vocale online è correlato alla parodia o semplicemente un esercizio della tecnologia, anche se questo non vuol dire che non sia già apparso in seri progetti commerciali.

A luglio, un documentario intitolato Roadrunner ha utilizzato l'intelligenza artificiale vocale per ricreare la voce dello chef Anthony Bourdain e pronunciare le battute che aveva scritto prima della sua morte nel 2018. Come puoi immaginare, questo non è andato molto bene con una grossa fetta dei suoi spettatori.

Ulteriori polemiche sono sorte un mese dopo, quando l'attore Val Kilmer ha utilizzato un'agenzia chiamata Sonantic per emulare la sua voce prima di una tracheostomia per rimuovere il cancro alla gola nel 2014.

Mentre molti hanno elogiato la tecnologia nel caso di Kilmer, Roadrunner era in gran parte visto come sfruttamento – soprattutto perché il documentario non ha rivelato affatto l'uso della sintesi vocale.


Un futuro redditizio per celebrità e influencer

Il sentimento verso l'uso mainstream delle voci sintetizzate e dei deepfake in generale è tutt'altro che unanime, ma c'è un chiaro interesse a doppio senso sia da parte delle celebrità che delle aziende a concedere licenze per il loro utilizzo, allo stesso modo dei diritti di immagine.

Riconoscendo questo, una società chiamata Veritone ha lanciato un servizio all'inizio di quest'anno che consente a influencer, atleti e attori di vendere i loro diritti audio virtuali per sponsorizzazioni.

In sostanza, ciò consente alle celebrità e agli influencer di guadagnare senza doversi recare fisicamente in uno studio di registrazione o in un luogo, mentre un cliente pagante raccoglie i vantaggi di avere la propria voce al comando.

Sono sicuro che i contratti saranno più a prova di proiettile, ma hai capito il succo.

Finché il talento è felice di affittare un simulacro di se stesso, ci saranno quasi sicuramente opportunità future per i grandi nomi di incassare.

Bruce Willis, ad esempio, ha già concesso in licenza la sua immagine per essere utilizzata come deepfake in russo annunci di telefoni cellulari. Facendo questo fatto anche più distopico, stiamo parlando del giovane Willis uscito direttamente dal Die Hard epoca.

Nel qui e ora, le applicazioni come Veritone sono poche e lontane tra loro, ma la sintesi vocale è già utilizzata dai podcast.

Una di queste società, Descript, ha creato una funzionalità chiamata "Sovraincisione' che consente ai podcaster di sintetizzare le proprie voci. In questo modo, gli spettacoli e le trascrizioni possono essere modificati al volo senza problemi.

Parlare di qualsiasi contenuto non autentico sarà sempre accolto con preoccupazione e critica, ma ciò non impedisce alle industrie di avvicinarsi all'idea dell'IA. Al contrario, sta diventando più avanzato e più difficile da rilevare di giorno in giorno.

Sarà interessante per chi si lancia per primo in queste opportunità. Sarei molto più disposto a comprare PPI se lo dicesse Patrick Stewart.

Accessibilità