I sintetizzatori vocali AI possono sembrare un nuovo espediente ora, ma man mano che la tecnologia diventa più sofisticata, potremmo vedere un'integrazione su vasta scala nel mondo del marketing?
Apparentemente, i sintetizzatori audio AI stanno per diventare un carico intero più sofisticato del generatore rap di Eminem. Come se fosse possibile.
Nonostante le numerose questioni etiche che circondano l'uso ricreativo dell'IA e il suo potenziale per usi nefasti, con il porno deepfake non consensuale, falsificato disinformazione politica, e modificato immagini satellitari tra i principali trasgressori del 2021: ci sono possibilità entusiasmanti che possa irrompere nelle industrie tradizionali prima del previsto.
Su questo fronte, tutte le prove indicano l'intrattenimento come la strada più promettente per la tecnologia.
Solo di recente ne abbiamo sentito parlare Il brevetto di Spotify per l'apprendimento automatico che utilizzerà segnali audio nel nostro ambiente per consigliare musica in base ai nostri stati d'animo e casa di produzione Lucasfilm assumendo l'artista di deepfake online "Shamook" per aiutare a migliorare il suo reparto di effetti visivi.
Mentre un anno o due fa, prendere un film di successo e "migliorare" la sua CGI avrebbe probabilmente portato a un ordine di cessazione e desistere da parte dei suoi creatori, sembra esserci una crescente accettazione del fatto che la tecnologia diventerà parte integrante del nostro vive.
Man mano che si avvicina di più a questa nozione, tra gli esperti di intelligenza artificiale c'è la sensazione che la tecnologia possa successivamente prendere di mira il settore pubblicitario. Immagina solo voci sintetizzate di celebrità che spuntano su posizionamenti pubblicitari o identificazioni radiofoniche.
Come funziona l'intelligenza artificiale vocale
Proprio come i deepfake visivi, l'intelligenza artificiale vocale (o sintesi vocale) utilizza sistemi di apprendimento automatico per estrarre una registrazione sparsa della voce di qualcuno da più fonti di dati.
Questa raccolta di audio non elaborato viene quindi eseguita attraverso un algoritmo, che utilizza sintetizzatori per unire il tutto e formare una frase inserita dall'utente.
Se non hai ancora sprecato ore a fare sciocchezze a Yoda o David Attenborough, aspetteremo qui mentre giochi con uno dei tanti programmi bot gratuiti online. In caso contrario, dai un'occhiata a questo Eminem traccia diss sintetizzata di Mark Zuckerberg.
Come nell'esempio sopra, la maggior parte del materiale di clonazione vocale online è correlato alla parodia o semplicemente un esercizio della tecnologia, anche se questo non vuol dire che non sia già apparso in seri progetti commerciali.
A luglio, un documentario intitolato Roadrunner ha utilizzato l'intelligenza artificiale vocale per ricreare la voce dello chef Anthony Bourdain e pronunciare le battute che aveva scritto prima della sua morte nel 2018. Come puoi immaginare, questo non è andato molto bene con una grossa fetta dei suoi spettatori.
Ulteriori polemiche sono sorte un mese dopo, quando l'attore Val Kilmer ha utilizzato un'agenzia chiamata Sonantic per emulare la sua voce prima di una tracheostomia per rimuovere il cancro alla gola nel 2014.
Mentre molti hanno elogiato la tecnologia nel caso di Kilmer, Roadrunner era in gran parte visto come sfruttamento – soprattutto perché il documentario non ha rivelato affatto l'uso della sintesi vocale.