Menu Menu

L'IA vocale est-elle au bord d'une explosion marketing ?

Les synthétiseurs vocaux IA peuvent maintenant ressembler à un nouveau gadget, mais à mesure que la technologie devient plus sophistiquée, pourrions-nous voir une intégration à grande échelle dans le monde du marketing ?

Apparemment, les synthétiseurs audio IA sont sur le point d'obtenir toute une charge plus sophistiquée que le générateur de rap d'Eminem. Comme si c'était même possible.

Malgré les nombreux problèmes éthiques entourant l'utilisation récréative de l'IA et son potentiel d'utilisations néfastes - avec de la pornographie deepfake non consensuelle, trafiquée désinformation politique, et modifié l'imagerie par satellite parmi les principaux contrevenants de 2021 - il existe des possibilités intéressantes pour qu'il pénètre dans les industries traditionnelles plus tôt que prévu.

Sur ce front, toutes les preuves indiquent que le divertissement est l'avenue la plus prometteuse pour la technologie.

Ce n'est que récemment que nous avons entendu parler de Le brevet de Spotify pour l'apprentissage automatique qui utilisera des repères audio dans notre environnement pour recommander de la musique en fonction de nos humeurs et de la maison de production Lucasfilm embauche de l'artiste deepfake en ligne « Shamook » pour l'aider à améliorer son département d'effets visuels.

https://youtu.be/yK-l4gz4rUU

Alors qu'il y a un an ou deux, prendre un film à succès et "améliorer" son CGI aurait probablement conduit à un ordre de cesser et de s'abstenir de ses créateurs, il semble y avoir une acceptation croissante du fait que la technologie deviendra partie intégrante de notre des vies.

Au fur et à mesure que cette notion se rapproche, les experts en IA ont le sentiment que la technologie pourrait ensuite cibler le secteur de la publicité. Imaginez simplement des voix de célébrités synthétisées apparaissant sur des emplacements publicitaires ou des identités radio.


Comment fonctionne l'IA vocale

Tout comme les deepfakes visuels, l'IA vocale (ou synthèse vocale) utilise des systèmes d'apprentissage automatique pour extraire un enregistrement dispersé de la voix de quelqu'un à partir de plusieurs sources de données.

Cette collection d'audio brut est ensuite exécutée via un algorithme, qui utilise des synthétiseurs pour tout assembler et former une phrase entrée par l'utilisateur.

Si vous n'avez pas encore perdu des heures à faire des bêtises à Yoda ou à David Attenborough, nous attendrons ici pendant que vous jouez avec l'un des nombreux programmes de bots gratuits en ligne. A défaut, consultez ceci Eminem piste de diss synthétisée de Mark Zuckerberg.

Comme dans l'exemple ci-dessus, la majorité du matériel de clonage vocal en ligne est soit lié à une parodie, soit simplement un exercice de la technologie, même si cela ne veut pas dire qu'il n'a pas déjà fait son apparition dans des projets commerciaux sérieux.

En juillet, un documentaire intitulé Roadrunner a utilisé l'IA vocale pour recréer la voix du chef Anthony Bourdain et prononcer les lignes qu'il avait écrites avant sa mort en 2018. Comme vous pouvez l'imaginer, cela ne s'est pas très bien passé avec une grande partie de ses téléspectateurs.

Une nouvelle controverse a éclaté un mois plus tard, lorsque l'acteur Val Kilmer a utilisé une agence appelée Sonantic pour imiter sa voix avant une trachéotomie pour enlever le cancer de la gorge en 2014.

Alors que beaucoup ont fait l'éloge de la technologie dans le cas de Kilmer, Roadrunner était largement considérée comme exploiteur – d'autant plus que le documentaire n'a pas du tout divulgué l'utilisation de la synthèse vocale.


Un avenir lucratif pour les célébrités et les influenceurs

Le sentiment envers l'utilisation généralisée des voix synthétisées et des deepfakes en général est loin d'être unanime, mais il existe un intérêt bidirectionnel certain de la part des célébrités et des entreprises à créer des licences pour leur utilisation, de la même manière que les droits d'image.

Reconnaissant cela, une société appelée Veritone a lancé un service plus tôt cette année permettant aux influenceurs, aux athlètes et aux acteurs de vendre leurs droits audio virtuels pour des endossements.

Essentiellement, cela permet aux célébrités et aux influenceurs de générer des revenus sans avoir à se rendre physiquement dans un studio d'enregistrement ou un lieu, tandis qu'un client payant profite des avantages d'avoir sa voix au bon moment.

Je suis sûr que les contrats seront plus à l'épreuve des balles que cela, mais vous comprenez l'essentiel.

Tant que le talent est heureux de louer un simulacre d'eux-mêmes, il y aura presque certainement de futures opportunités pour les grands noms de tirer profit.

Bruce Willis, par exemple, a déjà autorisé son image à être utilisée comme deepfake en russe annonces de téléphonie mobile. Faire ce fait pair plus dystopique, nous parlons du jeune Willis tout droit sorti du Die Hard ère.

Dans l'ici et maintenant, les applications comme Veritone sont rares, mais la synthèse vocale est déjà utilisée par les podcasts.

L'une de ces entreprises, Descript, a créé une fonctionnalité appelée "overdub' qui permet aux podcasteurs de synthétiser leurs propres voix. De cette façon, les émissions et les transcriptions peuvent être modifiées de manière transparente à la volée.

Parler de tout contenu inauthentique sera toujours accueilli avec inquiétude et critique, mais cela n'empêche pas les industries de se rallier à l'idée de l'IA. Au contraire, il devient de plus en plus avancé et plus difficile à détecter de jour en jour.

Ce sera intéressant de savoir qui saute en premier sur ces opportunités. Je serais beaucoup plus disposé à acheter du PPI si Patrick Stewart le disait.

Accessibilité