Les synthétiseurs vocaux IA peuvent maintenant ressembler à un nouveau gadget, mais à mesure que la technologie devient plus sophistiquée, pourrions-nous voir une intégration à grande échelle dans le monde du marketing ?
Apparemment, les synthétiseurs audio IA sont sur le point d'obtenir toute une charge plus sophistiquée que le générateur de rap d'Eminem. Comme si c'était même possible.
Malgré les nombreux problèmes éthiques entourant l'utilisation récréative de l'IA et son potentiel d'utilisations néfastes - avec de la pornographie deepfake non consensuelle, trafiquée désinformation politique, et modifié l'imagerie par satellite parmi les principaux contrevenants de 2021 - il existe des possibilités intéressantes pour qu'il pénètre dans les industries traditionnelles plus tôt que prévu.
Sur ce front, toutes les preuves indiquent que le divertissement est l'avenue la plus prometteuse pour la technologie.
Ce n'est que récemment que nous avons entendu parler de Le brevet de Spotify pour l'apprentissage automatique qui utilisera des repères audio dans notre environnement pour recommander de la musique en fonction de nos humeurs et de la maison de production Lucasfilm embauche de l'artiste deepfake en ligne « Shamook » pour l'aider à améliorer son département d'effets visuels.
Alors qu'il y a un an ou deux, prendre un film à succès et "améliorer" son CGI aurait probablement conduit à un ordre de cesser et de s'abstenir de ses créateurs, il semble y avoir une acceptation croissante du fait que la technologie deviendra partie intégrante de notre des vies.
Au fur et à mesure que cette notion se rapproche, les experts en IA ont le sentiment que la technologie pourrait ensuite cibler le secteur de la publicité. Imaginez simplement des voix de célébrités synthétisées apparaissant sur des emplacements publicitaires ou des identités radio.
Comment fonctionne l'IA vocale
Tout comme les deepfakes visuels, l'IA vocale (ou synthèse vocale) utilise des systèmes d'apprentissage automatique pour extraire un enregistrement dispersé de la voix de quelqu'un à partir de plusieurs sources de données.
Cette collection d'audio brut est ensuite exécutée via un algorithme, qui utilise des synthétiseurs pour tout assembler et former une phrase entrée par l'utilisateur.
Si vous n'avez pas encore perdu des heures à faire des bêtises à Yoda ou à David Attenborough, nous attendrons ici pendant que vous jouez avec l'un des nombreux programmes de bots gratuits en ligne. A défaut, consultez ceci Eminem piste de diss synthétisée de Mark Zuckerberg.
Comme dans l'exemple ci-dessus, la majorité du matériel de clonage vocal en ligne est soit lié à une parodie, soit simplement un exercice de la technologie, même si cela ne veut pas dire qu'il n'a pas déjà fait son apparition dans des projets commerciaux sérieux.
En juillet, un documentaire intitulé Roadrunner a utilisé l'IA vocale pour recréer la voix du chef Anthony Bourdain et prononcer les lignes qu'il avait écrites avant sa mort en 2018. Comme vous pouvez l'imaginer, cela ne s'est pas très bien passé avec une grande partie de ses téléspectateurs.
Une nouvelle controverse a éclaté un mois plus tard, lorsque l'acteur Val Kilmer a utilisé une agence appelée Sonantic pour imiter sa voix avant une trachéotomie pour enlever le cancer de la gorge en 2014.
Alors que beaucoup ont fait l'éloge de la technologie dans le cas de Kilmer, Roadrunner était largement considérée comme exploiteur – d'autant plus que le documentaire n'a pas du tout divulgué l'utilisation de la synthèse vocale.