Menú Menú

¿Está la IA de voz al borde de una explosión de marketing?

Los sintetizadores de voz de IA pueden parecer un truco novedoso ahora, pero a medida que la tecnología se vuelve más sofisticada, ¿podríamos ver una integración a gran escala en el mundo del marketing?

Aparentemente, los sintetizadores de audio AI están a punto de volverse mucho más sofisticados que el generador de rap de Eminem. Como si eso fuera posible.

A pesar de los muchos problemas éticos que rodean el uso recreativo de la IA y su potencial para usos nefastos, con pornografía deepfake no consensuada, manipulada desinformación políticay modificado imágenes de satélite entre los principales infractores de 2021: existen interesantes posibilidades de que ingrese a las industrias principales antes de lo esperado.

En ese frente, toda la evidencia apunta hacia el entretenimiento como la vía más prometedora para la tecnología.

Recientemente, hemos oído hablar de Patente de Spotify para el aprendizaje automático que utilizará señales de audio en nuestro entorno para recomendar música según nuestro estado de ánimo y la casa de producción Lucasfilm contratar al artista de deepfake en línea 'Shamook' para ayudar a mejorar su departamento de efectos visuales.

https://youtu.be/yK-l4gz4rUU

Mientras que hace uno o dos años, tomar una película de gran éxito y 'mejorar' su CGI probablemente habría llevado a una orden de cese y desistimiento de sus creadores, parece haber una aceptación cada vez mayor de que la tecnología se convertirá en parte integral de nuestra tecnología. vidas.

A medida que más se acercan a esa noción, existe la sensación entre los expertos en inteligencia artificial de que la tecnología puede apuntar a la industria de la publicidad. Imagínense voces de celebridades sintetizadas apareciendo en la colocación de anuncios o identificaciones de radio.


Cómo funciona la IA por voz

Al igual que los deepfakes visuales, la IA de voz (o síntesis de voz) utiliza sistemas de aprendizaje automático para extraer un registro disperso de la voz de alguien a partir de múltiples fuentes de datos.

Esta colección de audio en bruto se ejecuta luego a través de un algoritmo, que usa sintetizadores para unirlo todo y formar una entrada de oración por parte del usuario.

Si aún no has perdido horas haciendo que Yoda o David Attenborough digan tonterías, te esperaremos aquí mientras juegas con uno de los muchos programas de bot gratuitos en línea. Si eso falla, mira esto Eminem sintetizó la pista de distorsión de Mark Zuckerberg.

Al igual que en el ejemplo anterior, la mayoría del material de clonación de voz en línea está relacionado con la parodia o simplemente es un ejercicio de la tecnología, aunque eso no quiere decir que aún no haya aparecido en proyectos comerciales serios.

En julio, un documental llamado Roadrunner usó IA de voz para recrear la voz del chef Anthony Bourdain y expresar las líneas que había escrito antes de su muerte en 2018. Como puedes imaginar, esto no fue muy bien recibido por una gran parte de sus espectadores.

Se generó más controversia un mes después, cuando el actor Val Kilmer utilizó una agencia llamada Sonantic para emular su voz antes de una traqueotomía para extirpar el cáncer de garganta en 2014.

Si bien muchos elogiaron la tecnología en el caso de Kilmer, Roadrunner fue visto en gran parte como explotador - especialmente porque el documental no reveló en absoluto el uso de la síntesis de voz.


Un futuro lucrativo para celebridades e influencers

El sentimiento hacia el uso generalizado de voces sintetizadas y deepfakes en general está lejos de ser unánime, pero hay un claro interés bidireccional tanto de celebridades como de empresas para otorgar licencias para su uso, de la misma manera que los derechos de imagen.

Reconociendo esto, una compañía llamada Veritone lanzó un servicio a principios de este año que permite a personas influyentes, atletas y actores vender sus derechos de audio virtual para respaldos.

En esencia, esto permite que las celebridades y las personas influyentes obtengan ingresos sin tener que viajar físicamente a un estudio de grabación o lugar, mientras que un cliente que paga obtiene los beneficios de tener su voz en el momento justo.

Estoy seguro de que los contratos serán más a prueba de balas que eso, pero entiendes la esencia.

Mientras el talento esté feliz alquilando un simulacro de sí mismo, es casi seguro que habrá oportunidades futuras para que los grandes nombres saquen provecho.

Bruce Willis, por ejemplo, ya ha licenciado su imagen para ser utilizada como deepfake en ruso. anuncios de telefonía móvil. Haciendo ese hecho incluso más distópico, estamos hablando del joven Willis recién salido de la Die Hard era.

En el aquí y ahora, las aplicaciones como Veritone son pocas y distantes entre sí, pero los podcasts ya utilizan la síntesis de voz.

Una de esas empresas, Descript, ha creado una función llamada 'Sobregrabar'que permite a los podcasters sintetizar sus propias voces. De esta manera, los programas y las transcripciones se pueden editar sin problemas sobre la marcha.

Hablar de cualquier contenido no auténtico siempre será recibido con preocupación y críticas, pero eso no impide que las industrias adopten la idea de la IA. Por el contrario, cada día es más avanzado y más difícil de detectar.

Será interesante para quién salte primero en estas oportunidades. Estaría mucho más dispuesto a comprar PPI si Patrick Stewart lo dijera.

Accesibilidad