Menu Menu

A IA de voz está à beira de uma explosão de marketing?

Os sintetizadores de voz de IA podem parecer um novo truque agora, mas à medida que a tecnologia se torna mais sofisticada, poderíamos ver uma integração em grande escala no mundo do marketing?

Aparentemente, os sintetizadores de áudio AI estão prestes a ficar muito mais sofisticados do que o gerador de rap de Eminem. Como se isso fosse possível.

Apesar das muitas questões éticas que cercam o uso recreativo de IA e seu potencial para usos nefastos - com pornografia profunda não consensual, adulterada desinformação política, e modificado imagens de satélite entre os principais infratores de 2021 - há possibilidades empolgantes para que ele entre nas principais indústrias mais cedo do que o esperado.

Nessa frente, todas as evidências apontam para o entretenimento como a via mais promissora para a tecnologia.

Recentemente, ouvimos falar de Patente do Spotify para aprendizado de máquina, que usará pistas de áudio em nosso ambiente para recomendar músicas com base em nosso humor e casa de produção Lucasfilm contratando o artista deepfake online 'Shamook' para ajudar a melhorar seu departamento de efeitos visuais.

https://youtu.be/yK-l4gz4rUU

Embora um ou dois anos atrás, pegar um filme de grande sucesso e 'melhorar' seu CGI provavelmente levasse a uma ordem de cessar e desistir de seus criadores, parece haver uma aceitação crescente de que a tecnologia se tornará parte integrante de nosso vidas.

À medida que mais pessoas chegam a essa noção, há um sentimento entre os especialistas em IA de que a tecnologia pode ter como alvo a indústria de publicidade. Imaginem vozes de celebridades sintetizadas aparecendo em canais de anúncios ou idents de rádio.


Como funciona a IA por voz

Assim como os deepfakes visuais, a IA de voz (ou síntese de voz) usa sistemas de aprendizado de máquina para extrair um registro disperso da voz de alguém de várias fontes de dados.

Essa coleção de áudio bruto é então executada por meio de um algoritmo, que usa sintetizadores para unir tudo e formar uma entrada de frase pelo usuário.

Se você ainda não perdeu horas fazendo Yoda ou David Attenborough dizerem bobagens, vamos esperar aqui enquanto você brinca com um dos muitos programas de bot online gratuitos. Se falhar, verifique este Eminem faixa diss sintetizada de Mark Zuckerberg.

Como no exemplo acima, a maioria do material de clone de voz online é relacionado a spoofing ou apenas um exercício da tecnologia, embora isso não queira dizer que ainda não tenha feito uma aparição em projetos comerciais sérios.

Em julho, um documentário chamado Roadrunner usou IA de voz para recriar os vocais do chef Anthony Bourdain e falar falas que ele escreveu antes de sua morte em 2018. Como você pode imaginar, isso não caiu muito bem com uma grande parte de seus telespectadores.

Mais polêmica surgiu um mês depois, quando o ator Val Kilmer usou uma agência chamada Sonantic para emular sua voz antes de uma traqueostomia para remover o câncer de garganta em 2014.

Enquanto muitos elogiaram a tecnologia no caso de Kilmer, Roadrunner foi amplamente visto como explorador - particularmente porque o documentário não divulgou o uso de síntese de voz.


Um futuro lucrativo para celebridades e influenciadores

O sentimento em relação ao uso mainstream de vozes sintetizadas e deepfakes em geral está longe de ser unânime, mas há um interesse bidirecional definido de celebridades e empresas em fazer licenças para seu uso - da mesma forma que os direitos de imagem.

Reconhecendo isso, uma empresa chamada Veritone lançou um serviço no início deste ano permitindo que influenciadores, atletas e atores vendessem seus direitos de áudio virtuais para endossos.

Em essência, isso permite que celebridades e influenciadores obtenham receita sem ter que viajar fisicamente para um estúdio de gravação ou local, enquanto um cliente pagante colhe os benefícios de ter sua voz na hora.

Tenho certeza de que os contratos serão mais à prova de balas do que isso, mas você entendeu.

Enquanto o talento ficar feliz em alugar um simulacro de si mesmo, quase certamente haverá oportunidades futuras para grandes nomes lucrarem.

Bruce Willis, por exemplo, já licenciou sua imagem para ser usada como deepfake em russo anúncios de telefone celular. Fazendo esse fato até mais distópico, estamos falando do jovem Willis direto do Die Hard era.

No aqui e agora, aplicativos como o Veritone são poucos e distantes entre si, mas a síntese de voz já está sendo utilizada por podcasts.

Uma dessas empresas, a Descript, criou um recurso chamado 'Overdubs'que permite aos podcasters sintetizar suas próprias vozes. Dessa forma, programas e transcrições podem ser editados na hora.

Falar sobre qualquer conteúdo não autêntico sempre será recebido com preocupação e crítica, mas isso não impede que as indústrias adotem a ideia da IA. Pelo contrário, está se tornando mais avançado e difícil de detectar a cada dia.

Vai ser interessante para quem saltar primeiro nessas oportunidades. Eu estaria muito mais disposto a comprar PPI se Patrick Stewart dissesse isso.

Acessibilidade