Os sintetizadores de voz de IA podem parecer um novo truque agora, mas à medida que a tecnologia se torna mais sofisticada, poderíamos ver uma integração em grande escala no mundo do marketing?
Aparentemente, os sintetizadores de áudio AI estão prestes a ficar muito mais sofisticados do que o gerador de rap de Eminem. Como se isso fosse possível.
Apesar das muitas questões éticas que cercam o uso recreativo de IA e seu potencial para usos nefastos - com pornografia profunda não consensual, adulterada desinformação política, e modificado imagens de satélite entre os principais infratores de 2021 - há possibilidades empolgantes para que ele entre nas principais indústrias mais cedo do que o esperado.
Nessa frente, todas as evidências apontam para o entretenimento como a via mais promissora para a tecnologia.
Recentemente, ouvimos falar de Patente do Spotify para aprendizado de máquina, que usará pistas de áudio em nosso ambiente para recomendar músicas com base em nosso humor e casa de produção Lucasfilm contratando o artista deepfake online 'Shamook' para ajudar a melhorar seu departamento de efeitos visuais.
Embora um ou dois anos atrás, pegar um filme de grande sucesso e 'melhorar' seu CGI provavelmente levasse a uma ordem de cessar e desistir de seus criadores, parece haver uma aceitação crescente de que a tecnologia se tornará parte integrante de nosso vidas.
À medida que mais pessoas chegam a essa noção, há um sentimento entre os especialistas em IA de que a tecnologia pode ter como alvo a indústria de publicidade. Imaginem vozes de celebridades sintetizadas aparecendo em canais de anúncios ou idents de rádio.
Como funciona a IA por voz
Assim como os deepfakes visuais, a IA de voz (ou síntese de voz) usa sistemas de aprendizado de máquina para extrair um registro disperso da voz de alguém de várias fontes de dados.
Essa coleção de áudio bruto é então executada por meio de um algoritmo, que usa sintetizadores para unir tudo e formar uma entrada de frase pelo usuário.
Se você ainda não perdeu horas fazendo Yoda ou David Attenborough dizerem bobagens, vamos esperar aqui enquanto você brinca com um dos muitos programas de bot online gratuitos. Se falhar, verifique este Eminem faixa diss sintetizada de Mark Zuckerberg.
Como no exemplo acima, a maioria do material de clone de voz online é relacionado a spoofing ou apenas um exercício da tecnologia, embora isso não queira dizer que ainda não tenha feito uma aparição em projetos comerciais sérios.
Em julho, um documentário chamado Roadrunner usou IA de voz para recriar os vocais do chef Anthony Bourdain e falar falas que ele escreveu antes de sua morte em 2018. Como você pode imaginar, isso não caiu muito bem com uma grande parte de seus telespectadores.
Mais polêmica surgiu um mês depois, quando o ator Val Kilmer usou uma agência chamada Sonantic para emular sua voz antes de uma traqueostomia para remover o câncer de garganta em 2014.
Enquanto muitos elogiaram a tecnologia no caso de Kilmer, Roadrunner foi amplamente visto como explorador - particularmente porque o documentário não divulgou o uso de síntese de voz.