Menu Menu

Nova ferramenta de IA recria rostos apenas por meio de dados de voz

À medida que a tecnologia deep fake se torna cada vez mais difícil de descobrir online, de vozes de IA a sósias de celebridades, uma nova ferramenta permitiu que os pesquisadores recriassem rostos por meio de gravações de voz.

A era dos deepfakes e das personas artificiais está se aproximando cada vez mais de nós, um avanço tecnológico de cada vez.

Embora você possa ter visto algumas contas estranhas do TikTok criando vídeos deepfake de celebridades como Tom Cruise e geradores de voz de IA de celebridades, como Uberpato, uma nova ferramenta de pesquisa desenvolvida no MIT recria o rosto de uma pessoa real usando nada além de sua voz.

Os resultados até agora são bastante variados – alguns misturam etnias, gêneros e estruturas faciais – mas houve amostras precisas que mostram promessas de uso potencial no futuro.

O algoritmo é chamado Fala2Face e fez parte de um artigo de pesquisa publicado pela primeira vez em 2019. Uma demonstração está disponível on-line se você estiver curioso para Confira por si mesmo.

Os rostos parecem ser recriados com mais precisão com clipes de áudio mais longos, o que não deve ser uma surpresa. O código foi criado usando milhões de vídeos do YouTube, com o software modelado aprendendo 'correlações audiovisuais e de voz-face' de uma ampla variedade de amostras.

Ainda é um trabalho em andamento, é claro, então não está completamente no ponto todas as vezes. O potencial de um sistema que registre vozes e identifique indivíduos rapidamente pode ser enorme, principalmente em sistemas jurídicos e empresas de vigilância.

As pesquisas por trás da tecnologia estão convencidas de que é apenas para fins científicos, mas já sabemos que empresas maiores – como Facebook, Google, Amazon e muito mais – já estão muito interessadas em programas avançados do Metaverse, Web 3.0 e coleta de dados do usuário . A capacidade de identificar qualquer pessoa rapidamente pode ser devastadora nas mãos erradas.

Fotografia DIY também aponta que um software como esse poderia colocar em risco as identidades dos influenciadores, especialmente aqueles que mantêm seus rostos escondidos. TikTokers ou YouTubers que fazem um esforço deliberado para mascarar sua identidade podem ser descobertos por meio de trechos de áudio de suas vozes, de qualquer clipe que eles já postaram.

Ainda assim, isso provavelmente está longe no futuro, já que o algoritmo é privativo no momento. Parece que teremos que aceitar um futuro em que a IA e a tecnologia deepfake borrem a linha entre o real e o artificial, com a desinformação que provavelmente permanecerá desenfreada e mais difícil de eliminar.

Detectar identidades por meio de breves clipes de voz é simplesmente mais um passo em um caminho inevitável. Vamos apenas esperar que as coisas não saiam do controle.

Acessibilidade