Menu Menu

Un nouvel outil d'IA recrée les visages uniquement grâce aux données vocales

Alors que la fausse technologie profonde devient de plus en plus difficile à détecter en ligne, des voix de l'IA aux sosies de célébrités, un nouvel outil a permis aux chercheurs de recréer des visages grâce à des enregistrements vocaux.

L'ère des deepfakes et des personnages artificiels s'installe progressivement, une percée technologique à la fois.

Bien que vous ayez peut-être vu des comptes TikTok étranges créer des vidéos deepfake de célébrités telles que Tom Cruise et des générateurs de voix AI de célébrités tels que Ubercanard, un nouvel outil de recherche développé au MIT recrée le visage d'une personne réelle en utilisant uniquement sa voix.

Jusqu'à présent, les résultats sont assez mitigés - certains mélangent les ethnies, les sexes et les structures faciales - mais il y a eu des échantillons précis qui semblent prometteurs pour une utilisation potentielle à l'avenir.

L'algorithme s'appelle Discours2Face et faisait partie d'un document de recherche publié pour la première fois en 2019. Une démo est disponible en ligne si vous êtes curieux de Vérifiez par vous-même.

Les visages semblent être recréés avec plus de précision avec des clips audio plus longs, ce qui ne devrait pas surprendre autant. Le code a été créé à l'aide de millions de vidéos de YouTube, le logiciel étant modélisé en apprenant des «corrélations audiovisuelles et voix-visage» à partir d'un large éventail d'échantillons.

C'est toujours un travail en cours, bien sûr, donc ce n'est pas complètement sur le point à chaque fois. Le potentiel d'un système qui enregistre les voix et identifie rapidement les individus pourrait être énorme, en particulier au sein des systèmes juridiques et des sociétés de surveillance.

Les recherches derrière la technologie sont catégoriques sur le fait que ce n'est qu'à des fins scientifiques, mais nous savons déjà que les grandes entreprises - comme Facebook, Google, Amazon et bien d'autres - sont déjà très intéressées par les programmes Metaverse avancés, le Web 3.0 et la collecte de données utilisateur. . Une telle capacité à identifier rapidement quelqu'un pourrait être dévastatrice entre de mauvaises mains.

Photographie de bricolage souligne également ce logiciel comme celui-ci pourrait mettre en danger l'identité des influenceurs, en particulier ceux qui cachent leur visage. Les TikTokers ou YouTubers qui font un effort délibéré pour masquer leur identité pourraient être découverts à travers des extraits audio de leurs voix, de tous clip qu'ils ont jamais posté.

Pourtant, c'est probablement loin dans le futur, car l'algorithme est privatif à l'heure actuelle. Il semble que nous devrons accepter un avenir où l'IA et la technologie deepfake brouillent la frontière entre le réel et l'artificiel, avec une désinformation susceptible de rester endémique et plus difficile à éliminer.

La détection d'identités à travers de brefs clips vocaux n'est qu'une étape supplémentaire sur un chemin inévitable. Espérons juste que les choses ne deviennent pas incontrôlables.

Accessibilité