Menú Menú

Nueva herramienta de IA recrea rostros únicamente a través de datos de voz

A medida que la tecnología deep fake se vuelve cada vez más difícil de descubrir en línea, desde voces de IA hasta imitaciones de celebridades, una nueva herramienta ha permitido a los investigadores recrear rostros a través de grabaciones de voz.

La era de las falsificaciones profundas y las personas artificiales se acerca cada vez más, un avance tecnológico a la vez.

Si bien es posible que haya visto algunas cuentas extrañas de TikTok que crean videos falsos de celebridades como Tom Cruise y generadores de voz de IA de celebridades como uberpato, una nueva herramienta de investigación desarrollada en el MIT recrea el rostro de una persona real utilizando únicamente su voz.

Los resultados hasta ahora son bastante mixtos: algunos tienen etnias, géneros y estructuras faciales mezcladas, pero ha habido muestras precisas que parecen prometedoras para un uso potencial en el futuro.

El algoritmo se llama Discurso2Cara y fue parte de un trabajo de investigación publicado por primera vez en 2019. Hay una demostración disponible en línea si tiene curiosidad por compruébalo por ti mismo.

Las caras parecen recrearse con mayor precisión con clips de audio más largos, lo que no debería ser una gran sorpresa. El código se creó utilizando millones de videos de YouTube, con el software modelado aprendiendo "correlaciones audiovisuales y de voz y rostro" de una amplia gama de muestras.

Todavía es un trabajo en progreso, por supuesto, por lo que no siempre es completamente acertado. El potencial de un sistema que registre las voces e identifique a las personas rápidamente podría ser enorme, particularmente dentro de los sistemas legales y las empresas de vigilancia.

Las investigaciones detrás de la tecnología insisten en que solo tiene fines científicos, pero ya sabemos que las empresas más grandes, como Facebook, Google, Amazon y muchas más, ya están muy interesadas en los programas avanzados de Metaverse, la Web 3.0 y la recolección de datos de usuarios. . La capacidad de identificar a alguien rápidamente como este podría ser devastadora en las manos equivocadas.

Fotografía de bricolaje también señala que un software como este podría poner en riesgo la identidad de los influencers, especialmente aquellos que mantienen sus rostros ocultos. TikTokers o YouTubers que hacen un esfuerzo deliberado para enmascarar su identidad podrían ser descubiertos a través de fragmentos de audio de sus voces, desde cualquier clip que han publicado.

Aún así, es probable que eso esté muy lejos en el futuro, ya que el algoritmo es privativo en la actualidad. Parece que tendremos que aceptar un futuro en el que la IA y la tecnología deepfake desdibujen la línea entre lo real y lo artificial, y es probable que la información errónea siga siendo rampante y más difícil de erradicar.

Detectar identidades a través de breves clips de voz es simplemente otro paso en un camino inevitable. Esperemos que las cosas no se salgan de control.

Accesibilidad