MENÜ MENÜ

Neues KI-Tool erstellt Gesichter ausschließlich durch Sprachdaten neu

Da es immer schwieriger wird, Deep-Fake-Technologie online aufzuspüren, von KI-Stimmen bis hin zu Promi-Lookalikes, hat ein neues Tool es Forschern ermöglicht, Gesichter durch Sprachaufnahmen nachzubilden.

Die Ära der Deepfakes und künstlichen Personas schleicht sich stetig auf uns ein, ein technologischer Durchbruch nach dem anderen.

Während Sie vielleicht einige unheimliche TikTok-Konten gesehen haben, die Deepfake-Videos von Prominenten wie Tom Cruise und Promi-KI-Sprachgeneratoren wie erstellt haben Überduck, ein neues Forschungstool, das am MIT entwickelt wurde, bildet das Gesicht einer realen Person nach, indem es nur ihre Stimme verwendet.

Die bisherigen Ergebnisse sind ziemlich gemischt – einige bringen Ethnizitäten, Geschlechter und Gesichtsstrukturen durcheinander – aber es gab genaue Proben, die für eine potenzielle Verwendung in der Zukunft vielversprechend sind.

Der Algorithmus wird aufgerufen Speech2Face und war Teil einer Forschungsarbeit, die erstmals 2019 veröffentlicht wurde. Eine Demo ist online verfügbar, wenn Sie neugierig sind schau es dir selbst an.

Gesichter scheinen mit längeren Audioclips genauer nachgebildet zu werden, was nicht so sehr überraschen sollte. Der Code wurde unter Verwendung von Millionen von Videos von YouTube erstellt, wobei die Software modelliert wurde, indem „audiovisuelle und Voice-Face-Korrelationen“ aus einer Vielzahl von Beispielen gelernt wurden.

Es ist natürlich noch in Arbeit, also ist es nicht jedes Mal ganz auf den Punkt. Das Potenzial für ein System, das Stimmen registriert und Personen schnell identifiziert, könnte enorm sein, insbesondere innerhalb von Rechtssystemen und Überwachungsunternehmen.

Die Forscher hinter der Technologie sind fest davon überzeugt, dass sie nur wissenschaftlichen Zwecken dient, aber wir wissen bereits, dass größere Unternehmen – wie Facebook, Google, Amazon und viele mehr – bereits sehr an fortschrittlichen Metaverse-Programmen, Web 3.0 und dem Sammeln von Benutzerdaten interessiert sind . Die Fähigkeit, jemanden so schnell zu identifizieren, könnte in den falschen Händen verheerend sein.

DIY-Fotografie weist auch darauf hin dass Software wie diese die Identität von Influencern gefährden könnte, insbesondere von denen, die ihre Gesichter verbergen. TikToker oder YouTuber, die sich bewusst bemühen, ihre Identität zu verschleiern, könnten durch Audioschnipsel ihrer Stimmen entdeckt werden jedem Clip, den sie je gepostet haben.

Das liegt aber wahrscheinlich noch in weiter Ferne, da der Algorithmus derzeit privativ ist. Es scheint, als müssten wir eine Zukunft akzeptieren, in der KI- und Deepfake-Technologie die Grenze zwischen echt und künstlich verwischt, Fehlinformationen wahrscheinlich weiterhin weit verbreitet und schwerer auszumerzen sind.

Das Erkennen von Identitäten durch kurze Sprachmitschnitte ist nur ein weiterer Schritt auf einem unvermeidlichen Weg. Hoffen wir nur, dass die Dinge nicht außer Kontrolle geraten.

Zugänglichkeit