Meny Meny

Nytt AI-verktyg återskapar ansikten enbart genom röstdata

När djup falsk teknik blir allt svårare att suss ut online, från AI-röster till kändisliknande, har ett nytt verktyg tillåtit forskare att återskapa ansikten genom röstinspelningar.

En tid präglad av djupförfalskningar och artificiella personligheter smyger sig stadigt på oss, ett tekniskt genombrott i taget.

Även om du kanske har sett några kusliga TikTok-konton skapa deepfake videor av kändisar som Tom Cruise och kändis AI-röstgeneratorer som t.ex. Uberduck, ett nytt forskningsverktyg som utvecklats vid MIT återskapar ansiktet på en verklig person som bara använder sin röst.

Resultaten hittills är ganska blandade - vissa får etnicitet, kön och ansiktsstrukturer blandade ihop - men det har varit korrekta prover som visar lovande för potentiell användning i framtiden.

Algoritmen kallas Speech2Face och var en del av en forskningsartikel som publicerades först 2019. En demo finns tillgänglig online om du är nyfiken på att kolla in det själv.

Ansikten verkar vara mer exakt återskapade med längre ljudklipp, vilket inte borde komma som en överraskning. Koden skapades med hjälp av miljontals videor från YouTube, med programvaran modellerad genom att lära sig "audio-visuella och röst-ansikte-korrelationer" från ett brett utbud av prover.

Det är naturligtvis fortfarande ett pågående arbete, så det är inte helt på plats varje gång. Potentialen för ett system som registrerar röster och identifierar individer snabbt kan vara enorm, särskilt inom rättssystem och övervakningsföretag.

Forskningen bakom tekniken är övertygad om att den bara är för vetenskapliga ändamål, men vi vet redan att större företag – som Facebook, Google, Amazon och ett gäng fler – redan är mycket intresserade av avancerade Metaverse-program, Web 3.0 och att samla in användardata . En förmåga att identifiera vem som helst så här snabbt kan vara förödande i fel händer.

DIY-fotografering påpekar också att mjukvara som denna kan sätta influensers identiteter på spel, särskilt de som håller sina ansikten dolda. TikTokers eller YouTubers som gör ett avsiktligt försök att maskera sin identitet kan upptäckas genom ljudavsnitt av deras röster, från vilken som helst klipp de någonsin har lagt upp.

Ändå är det troligen långt borta i framtiden, eftersom algoritmen är privat för närvarande. Det verkar som att vi måste acceptera en framtid där AI och deepfake-teknik suddar ut gränsen mellan verklig och artificiell, med desinformation som sannolikt kommer att förbli frodig och svårare att slå ut.

Att upptäcka identiteter genom korta röstklipp är helt enkelt ytterligare ett steg på en oundviklig väg. Låt oss bara hoppas att saker och ting inte går utom kontroll.

Tillgänglighet