Menu Menu

Il nuovo strumento di intelligenza artificiale ricrea i volti esclusivamente attraverso i dati vocali

Poiché la tecnologia deep fake diventa sempre più difficile da scoprire online, dalle voci dell'IA ai sosia delle celebrità, un nuovo strumento ha consentito ai ricercatori di ricreare volti attraverso registrazioni vocali.

L'era dei deepfake e dei personaggi artificiali si sta avvicinando costantemente a noi, una svolta tecnologica alla volta.

Anche se potresti aver visto alcuni inquietanti account TikTok creare video deepfake di celebrità come Tom Cruise e generatori di voci AI di celebrità come Uberduck, un nuovo strumento di ricerca sviluppato al MIT ricrea il volto di una persona reale usando nient'altro che la sua voce.

I risultati finora sono abbastanza contrastanti - alcuni confondono etnie, generi e strutture del viso - ma ci sono stati campioni accurati che mostrano promesse per un potenziale utilizzo in futuro.

Viene chiamato l'algoritmo Discorso2Faccia e faceva parte di un documento di ricerca pubblicato per la prima volta nel 2019. Se sei curioso, è disponibile una demo online controlla tu stesso.

I volti sembrano essere ricreati in modo più accurato con clip audio più lunghe, il che non dovrebbe sorprendere. Il codice è stato creato utilizzando milioni di video di YouTube, con il software modellato imparando "correlazioni audiovisive e voce-volto" da un'ampia gamma di campioni.

È ancora un work in progress, ovviamente, quindi non è completamente azzeccato ogni volta. Il potenziale per un sistema che registra le voci e identifica rapidamente le persone potrebbe essere enorme, in particolare all'interno dei sistemi legali e delle società di sorveglianza.

Le ricerche dietro la tecnologia sono irremovibili sul fatto che sia solo per scopi scientifici, ma sappiamo già che le aziende più grandi - come Facebook, Google, Amazon e molte altre - sono già molto interessate ai programmi Metaverse avanzati, al Web 3.0 e alla raccolta dei dati degli utenti . Una capacità di identificare rapidamente qualcuno in questo modo potrebbe essere devastante nelle mani sbagliate.

Fotografia fai da te sottolinea anche che un software come questo potrebbe mettere a rischio le identità degli influencer, soprattutto quelli che tengono il viso nascosto. TikToker o YouTuber che fanno uno sforzo deliberato per mascherare la propria identità potrebbero essere scoperti attraverso frammenti audio delle loro voci, da in qualsiasi clip che hanno mai pubblicato.

Tuttavia, è probabile che sia lontano in futuro, poiché l'algoritmo è attualmente privativo. Sembra che dovremo accettare un futuro in cui l'IA e la tecnologia deepfake offuscano il confine tra reale e artificiale, con la disinformazione che probabilmente rimarrà dilagante e più difficile da eliminare.

Rilevare le identità attraverso brevi clip vocali è semplicemente un altro passo lungo un percorso inevitabile. Speriamo solo che le cose non vadano fuori controllo.

Accessibilità