Nowe narzędzie AI odtwarza twarze wyłącznie za pomocą danych głosowych

Tech
Technologia
Opublikowano 6 kwietnia 2022

Źródło: Thred

By Charliego Coombsa

Londyn, Wielka Brytania

0 energia + Dodaj energię

0 komentarze

Ponieważ technologia deep fake staje się coraz trudniejsza do odgadnięcia w Internecie, od głosów AI po podobizny celebrytów, nowe narzędzie pozwoliło naukowcom odtworzyć twarze za pomocą nagrań głosowych.

Era deepfake'ów i sztucznych person nieustannie wkrada się do nas, jeden technologiczny przełom.

Chociaż być może widziałeś niesamowite konta TikTok tworzące deepfake filmy celebrytów, takich jak Tom Cruise, i generatory głosu celebrytów AI, takie jak Uberkacz, nowe narzędzie badawcze opracowane w MIT odtwarza twarz prawdziwej osoby, używając wyłącznie głosu.

Dotychczasowe wyniki są dość zróżnicowane – niektórzy mieszają pochodzenie etniczne, płeć i strukturę twarzy – ale istnieją dokładne próbki, które dają nadzieję na potencjalne zastosowanie w przyszłości.

Algorytm nazywa się Mowa2Twarz i był częścią artykułu badawczego opublikowanego po raz pierwszy w 2019 roku. Demo jest dostępne online, jeśli jesteś ciekawy sprawdź to sam.

Twarze wydają się być dokładniej odtworzone przy dłuższych klipach dźwiękowych, co nie powinno dziwić. Kod został stworzony przy użyciu milionów filmów z serwisu YouTube, a oprogramowanie zostało wymodelowane przez uczenie się „korelacji audiowizualnych i głos-twarz” z szerokiej gamy próbek.

Oczywiście wciąż trwają prace, więc nie za każdym razem jest to całkowicie na miejscu. Potencjał systemu, który rejestruje głosy i szybko identyfikuje osoby, może być ogromny, szczególnie w systemach prawnych i firmach nadzorujących.

Badania stojące za tą technologią są nieugięte, że jest to tylko do celów naukowych, ale wiemy już, że większe firmy – takie jak Facebook, Google, Amazon i wiele innych – są już bardzo zainteresowane zaawansowanymi programami Metaverse, Web 3.0 i zbieraniem danych użytkowników . Umiejętność szybkiego zidentyfikowania kogokolwiek może być druzgocąca w niepowołanych rękach.

Fotografia DIY wskazuje również że takie oprogramowanie może narazić na ryzyko tożsamość osób mających wpływ, zwłaszcza tych, którzy ukrywają twarze. TikTokery lub YouTuberzy, którzy świadomie starają się zamaskować swoją tożsamość, mogą zostać odkryci za pomocą fragmentów dźwiękowych ich głosów, od każdy klip, który kiedykolwiek opublikowali.

Mimo to prawdopodobnie jest to odległa przyszłość, ponieważ obecnie algorytm jest prywatny. Wygląda na to, że będziemy musieli pogodzić się z przyszłością, w której sztuczna inteligencja i technologia deepfake zacierają granicę między rzeczywistością a sztucznością, a dezinformacja będzie prawdopodobnie szerzyła się i będzie trudniej ją zlikwidować.

Wykrywanie tożsamości za pomocą krótkich klipów głosowych to po prostu kolejny krok na nieuniknionej ścieżce. Miejmy tylko nadzieję, że sprawy nie wymkną się spod kontroli.

Charliego Coombsa

Redaktor naczelny Londyn, Wielka Brytania

Jestem Charlie (On/On), redaktor naczelny Thred. Studiowałem angielski na University of Birmingham i jako entuzjasta muzyki i gier jestem nerdem popkultury. Możesz mnie znaleźć jako kuratora playlist, projektującego zdjęcia nagłówków artykułów i popijającego cydr w czwartek. Śledź mnie na Twitter, LinkedIn i prześlij mi kilka pomysłów/opinii przez E-mail.

Więcej od thred.

Microsoft potwierdza rekordowe zakupy korporacyjne zielonej energii na potrzeby sztucznej inteligencji

Źródło: Thred

Technologia

Microsoft potwierdza rekordowe zakupy korporacyjne zielonej energii na potrzeby sztucznej inteligencji

Ośmiokrotnie więcej niż poprzedni rekord, Microsoft właśnie zakupił w ramach jednej transakcji najwięcej energii odnawialnej w historii dla pojedynczego podmiotu korporacyjnego. Dzięki temu plany niskoemisyjne nie zostaną pokrzyżowane przez zwiększanie skali projektów AI. W życiu jest kilka stałych: śmierć, podatki i Microsoft, który przechwala się, dokonując rekordowych przejęć finansowych. Przynajmniej najnowsze jest pozytywne dla planety na tym...

By Jamiego Wattsa Londyn, Wielka Brytania

Niezależny zespół „Washed Out” wydaje pierwszy teledysk OpenAI Sora

Źródło: OpenAI

Technologia

Niezależny zespół „Washed Out” wydaje pierwszy teledysk OpenAI Sora

Nowa piosenka zatytułowana „The Hardest Part” artysty Washed Out została stworzona w całości przy użyciu oprogramowania Sora OpenAI, które konwertuje podpowiedzi tekstowe na realistyczne wideo. Pierwszy w swoim rodzaju, robi wrażenie i przeraża, w zależności od tego, gdzie stoisz. Wygląda na to, że co tydzień piszemy o sztucznej inteligencji. W ciągu ostatnich dwóch lat popularność wykorzystania podpowiedzi tekstowych do tworzenia automatycznie generowanej treści gwałtownie wzrosła. Gdzie kiedyś wydawało się...

By Charliego Coombsa Londyn, Wielka Brytania

Ruszył pierwszy na świecie konkurs piękności dla influencerów AI

Źródło: Thred

Obserwuj Nas

Ruszył pierwszy na świecie konkurs piękności dla influencerów AI

Próbując jeszcze bardziej połączyć pojawiające się trendy w zakresie sztucznej inteligencji z rzeczywistością, ogłoszono nowy konkurs piękności dla wpływowych osób zajmujących się sztuczną inteligencją. Pomimo entuzjazmu twórców wydarzenia, krytycy przestrzegają, że należy podchodzić do niego ostrożnie. Myślałeś, że świat influencerów AI nie może być dziwniejszy? Hmm.. pomyśl jeszcze raz. Fanvue, platforma, która pomaga twórcom cyfrowym zwiększać zaangażowanie za pomocą wiadomości AI, notatek głosowych i analiz, właśnie ogłosiła pierwsze na świecie...

By Jessiki Byrne Londyn, Wielka Brytania

Źródło: Unsplash

Technologia

Clover Hogan skrytykowana za stwierdzenie, że technologia nie rozwiąże kryzysu klimatycznego

Wczoraj w serii tweetów działaczka na rzecz ochrony środowiska pokolenia Z określiła wiarę w „świetne, srebrne rozwiązania” kryzysu jako najbardziej podstępną formę zaprzeczania zmianom klimatycznym. Spotkało się to z ostrą reakcją nie tylko użytkowników, ale także dyrektora generalnego Tesli i samego X, Elona Muska. Wczoraj aktywistka ekologiczna pokolenia Z Clover Hogan, znana ze swojego ruchu edukacyjnego non-profit Force of Nature, ...

By Sofii Phillips Londyn, Wielka Brytania

Ponieważ technologia deep fake staje się coraz trudniejsza do odgadnięcia w Internecie, od głosów AI po podobizny celebrytów, nowe narzędzie pozwoliło naukowcom odtworzyć twarze za pomocą nagrań głosowych.

Powiązane artykuły

UE wreszcie planuje rozprawić się z szybką modą

Uczniowie budują szklarnię słoneczną, która wytwarza energię

Popularny

Microsoft potwierdza rekordowe zakupy korporacyjne zielonej energii na potrzeby sztucznej inteligencji

Tworzenie deepfake porno wkrótce stanie się nielegalne

Kosmolodzy zbierają się, aby zakwestionować przyjęty pogląd na wszechświat

Bądź na bieżąco z thred, zapisując się do naszego biuletynu dotyczącego planety!

Więcej od thred.

Microsoft potwierdza rekordowe zakupy korporacyjne zielonej energii na potrzeby sztucznej inteligencji

Niezależny zespół „Washed Out” wydaje pierwszy teledysk OpenAI Sora

Ruszył pierwszy na świecie konkurs piękności dla influencerów AI

Clover Hogan skrytykowana za stwierdzenie, że technologia nie rozwiąże kryzysu klimatycznego