Меню Меню

Новый инструмент искусственного интеллекта воссоздает лица исключительно с помощью голосовых данных

Поскольку технологии дипфейков становится все труднее разузнать в Интернете, от голосов ИИ до двойников знаменитостей, новый инструмент позволил исследователям воссоздать лица с помощью голосовых записей.

Эпоха дипфейков и искусственных персонажей неуклонно подкрадывается к нам, технологический прорыв за технологическим прорывом.

Хотя вы, возможно, видели некоторые сверхъестественные учетные записи TikTok, создающие дипфейковые видео знаменитостей, таких как Том Круз, и генераторы голоса знаменитостей AI, такие как Убердак, новый исследовательский инструмент, разработанный в Массачусетском технологическом институте, воссоздает лицо реального человека, используя только его голос.

Результаты до сих пор довольно неоднозначны — некоторые путают этническую принадлежность, пол и структуру лица — но были точные образцы, которые обещают потенциальное использование в будущем.

Алгоритм называется Речь2Лицо и был частью исследовательской работы, впервые опубликованной в 2019 году. Демонстрация доступна в Интернете, если вам интересно Убедитесь сами.

Кажется, что лица более точно воссоздаются с более длинными аудиоклипами, что не должно вызывать большого удивления. Код был создан с использованием миллионов видео с YouTube, а программное обеспечение смоделировано путем изучения «аудио-визуальных и голосовых корреляций» из широкого спектра образцов.

Конечно, это все еще в стадии разработки, поэтому не каждый раз это полностью соответствует действительности. Потенциал системы, которая регистрирует голоса и быстро идентифицирует людей, может быть огромным, особенно в юридических системах и компаниях по наблюдению.

Исследователи этой технологии непреклонны в том, что она предназначена только для научных целей, но мы уже знаем, что более крупные компании, такие как Facebook, Google, Amazon и многие другие, уже очень заинтересованы в продвинутых программах Metaverse, Web 3.0 и сборе пользовательских данных. . Способность быстро идентифицировать кого-либо может оказаться разрушительной в чужих руках.

DIY фотография также указывает на такое программное обеспечение может поставить под угрозу личность влиятельных лиц, особенно тех, кто скрывает свое лицо. TikTokers или YouTubers, которые преднамеренно пытаются скрыть свою личность, могут быть обнаружены с помощью аудиофрагментов их голосов, начиная с любой клип, который они когда-либо размещали.

Тем не менее, это, вероятно, произойдет в далеком будущем, поскольку в настоящее время алгоритм является закрытым. Похоже, нам придется смириться с будущим, в котором технологии искусственного интеллекта и дипфейков стирают грань между реальным и искусственным, а дезинформация, скорее всего, останется безудержной и ее будет труднее искоренить.

Обнаружение личности с помощью коротких голосовых клипов — это просто еще один шаг на неизбежном пути. Будем надеяться, что ситуация не выйдет из-под контроля.

Универсальный доступ