Синтезаторы речи с искусственным интеллектом сейчас могут показаться новым трюком, но по мере того, как технология становится все более сложной, сможем ли мы увидеть полномасштабную интеграцию в мир маркетинга?
Судя по всему, синтезаторы аудио AI собираются получить более сложную нагрузку, чем генератор рэпа Эминема. Как будто это даже возможно.
Несмотря на множество этических проблем, связанных с рекреационным использованием ИИ и его потенциалом для гнусного использования - с неконтролируемым дипфейком порно, подделанным политическая дезинформация, и модифицированный спутниковых снимков среди основных нарушителей 2021 года - у него есть захватывающие возможности проникнуть в основные отрасли раньше, чем ожидалось.
В этом отношении все свидетельства указывают на то, что развлечения как наиболее многообещающий путь развития технологий.
Только недавно мы слышали о Патент Spotify для машинного обучения, которое будет использовать звуковые подсказки в нашей среде, чтобы рекомендовать музыку, основанную на нашем настроении, и производство Lucasfilm нанять онлайн-художника по дипфейку «Shamook», чтобы он помог улучшить его отдел визуальных эффектов.
Хотя год или два назад создание блокбастера и «улучшение» его компьютерной графики, вероятно, привело бы к запрету его создателей, похоже, растет понимание того, что технология станет неотъемлемой частью нашей жизни.
По мере того, как все больше и больше приходят к этому мнению, среди экспертов по ИИ возникает чувство, что технология может в следующий раз нацелиться на рекламную индустрию. Только представьте синтезированные голоса знаменитостей, появляющиеся в рекламных местах или на радиопередачах.
Как работает голосовой ИИ
Подобно визуальным дипфейкам, голосовой ИИ (или синтез голоса) использует системы машинного обучения для извлечения разрозненных записей чьего-либо голоса из нескольких источников данных.
Этот набор необработанного звука затем обрабатывается алгоритмом, который использует синтезаторы, чтобы объединить все вместе и сформировать предложение, вводимое пользователем.
Если вы еще не потратили часы на то, чтобы заставить Йоду или Дэвида Аттенборо извергать ерунду, мы подождем здесь, пока вы поиграете с одной из множества бесплатных онлайн-программ для ботов. В противном случае проверьте это Eminem синтезировал дисс-трек Марка Цукерберга.
Как и в приведенном выше примере, большая часть материалов по голосовым клонам в Интернете связана либо с подделкой, либо просто с применением технологии, хотя это не означает, что они еще не появлялись в серьезных коммерческих проектах.
Еще в июле документальный фильм под названием Roadrunner использовал голосовой ИИ, чтобы воссоздать вокал шеф-повара Энтони Бурдена и озвучить строки, написанные им перед смертью в 2018 году. Как вы можете себе представить, это не очень понравилось большой части зрителей.
Дальнейшие споры разгорелись месяц спустя, когда актер Вэл Килмер использовал агентство под названием Sonantic для имитации своего голоса перед трахеостомией для удаления рака горла в 2014 году.
Хотя многие хвалили технологию в случае Килмера, Roadrunner в основном рассматривался как эксплуатационный - тем более, что в документальном фильме вообще не раскрыто использование голосового синтеза.