Меню Меню

Голосовой ИИ находится на грани маркетингового взрыва?

Синтезаторы речи с искусственным интеллектом сейчас могут показаться новым трюком, но по мере того, как технология становится все более сложной, сможем ли мы увидеть полномасштабную интеграцию в мир маркетинга?

Судя по всему, синтезаторы аудио AI собираются получить более сложную нагрузку, чем генератор рэпа Эминема. Как будто это даже возможно.

Несмотря на множество этических проблем, связанных с рекреационным использованием ИИ и его потенциалом для гнусного использования - с неконтролируемым дипфейком порно, подделанным политическая дезинформация, и модифицированный спутниковых снимков среди основных нарушителей 2021 года - у него есть захватывающие возможности проникнуть в основные отрасли раньше, чем ожидалось.

В этом отношении все свидетельства указывают на то, что развлечения как наиболее многообещающий путь развития технологий.

Только недавно мы слышали о Патент Spotify для машинного обучения, которое будет использовать звуковые подсказки в нашей среде, чтобы рекомендовать музыку, основанную на нашем настроении, и производство Lucasfilm нанять онлайн-художника по дипфейку «Shamook», чтобы он помог улучшить его отдел визуальных эффектов.

https://youtu.be/yK-l4gz4rUU

Хотя год или два назад создание блокбастера и «улучшение» его компьютерной графики, вероятно, привело бы к запрету его создателей, похоже, растет понимание того, что технология станет неотъемлемой частью нашей жизни.

По мере того, как все больше и больше приходят к этому мнению, среди экспертов по ИИ возникает чувство, что технология может в следующий раз нацелиться на рекламную индустрию. Только представьте синтезированные голоса знаменитостей, появляющиеся в рекламных местах или на радиопередачах.


Как работает голосовой ИИ

Подобно визуальным дипфейкам, голосовой ИИ (или синтез голоса) использует системы машинного обучения для извлечения разрозненных записей чьего-либо голоса из нескольких источников данных.

Этот набор необработанного звука затем обрабатывается алгоритмом, который использует синтезаторы, чтобы объединить все вместе и сформировать предложение, вводимое пользователем.

Если вы еще не потратили часы на то, чтобы заставить Йоду или Дэвида Аттенборо извергать ерунду, мы подождем здесь, пока вы поиграете с одной из множества бесплатных онлайн-программ для ботов. В противном случае проверьте это Eminem синтезировал дисс-трек Марка Цукерберга.

Как и в приведенном выше примере, большая часть материалов по голосовым клонам в Интернете связана либо с подделкой, либо просто с применением технологии, хотя это не означает, что они еще не появлялись в серьезных коммерческих проектах.

Еще в июле документальный фильм под названием Roadrunner использовал голосовой ИИ, чтобы воссоздать вокал шеф-повара Энтони Бурдена и озвучить строки, написанные им перед смертью в 2018 году. Как вы можете себе представить, это не очень понравилось большой части зрителей.

Дальнейшие споры разгорелись месяц спустя, когда актер Вэл Килмер использовал агентство под названием Sonantic для имитации своего голоса перед трахеостомией для удаления рака горла в 2014 году.

Хотя многие хвалили технологию в случае Килмера, Roadrunner в основном рассматривался как эксплуатационный - тем более, что в документальном фильме вообще не раскрыто использование голосового синтеза.


Выгодное будущее для знаменитостей и влиятельных лиц

Отношение к массовому использованию синтезированных голосов и дипфейков в целом далеко не единодушное, но как знаменитости, так и компании проявляют явный двусторонний интерес к выдаче лицензий на их использование - почти так же, как права на изображения.

Осознавая это, компания Veritone в начале этого года запустила сервис, позволяющий влиятельным лицам, спортсменам и актерам продавать свои права на виртуальное аудио для одобрения.

По сути, это позволяет знаменитостям и влиятельным лицам получать доход без необходимости физических поездок в студию звукозаписи или место проведения, в то время как платящий клиент получает выгоду от того, что его голос по команде.

Я уверен, что контракты будут более надежными, но вы уловили суть.

Пока талантливые люди с удовольствием сдадут в аренду свой симулякр, в будущем у крупных имен почти наверняка появятся возможности заработать на этом.

Брюс Уиллис, например, уже дал лицензию на использование своего изображения в качестве дипфейка на русском языке. реклама на мобильных телефонах. Делая этот факт даже более антиутопия, мы говорим о молодом Уиллисе прямо из Крепкий орешек эпохи.

В настоящее время таких приложений, как Veritone, немного, но синтез голоса уже используется в подкастах.

Одна из таких компаний, Descript, создала функцию под названием 'Наложить', который позволяет подкастерам синтезировать собственные голоса. Таким образом, шоу и стенограммы можно легко редактировать на лету.

Разговоры о каком-либо недостоверном контенте всегда будут встречаться с беспокойством и критикой, но это не мешает отраслям промышленности прийти к идее ИИ. Напротив, он становится все более продвинутым и с каждым днем ​​все труднее обнаруживать.

Будет интересно, кто первым ухватится за эти возможности. Я бы с гораздо большей готовностью купил PPI, если бы Патрик Стюарт так сказал.

Универсальный доступ