菜单 菜单

语音 AI 是否处于营销爆炸的边缘?

AI语音合成器现在可能感觉像是一个新的噱头,但随着技术变得越来越复杂,我们能否看到全面融入营销领域?

显然,AI 音频合成器将获得比 Eminem 的说唱生成器更复杂的整体负载。 就像那甚至是可能的。

尽管围绕人工智能的娱乐用途及其潜在用途存在许多道德问题 - 未经同意的深度伪造色情片,被篡改 政治错误信息,并修改 卫星图像 在 2021 年的主要违法者中——它有可能比预期更快地打入主流行业。

在这方面,所有证据都表明娱乐是该技术最有前途的途径。

直到最近,我们才听说 Spotify 的专利 用于机器学习,它将使用我们环境中的音频提示根据我们的心情推荐音乐,以及制作公司 卢卡斯电影公司 聘请在线 Deepfake 艺术家“Shamook”来帮助改进其视觉效果部门。

https://youtu.be/yK-l4gz4rUU

在一两年前,拍摄一部轰动一时的电影并“改进”其 CGI 可能会导致其创作者的停止命令,但似乎越来越多的人接受该技术将成为我们的重要组成部分。生活。

随着越来越多的人接受这个观点,人工智能专家有一种感觉,即该技术接下来可能会瞄准广告行业。 想象一下合成的名人声音出现在广告展示位置或广播标识上。


语音人工智能的工作原理

与视觉深度伪造非常相似,语音 AI(或语音合成)使用机器学习系统从多个数据源中提取某人声音的分散记录。

这个原始音频集合然后通过算法运行,该算法使用合成器将它们拼接在一起并形成用户输入的句子。

如果您还没有浪费时间让 Yoda 或 David Attenborough 胡说八道,我们会在这里等您,而您在线玩弄许多免费的机器人程序之一。 失败了,看看这个 阿姆 合成马克扎克伯格diss曲目。

像上面的例子一样,网上的大部分语音克隆材料要么是与恶搞相关的,要么仅仅是对技术的一种练习,但这并不是说它尚未出现在严肃的商业项目中。

早在七月,一部名为 走鹃 使用语音 AI 重现厨师 Anthony Bourdain 的声音,并说出他在 2018 年去世前写的台词。 可以想象,这对大部分观众来说并不好。

一个月后,当演员 Val Kilmer 在 2014 年进行气管切开术以切除喉癌之前,使用一家名为 Sonantic 的机构模仿他的声音时,引发了进一步的争议。

虽然在 Kilmer 的案例中,许多人称赞了这项技术, 走鹃 在很大程度上被视为 剥削的 – 特别是因为纪录片根本没有披露语音合成的使用。


名人和影响者的丰厚未来

对合成语音和深度伪造的主流使用总体上的感觉远非一致,但名人和公司都有明确的双向兴趣来获得使用许可——这与形象权非常相似。

认识到这一点,一家名为 Veritone 的公司在今年早些时候推出了一项服务,允许有影响力的人、运动员和演员出售他们的虚拟音频权利以进行代言。

从本质上讲,这使名人和有影响力的人无需亲自前往录音室或场地就可以赚取收入,而付费客户则可以从他们的声音中获益。

我相信合同会比这更防弹,但你明白了要点。

只要人才乐于出租自己的模拟物,几乎可以肯定的是,未来大牌们将有机会获利。

例如,布鲁斯·威利斯 (Bruce Willis) 已经授权他的图像在俄语中用作深度伪造 手机广告. 使那个事实 甚至 更反乌托邦,我们说的是年轻的威利斯 虎胆龙威 时代。

在这里和现在,像 Veritone 这样的应用程序很少,但播客已经在使用语音合成。

一家这样的公司 Descript 创建了一项名为“配音'这允许播客合成他们自己的声音。 通过这种方式,可以即时无缝编辑节目和成绩单。

谈论任何不真实的内容总会受到关注和批评,但这并不能阻止行业接受人工智能的想法。 相反,它变得越来越先进,而且越来越难被发现。

谁先抓住这些机会会很有趣。 如果帕特里克·斯图尔特这么说,我会更愿意购买 PPI。

无障碍