メニュー メニュー

音声AIはマーケティング爆発の危機に瀕していますか?

AI音声シンセサイザーは今では斬新な仕掛けのように感じるかもしれませんが、テクノロジーがより洗練されるにつれて、マーケティングの世界への本格的な統合を見ることができるでしょうか?

どうやら、AIオーディオシンセサイザーは、エミネムのラップジェネレーターよりも全体の負荷をより洗練されたものにしようとしています。 そのようにさえ可能です。

AIの娯楽的使用とその不正使用の可能性を取り巻く多くの倫理的問題にもかかわらず、合意に基づかないディープフェイクポルノを使用して、医師の診察を受けました 政治的誤報、および変更 衛星画像 2021年の主な犯罪者の中には、予想よりも早く主流の産業に参入する可能性があります。

その面では、すべての証拠が、テクノロジーの最も有望な手段としてエンターテインメントを示しています。

ごく最近、聞いたことがあります Spotifyの特許 私たちの環境でオーディオキューを使用して気分に基づいて音楽を推奨する機械学習、および制作会社 ルーカスフィルム ビジュアルエフェクト部門の改善を支援するために、オンラインのディープフェイクアーティスト「Sh​​amook」を雇う。

https://youtu.be/yK-l4gz4rUU

XNUMX、XNUMX年前、大ヒット映画を撮り、そのCGIを「改善」することで、クリエイターからの排除措置命令が​​出された可能性がありますが、テクノロジーが私たちの一部となることへの受容が高まっているようです。生きています。

その概念にさらに近づくにつれて、AIの専門家の間では、技術が次に広告業界をターゲットにする可能性があるという感覚があります。 合成された有名人の声が広告の配置やラジオのIDにポップアップすることを想像してみてください。


音声AIのしくみ

視覚的なディープフェイクと同じように、音声AI(または音声合成)は機械学習システムを使用して、複数のデータソースから誰かの声の散在する記録を引き出します。

次に、この生のオーディオのコレクションは、シンセサイザーを使用してすべてをつなぎ合わせ、ユーザーが入力した文を形成するアルゴリズムを介して実行されます。

ヨーダやデイビッドアッテンボローがナンセンスを吐き出すのにまだ時間を無駄にしていない場合は、オンラインで多くの無料ボットプログラムのXNUMXつをいじくり回している間、ここで待機します。 それが失敗した場合は、これをチェックしてください エミネム 合成されたマーク・ザッカーバーグのディストラック。

上記の例のように、オンラインの音声クローン資料の大部分は、なりすまし関連であるか、単にテクノロジーの演習であるかのいずれかですが、それが本格的な商業プロジェクトにまだ登場していないというわけではありません。

XNUMX月に戻って、と呼ばれるドキュメンタリー ロードランナー 音声AIを使用して、シェフのアンソニーボーディンのボーカルを再現し、2018年に亡くなる前に書いたセリフを話しました。ご想像のとおり、これは視聴者の大部分ではうまくいきませんでした。

俳優のヴァルキルマーが2014年に気管切開の前に彼の声をエミュレートするためにソナンティックと呼ばれる機関を使用したとき、さらに論争が巻き起こった。

キルマーの場合、多くの人がこの技術を賞賛しましたが、 ロードランナー 主に 搾取的 –特にドキュメンタリーが音声合成の使用をまったく開示しなかったため。


セレブやインフルエンサーの儲かる未来

シンセサイザーの音声とディープフェイクの主流の使用に対する感情は一般的に満場一致ではありませんが、画像の権利とほぼ同じように、それらの使用のライセンスを作成することに対する有名人と企業の両方からの明確な双方向の関心があります。

これを認識して、Veritoneという会社が今年初めにサービスを開始し、インフルエンサー、アスリート、俳優が推薦のために仮想オーディオの権利を販売できるようにしました。

本質的に、これにより、セレブやインフルエンサーはレコーディングスタジオや会場に物理的に移動することなく収益を上げることができ、有料のクライアントは自分の声をキューに入れることのメリットを享受できます。

契約はそれよりも防弾になると確信していますが、要点はわかります。

才能が彼ら自身のシミュラクラを貸し出すことに満足している限り、ビッグネームがお金を稼ぐための将来の機会はほぼ確実にあります。

たとえば、ブルースウィリスは、ロシア語でディープフェイクとして使用するために彼の画像のライセンスをすでに取得しています 携帯電話の広告。 その事実を作る さらに もっとディストピア、私たちは若いウィリスをまっすぐに話している ダイ·ハード 時代。

今ここで、Veritoneのようなアプリケーションはほとんどありませんが、音声合成はすでにポッドキャストで利用されています。

そのような会社のXNUMXつであるDescriptは、「」と呼ばれる機能を作成しました。オーバーダブ'これにより、ポッドキャスターは自分の声を合成することができます。 このようにして、番組と音声文字変換をその場でシームレスに編集できます。

不正なコンテンツの話は常に懸念と批判に直面しますが、それは業界がAIのアイデアに出くわすことを妨げるものではありません。 それどころか、それはより高度になり、日ごとに検出するのが難しくなっています。

これらの機会に誰が最初にジャンプするかは興味深いでしょう。 パトリック・スチュワートがそう言ったなら、私はもっともっと喜んでPPIを買うでしょう。

ユーザー補助