AI音声シンセサイザーは今では斬新な仕掛けのように感じるかもしれませんが、テクノロジーがより洗練されるにつれて、マーケティングの世界への本格的な統合を見ることができるでしょうか?
どうやら、AIオーディオシンセサイザーは、エミネムのラップジェネレーターよりも全体の負荷をより洗練されたものにしようとしています。 そのようにさえ可能です。
AIの娯楽的使用とその不正使用の可能性を取り巻く多くの倫理的問題にもかかわらず、合意に基づかないディープフェイクポルノを使用して、医師の診察を受けました 政治的誤報、および変更 衛星画像 2021年の主な犯罪者の中には、予想よりも早く主流の産業に参入する可能性があります。
その面では、すべての証拠が、テクノロジーの最も有望な手段としてエンターテインメントを示しています。
ごく最近、聞いたことがあります Spotifyの特許 私たちの環境でオーディオキューを使用して気分に基づいて音楽を推奨する機械学習、および制作会社 ルーカスフィルム ビジュアルエフェクト部門の改善を支援するために、オンラインのディープフェイクアーティスト「Shamook」を雇う。
XNUMX、XNUMX年前、大ヒット映画を撮り、そのCGIを「改善」することで、クリエイターからの排除措置命令が出された可能性がありますが、テクノロジーが私たちの一部となることへの受容が高まっているようです。生きています。
その概念にさらに近づくにつれて、AIの専門家の間では、技術が次に広告業界をターゲットにする可能性があるという感覚があります。 合成された有名人の声が広告の配置やラジオのIDにポップアップすることを想像してみてください。
音声AIのしくみ
視覚的なディープフェイクと同じように、音声AI(または音声合成)は機械学習システムを使用して、複数のデータソースから誰かの声の散在する記録を引き出します。
次に、この生のオーディオのコレクションは、シンセサイザーを使用してすべてをつなぎ合わせ、ユーザーが入力した文を形成するアルゴリズムを介して実行されます。
ヨーダやデイビッドアッテンボローがナンセンスを吐き出すのにまだ時間を無駄にしていない場合は、オンラインで多くの無料ボットプログラムのXNUMXつをいじくり回している間、ここで待機します。 それが失敗した場合は、これをチェックしてください エミネム 合成されたマーク・ザッカーバーグのディストラック。
上記の例のように、オンラインの音声クローン資料の大部分は、なりすまし関連であるか、単にテクノロジーの演習であるかのいずれかですが、それが本格的な商業プロジェクトにまだ登場していないというわけではありません。
XNUMX月に戻って、と呼ばれるドキュメンタリー ロードランナー 音声AIを使用して、シェフのアンソニーボーディンのボーカルを再現し、2018年に亡くなる前に書いたセリフを話しました。ご想像のとおり、これは視聴者の大部分ではうまくいきませんでした。
俳優のヴァルキルマーが2014年に気管切開の前に彼の声をエミュレートするためにソナンティックと呼ばれる機関を使用したとき、さらに論争が巻き起こった。
キルマーの場合、多くの人がこの技術を賞賛しましたが、 ロードランナー 主に 搾取的 –特にドキュメンタリーが音声合成の使用をまったく開示しなかったため。