menu menu

Apakah AI suara di ambang ledakan pemasaran?

Sintesis ucapan AI mungkin terasa seperti gimmick baru sekarang, tetapi seiring dengan semakin canggihnya teknologi, dapatkah kita melihat integrasi skala penuh ke dalam dunia pemasaran?

Rupanya, synthesizer audio AI akan mendapatkan seluruh beban yang lebih canggih daripada generator rap Eminem. Seperti itu bahkan mungkin.

Terlepas dari banyak masalah etika seputar penggunaan AI untuk rekreasi dan potensinya untuk penggunaan jahat – dengan pornografi deepfake non-konsensual, direkayasa informasi politik yang salah, dan dimodifikasi citra satelit di antara pelanggar utama tahun 2021 – ada kemungkinan menarik untuk masuk ke industri arus utama lebih cepat dari yang diharapkan.

Di depan itu, semua bukti menunjuk ke arah hiburan sebagai jalan paling menjanjikan untuk teknologi.

Baru-baru ini, kami mendengar tentang paten Spotify untuk pembelajaran mesin yang akan menggunakan isyarat audio di lingkungan kita untuk merekomendasikan musik berdasarkan suasana hati kita, dan rumah produksi Lucasfilm mempekerjakan artis deepfake online 'Shamook' untuk membantu meningkatkan departemen efek visualnya.

https://youtu.be/yK-l4gz4rUU

Sementara satu atau dua tahun yang lalu, mengambil film blockbuster dan 'meningkatkan' CGI-nya kemungkinan akan menyebabkan perintah berhenti-dan-berhenti dari penciptanya, tampaknya ada penerimaan yang berkembang bahwa teknologi akan menjadi bagian tak terpisahkan dari kami. hidup.

Semakin banyak yang mengetahui gagasan itu, ada perasaan di antara para ahli AI bahwa teknologi selanjutnya dapat menargetkan industri periklanan. Bayangkan saja suara selebritas yang disintesis muncul di penempatan iklan atau identitas radio.


Cara kerja AI suara

Sama seperti deepfake visual, AI suara (atau sintesis suara) menggunakan sistem pembelajaran mesin untuk menarik rekaman suara seseorang yang tersebar dari berbagai sumber data.

Kumpulan audio mentah ini kemudian dijalankan melalui algoritme, yang menggunakan synthesizer untuk menyatukan semuanya dan membentuk input kalimat oleh pengguna.

Jika Anda belum menghabiskan waktu berjam-jam untuk membuat Yoda atau David Attenborough mengoceh, kami akan menunggu di sini sementara Anda bermain-main dengan salah satu dari banyak program bot online gratis. Gagal itu, lihat ini Eminem mensintesis lagu diss Mark Zuckerberg.

Seperti contoh di atas, sebagian besar materi klon suara online terkait dengan spoof atau hanya latihan teknologi, meskipun itu tidak berarti bahwa materi tersebut belum pernah muncul dalam proyek komersial yang serius.

Kembali pada bulan Juli, sebuah film dokumenter berjudul Roadrunner menggunakan AI suara untuk menciptakan kembali vokal koki Anthony Bourdain dan mengucapkan kalimat yang dia tulis sebelum kematiannya pada tahun 2018. Seperti yang dapat Anda bayangkan, ini tidak berjalan dengan baik dengan sebagian besar pemirsanya.

Kontroversi lebih lanjut muncul sebulan kemudian, ketika aktor Val Kilmer menggunakan agensi bernama Sonantic untuk meniru suaranya sebelum trakeostomi untuk menghilangkan kanker tenggorokan pada tahun 2014.

Sementara banyak yang memuji teknologi dalam kasus Kilmer, Roadrunner sebagian besar dipandang sebagai eksploitatif – terutama karena film dokumenter tersebut gagal mengungkapkan penggunaan sintesis suara sama sekali.


Masa depan yang menguntungkan bagi selebriti dan influencer

Perasaan terhadap penggunaan arus utama dari suara yang disintesis dan deepfake secara umum jauh dari kata bulat, tetapi ada minat dua arah yang pasti dari selebriti dan perusahaan untuk membuat lisensi untuk penggunaannya – sama seperti hak gambar.

Menyadari hal ini, sebuah perusahaan bernama Veritone meluncurkan layanan awal tahun ini yang memungkinkan influencer, atlet, dan aktor untuk menjual hak audio virtual mereka untuk mendapatkan dukungan.

Intinya, ini memungkinkan selebritis dan influencer menghasilkan pendapatan tanpa harus secara fisik bepergian ke studio atau tempat rekaman, sementara klien yang membayar mendapat manfaat dari suaranya yang sesuai.

Saya yakin kontrak akan lebih tahan peluru dari itu, tetapi Anda mendapatkan intinya.

Selama talenta senang menyewakan simulacrum dari diri mereka sendiri, hampir pasti akan ada peluang di masa depan bagi nama-nama besar untuk mendapatkan uang.

Bruce Willis, misalnya, telah melisensikan gambarnya untuk digunakan sebagai deepfake dalam bahasa Rusia iklan ponsel. Membuat fakta itu bahkan lebih dystopian, kita berbicara tentang Willis muda langsung dari Die hard era.

Di sini dan sekarang, aplikasi seperti Veritone sangat sedikit dan jarang, tetapi sintesis suara sudah digunakan oleh podcast.

Salah satu perusahaan tersebut, Descript, telah menciptakan fitur yang disebut 'Overdub' yang memungkinkan podcaster untuk mensintesis suara mereka sendiri. Dengan cara ini, acara dan transkrip dapat diedit dengan mulus dengan cepat.

Pembicaraan tentang konten yang tidak autentik akan selalu mendapat perhatian dan kritik, tetapi itu tidak menghentikan industri untuk datang ke ide AI. Sebaliknya, itu menjadi lebih maju dan sulit dideteksi dari hari ke hari.

Akan menarik bagi siapa yang melompat lebih dulu pada kesempatan-kesempatan ini. Saya akan jauh lebih bersedia untuk membeli PPI jika Patrick Stewart berkata demikian.

Aksesibilitas