Sintesis ucapan AI mungkin terasa seperti gimmick baru sekarang, tetapi seiring dengan semakin canggihnya teknologi, dapatkah kita melihat integrasi skala penuh ke dalam dunia pemasaran?
Rupanya, synthesizer audio AI akan mendapatkan seluruh beban yang lebih canggih daripada generator rap Eminem. Seperti itu bahkan mungkin.
Terlepas dari banyak masalah etika seputar penggunaan AI untuk rekreasi dan potensinya untuk penggunaan jahat – dengan pornografi deepfake non-konsensual, direkayasa informasi politik yang salah, dan dimodifikasi citra satelit di antara pelanggar utama tahun 2021 – ada kemungkinan menarik untuk masuk ke industri arus utama lebih cepat dari yang diharapkan.
Di depan itu, semua bukti menunjuk ke arah hiburan sebagai jalan paling menjanjikan untuk teknologi.
Baru-baru ini, kami mendengar tentang paten Spotify untuk pembelajaran mesin yang akan menggunakan isyarat audio di lingkungan kita untuk merekomendasikan musik berdasarkan suasana hati kita, dan rumah produksi Lucasfilm mempekerjakan artis deepfake online 'Shamook' untuk membantu meningkatkan departemen efek visualnya.
Sementara satu atau dua tahun yang lalu, mengambil film blockbuster dan 'meningkatkan' CGI-nya kemungkinan akan menyebabkan perintah berhenti-dan-berhenti dari penciptanya, tampaknya ada penerimaan yang berkembang bahwa teknologi akan menjadi bagian tak terpisahkan dari kami. hidup.
Semakin banyak yang mengetahui gagasan itu, ada perasaan di antara para ahli AI bahwa teknologi selanjutnya dapat menargetkan industri periklanan. Bayangkan saja suara selebritas yang disintesis muncul di penempatan iklan atau identitas radio.
Cara kerja AI suara
Sama seperti deepfake visual, AI suara (atau sintesis suara) menggunakan sistem pembelajaran mesin untuk menarik rekaman suara seseorang yang tersebar dari berbagai sumber data.
Kumpulan audio mentah ini kemudian dijalankan melalui algoritme, yang menggunakan synthesizer untuk menyatukan semuanya dan membentuk input kalimat oleh pengguna.
Jika Anda belum menghabiskan waktu berjam-jam untuk membuat Yoda atau David Attenborough mengoceh, kami akan menunggu di sini sementara Anda bermain-main dengan salah satu dari banyak program bot online gratis. Gagal itu, lihat ini Eminem mensintesis lagu diss Mark Zuckerberg.
Seperti contoh di atas, sebagian besar materi klon suara online terkait dengan spoof atau hanya latihan teknologi, meskipun itu tidak berarti bahwa materi tersebut belum pernah muncul dalam proyek komersial yang serius.
Kembali pada bulan Juli, sebuah film dokumenter berjudul Roadrunner menggunakan AI suara untuk menciptakan kembali vokal koki Anthony Bourdain dan mengucapkan kalimat yang dia tulis sebelum kematiannya pada tahun 2018. Seperti yang dapat Anda bayangkan, ini tidak berjalan dengan baik dengan sebagian besar pemirsanya.
Kontroversi lebih lanjut muncul sebulan kemudian, ketika aktor Val Kilmer menggunakan agensi bernama Sonantic untuk meniru suaranya sebelum trakeostomi untuk menghilangkan kanker tenggorokan pada tahun 2014.
Sementara banyak yang memuji teknologi dalam kasus Kilmer, Roadrunner sebagian besar dipandang sebagai eksploitatif – terutama karena film dokumenter tersebut gagal mengungkapkan penggunaan sintesis suara sama sekali.