Menü Menü

Sesli yapay zeka bir pazarlama patlamasının eşiğinde mi?

AI konuşma sentezleyicileri şimdi yeni bir hile gibi gelebilir, ancak teknoloji daha karmaşık hale geldikçe, pazarlama dünyasına tam ölçekli bir entegrasyon görebilir miyiz?

Görünüşe göre, AI ses sentezleyicileri, Eminem'in rap oluşturucusundan çok daha karmaşık bir yük elde etmek üzere. Bu bile mümkünmüş gibi.

Yapay zekanın eğlence amaçlı kullanımı ve hain kullanım potansiyeli ile ilgili birçok etik soruna rağmen - rıza dışı derin sahte porno ile, üzerinde oynandı. siyasi yanlış bilgi, ve değiştirilmiş uydu görüntüleri 2021'in ana suçluları arasında - ana sektörlere beklenenden daha erken girmesi için heyecan verici olasılıklar var.

Bu cephede, tüm kanıtlar, teknoloji için en umut verici yol olarak eğlenceye işaret ediyor.

Daha yeni duyduk Spotify'ın patenti ruh halimize göre müzik önermek için ortamımızdaki sesli ipuçlarını kullanacak makine öğrenimi ve prodüksiyon evi için Lucasfilm Görsel efektler departmanını geliştirmeye yardımcı olması için çevrimiçi derin sahtekarlık sanatçısı 'Shamook'u işe aldı.

https://youtu.be/yK-l4gz4rUU

Bir veya iki yıl önce, gişe rekorları kıran bir film çekmek ve CGI'sını 'geliştirmek' muhtemelen yaratıcılarından bir durma ve vazgeçme emrine yol açmış olsa da, teknolojinin bizim hayatımızın bir parçası haline geleceği konusunda giderek artan bir kabul var gibi görünüyor. hayatları.

Bu görüşe daha fazla kişi yaklaştıkça, AI uzmanları arasında teknolojinin bir sonraki adımda reklam endüstrisini hedefleyebileceğine dair bir his var. Reklam yerleşimlerinde veya radyo kimliklerinde ortaya çıkan sentezlenmiş ünlü seslerini hayal edin.


Sesli AI nasıl çalışır?

Görsel derin sahtekarlıklar gibi, sesli AI (veya ses sentezi), birden fazla veri kaynağından birinin sesinin dağınık bir kaydını almak için makine öğrenme sistemlerini kullanır.

Bu ham ses koleksiyonu daha sonra, hepsini bir araya getirmek ve kullanıcı tarafından bir cümle girişi oluşturmak için sentezleyicileri kullanan bir algoritma aracılığıyla çalıştırılır.

Yoda ya da David Attenborough'un saçma sapan şeyler söylemesi için saatlerinizi henüz boşa harcamadıysanız, siz çevrimiçi birçok ücretsiz bot programından biriyle oyun oynarken biz burada bekleyeceğiz. Başarısız, şuna bakın Eminem sentezlenmiş Mark Zuckerberg diss parçası.

Yukarıdaki örnekte olduğu gibi, çevrimiçi ses klonlama materyalinin çoğunluğu ya sahtekarlıkla ilgilidir ya da yalnızca teknolojinin bir alıştırmasıdır, ancak bu, ciddi ticari projelerde zaten görünmediği anlamına gelmez.

Temmuz ayında bir belgesel, Roadrunner şef Anthony Bourdain'in vokallerini yeniden oluşturmak ve 2018'deki ölümünden önce yazdığı satırları seslendirmek için yapay zekayı kullandı. Tahmin edebileceğiniz gibi, bu, izleyicilerinin büyük bir bölümünde pek iyi gitmedi.

Bir ay sonra, aktör Val Kilmer, 2014 yılında boğaz kanserini gidermek için bir trakeostomiden önce sesini taklit etmek için Sonantic adlı bir ajansı kullandığında, daha fazla tartışma başladı.

Birçok kişi Kilmer davasında teknolojiyi överken, Roadrunner büyük ölçüde olarak görüldü sömürücü – özellikle belgesel ses sentezi kullanımını hiç ifşa etmede başarısız olduğu için.


Ünlüler ve etkileyiciler için kazançlı bir gelecek

Genel olarak sentezlenmiş seslerin ve derin sahtekarlıkların ana akım kullanımına yönelik hisler ortak olmaktan çok uzaktır, ancak hem ünlüler hem de şirketler, kullanımları için lisans vermeye kesin olarak iki yönlü bir ilgi duyuyor - görüntü haklarıyla aynı şekilde.

Bunu kabul eden Veritone adlı bir şirket, bu yılın başlarında etkileyicilerin, sporcuların ve oyuncuların sanal ses haklarını onay için satmalarına izin veren bir hizmet başlattı.

Özünde, bu, ünlülerin ve etkileyicilerin fiziksel olarak bir kayıt stüdyosuna veya mekanına seyahat etmek zorunda kalmadan gelir elde etmelerini sağlarken, ödeme yapan bir müşteri, sesini anında kullanmanın avantajlarından yararlanır.

Sözleşmelerin bundan daha kurşun geçirmez olacağına eminim, ama ana fikri anladınız.

Yetenek, kendi simülakrını kiralamaktan mutlu olduğu sürece, büyük isimlerin para kazanabileceği gelecekteki fırsatlar neredeyse kesinlikle olacaktır.

Örneğin Bruce Willis, imajının Rusça'da deepfake olarak kullanılması için zaten lisans verdi. cep telefonu reklamları. Bu gerçeği yapmak Üstelik daha distopik, genç Willis'ten doğrudan bahsediyoruz Die Hard dönemi.

Burada ve şimdi, Veritone gibi uygulamalar çok azdır, ancak ses sentezi podcast'ler tarafından zaten kullanılmaktadır.

Böyle bir şirket olan Descript, 'adlı bir özellik yarattı.overdub' podcast yayıncılarının kendi seslerini sentezlemelerini sağlar. Bu şekilde, gösteriler ve transkriptler anında sorunsuz bir şekilde düzenlenebilir.

Herhangi bir orijinal olmayan içerikten bahsetmek her zaman endişe ve eleştiri ile karşılanacaktır, ancak bu, endüstrilerin AI fikrine gelmesini engellemiyor. Aksine, gün geçtikçe daha gelişmiş ve tespit edilmesi zorlaşıyor.

Bu fırsatlara ilk kimin atladığı ilginç olacak. Patrick Stewart öyle söyleseydi, ÜFE satın almaya çok daha istekli olurdum.

Engellilerin kullanımları için uygunluk