मेन्यू मेन्यू

क्या वॉयस एआई मार्केटिंग विस्फोट के कगार पर है?

एआई स्पीच सिंथेसाइज़र अब एक उपन्यास नौटंकी की तरह लग सकता है, लेकिन जैसे-जैसे तकनीक अधिक परिष्कृत होती जाती है, क्या हम मार्केटिंग की दुनिया में पूर्ण पैमाने पर एकीकरण देख सकते हैं?

जाहिर है, एआई ऑडियो सिंथेसाइज़र एमिनेम के रैप जनरेटर की तुलना में अधिक परिष्कृत लोड प्राप्त करने वाले हैं। जैसे यह संभव भी है।

एआई के मनोरंजक उपयोग और नापाक उपयोगों के लिए इसकी क्षमता के आसपास के कई नैतिक मुद्दों के बावजूद - गैर-सहमति वाले डीपफेक पोर्न के साथ, सिद्धांतबद्ध राजनीतिक गलत सूचना, और संशोधित उपग्रह चित्रण 2021 के मुख्य अपराधियों में से - इसके लिए उम्मीद से ज्यादा जल्दी मुख्यधारा के उद्योगों में प्रवेश करने की रोमांचक संभावनाएं हैं।

उस मोर्चे पर, सभी सबूत मनोरंजन को प्रौद्योगिकी के लिए सबसे आशाजनक अवसर के रूप में इंगित करते हैं।

अभी हाल ही में, हमने . के बारे में सुना है Spotify का पेटेंट मशीन लर्निंग के लिए जो हमारे वातावरण में ऑडियो संकेतों का उपयोग हमारे मूड और प्रोडक्शन हाउस के आधार पर संगीत की सिफारिश करने के लिए करेगा लुकासफिल्म अपने दृश्य प्रभाव विभाग को बेहतर बनाने में मदद करने के लिए ऑनलाइन डीपफेक कलाकार 'शामूक' को काम पर रखना।

https://youtu.be/yK-l4gz4rUU

जबकि एक या दो साल पहले, एक ब्लॉकबस्टर फिल्म लेने और इसके सीजीआई में 'सुधार' करने से इसके रचनाकारों से संघर्ष विराम का आदेश दिया गया होगा, ऐसा लगता है कि प्रौद्योगिकी हमारे हिस्से और पार्सल बन जाएगी जीवन।

जैसा कि उस धारणा के आसपास आता है, एआई विशेषज्ञों के बीच यह भावना है कि तकनीक अगले विज्ञापन उद्योग को लक्षित कर सकती है। ज़रा सोचिए कि विज्ञापन प्लेसमेंट या रेडियो आइडेंट्स पर सिंथेसाइज्ड सेलेब्रिटी की आवाज़ें आ रही हैं।


वॉयस एआई कैसे काम करता है

विज़ुअल डीपफेक की तरह, वॉयस एआई (या वॉयस सिंथेसिस) कई डेटा स्रोतों से किसी की आवाज के बिखरे हुए रिकॉर्ड को खींचने के लिए मशीन लर्निंग सिस्टम का उपयोग करता है।

कच्चे ऑडियो का यह संग्रह तब एक एल्गोरिथ्म के माध्यम से चलाया जाता है, जो सिंथेसाइज़र का उपयोग करके इसे एक साथ विभाजित करता है और उपयोगकर्ता द्वारा एक वाक्य इनपुट बनाता है।

यदि आपने अभी तक Yoda या डेविड एटनबरो को बकवास करने में घंटों बर्बाद नहीं किया है, तो हम यहां प्रतीक्षा करेंगे जब तक कि आप ऑनलाइन कई मुफ्त बॉट कार्यक्रमों में से एक के साथ खिलवाड़ करते हैं। असफल होने पर, इसे देखें एमिनेम संश्लेषित मार्क जुकरबर्ग डिस ट्रैक।

ऊपर दिए गए उदाहरण की तरह, ऑनलाइन वॉयस क्लोन सामग्री का अधिकांश हिस्सा या तो स्पूफ से संबंधित है या केवल तकनीक का एक अभ्यास है, हालांकि इसका मतलब यह नहीं है कि यह पहले से ही गंभीर व्यावसायिक परियोजनाओं में दिखाई नहीं दे रहा है।

जुलाई में वापस, नामक एक वृत्तचित्र रोडरनर शेफ एंथनी बॉर्डेन के स्वर को फिर से बनाने और 2018 में अपनी मृत्यु से पहले उनके द्वारा लिखी गई पंक्तियों को बोलने के लिए वॉयस एआई का इस्तेमाल किया। जैसा कि आप कल्पना कर सकते हैं, यह अपने दर्शकों के एक बड़े हिस्से के साथ बहुत अच्छा नहीं गया।

एक महीने बाद और विवाद छिड़ गया, जब अभिनेता वैल किल्मर ने 2014 में गले के कैंसर को दूर करने के लिए एक ट्रेकियोस्टोमी से पहले अपनी आवाज का अनुकरण करने के लिए सोनाटिक नामक एक एजेंसी का इस्तेमाल किया।

जबकि कई लोगों ने किल्मर के मामले में तकनीक की प्रशंसा की, रोडरनर बड़े पैमाने पर देखा गया था शोषक - विशेष रूप से वृत्तचित्र ध्वनि संश्लेषण के उपयोग का खुलासा करने में विफल रहा।


सेलेब्स और प्रभावित करने वालों के लिए एक आकर्षक भविष्य

सामान्य रूप से संश्लेषित आवाज़ों और डीपफेक के मुख्यधारा के उपयोग की भावना एकमत से बहुत दूर है, लेकिन मशहूर हस्तियों और कंपनियों दोनों के लिए उनके उपयोग के लिए लाइसेंस बनाने के लिए एक निश्चित दो-तरफा रुचि है - ठीक उसी तरह जैसे छवि अधिकार।

इसे स्वीकार करते हुए, वेरिटोन नामक एक कंपनी ने इस साल की शुरुआत में एक सेवा शुरू की, जिससे प्रभावितों, एथलीटों और अभिनेताओं को समर्थन के लिए अपने आभासी ऑडियो अधिकार बेचने की अनुमति मिली।

संक्षेप में, यह सेलेब्स और प्रभावितों को रिकॉर्डिंग स्टूडियो या स्थल पर शारीरिक रूप से यात्रा किए बिना राजस्व कमाने की अनुमति देता है, जबकि भुगतान करने वाला ग्राहक क्यू पर अपनी आवाज रखने का लाभ उठाता है।

मुझे यकीन है कि अनुबंध उससे कहीं अधिक बुलेटप्रूफ होंगे, लेकिन आपको इसका सार समझ में आ जाएगा।

जब तक प्रतिभाएं खुद को एक सिम्युलैक्रम किराए पर लेकर खुश हैं, तब तक निश्चित रूप से बड़े नामों को भुनाने के लिए भविष्य के अवसर होंगे।

उदाहरण के लिए, ब्रूस विलिस ने पहले ही अपनी छवि को रूसी में डीपफेक के रूप में इस्तेमाल करने के लिए लाइसेंस दे दिया है मोबाइल फ़ोन विज्ञापन. उस तथ्य को बनाना भी अधिक डायस्टोपियन, हम सीधे युवा विलिस से बात कर रहे हैं आसानी से न मरना युग.

यहाँ और अभी में, वेरिटोन जैसे अनुप्रयोग कम और बहुत दूर हैं, लेकिन आवाज संश्लेषण पहले से ही पॉडकास्ट द्वारा उपयोग किया जा रहा है।

ऐसी ही एक कंपनी Descript ने एक फीचर बनाया है जिसका नाम है 'overdub' जो पॉडकास्टरों को अपनी आवाजों को संश्लेषित करने की अनुमति देता है। इस तरह, शो और टेप को मक्खी पर मूल रूप से संपादित किया जा सकता है।

किसी भी अप्रमाणिक सामग्री की बात हमेशा चिंता और आलोचना के साथ की जाएगी, लेकिन यह उद्योगों को एआई के विचार के आसपास आने से नहीं रोक रही है। इसके विपरीत, यह अधिक उन्नत होता जा रहा है और दिन-ब-दिन इसका पता लगाना कठिन होता जा रहा है।

यह दिलचस्प होगा कि इन अवसरों पर सबसे पहले कौन कूदता है। अगर पैट्रिक स्टीवर्ट ने ऐसा कहा तो मैं पीपीआई खरीदने के लिए बहुत अधिक इच्छुक हूं।

अभिगम्यता