मेन्यू मेन्यू

Reddit अनाम AI मॉडल को प्रशिक्षित करने के लिए अपने उपयोगकर्ता डेटा पर हस्ताक्षर करता है

जैसे-जैसे उपयोगकर्ता डेटा तेजी से लोकप्रिय वस्तु बनता जा रहा है, एक अनाम एआई कंपनी कथित तौर पर एआई प्रशिक्षण उद्देश्यों के लिए रेडिट को खत्म करने के लिए $ 60 मिलियन की योजना बना रही है। क्या हमें चिंतित होना चाहिए?

रेडिट की दशकों की बकवास अगली पीढ़ी के एआई मॉडल के लिए ईंधन बन सकती है।

स्व-घोषित 'इंटरनेट के फ्रंट पेज' ने कथित तौर पर बातचीत की है सामग्री लाइसेंसिंग सौदा एक अनाम एआई कंपनी के साथ। $60 मिलियन की उचित कीमत पर, सिद्धांत रूप में, इस व्यवसाय को अब Reddit पर पोस्ट की गई किसी भी चीज़ का उपयोग करके अपने AI मॉडल को प्रशिक्षित करने का अधिकार है।

सबसे लोकप्रिय सबरेडिट्स, लर्कर्स और संदिग्ध विषयों के लाखों निरंतर पोस्ट सिलिकॉन वैली के इस अज्ञात 'बड़े खिलाड़ी' के लिए एक रोलिंग वार्षिक वस्तु बन जाएंगे।

यह आश्चर्यजनक डील Reddit के महीनों बाद आई है धमकी दी यदि Google और बिंग के डेटा के व्यापार के लिए कोई आधिकारिक सौदा नहीं हो पाता है तो उसके खोज क्रॉलर को बंद कर दिया जाए। एक सूत्र ने यह जानकारी दी वाशिंगटन पोस्ट उस समय जब प्लेटफ़ॉर्म बिना खोज के 'जीवित रह सकता है'। शायद यह मौजूदा एआई सौदा उस समय जल्द ही चल रहा था?

हालाँकि Reddit का वार्षिक राजस्व 20 में 2023% बढ़ गया था, यह मोटे तौर पर था $200 मिलियन शर्मीला दो साल पहले निर्धारित इसके $1 बिलियन के लक्ष्य में से। आसन्न एआई समझौता, एक शुरुआत के साथ जोड़ा गया सार्वजनिक निवेश हालाँकि, अगले महीने, Reddit की रेडीज़ को इस आंकड़े से बहुत दूर भेजने की संभावना है।

एक के बाद अशांत कुछ साल, यह डेटा व्यापार Reddit के वित्तीय दृष्टिकोण से बिल्कुल सही है। हालाँकि, उपभोक्ताओं के लिए इसका वास्तव में क्या मतलब है, और एआई की हमेशा संदिग्ध नैतिकता बहस का विषय बनी हुई है।

यह सबसे खराब रहस्यों में से एक है कि आधुनिक दुनिया में हमारा उपयोगकर्ता डेटा निजी नहीं है। वह हालिया याद रखें निगरानी अध्ययन मेटा में दिखाया गया कि 48,000 कंपनियों ने सहमति के बिना एक ही उपयोगकर्ता पर प्लेटफ़ॉर्म डेटा भेजा था?

हाल तक, अधिकांश एआई कंपनियां किसी भी प्रकार की सत्यापित हरी बत्ती के बिना अपने मॉडलों को प्रशिक्षित करने के लिए ओपन वेब का उपयोग करती थीं, लेकिन 2023 में हाई-प्रोफाइल मामलों का संयोजन परिदृश्य को बदलता हुआ दिखाई दिया।

OpenAI के साथ विवाद न्यूयॉर्क टाइम्स और एप्पल की बातचीत प्रमुख समाचार साझेदारों ने सुझाव दिया कि एआई कंपनियां अन्य क्षेत्रों में कॉपीराइट कानूनों के अनुरूप डेटा स्क्रैपिंग के लिए एक मजबूत कानूनी ढांचा स्थापित करना शुरू कर रही हैं।

इसी तरह, रेडिट के सौदे से पता चलता है कि मेजबान कंपनियां डेटा के लिए मुआवजे की मांग करने लगी हैं, लेकिन यहां मुख्य अंतर यह है 812 लाख मासिक उपयोगकर्ता एआई मशीन का हिस्सा बनने के लिए स्पष्ट रूप से अपनी सहमति नहीं दी है।

हमारा डेटा कहां जाता है, इस बारे में पारदर्शिता के लिए भविष्य में Reddit की सेवा की शर्तें अपडेट की जाती हैं या नहीं, हम जानते हैं कि इस सौदे से पहले की सभी डिजिटल जानकारी भी निष्पक्ष खेल है। आम आदमी के शब्दों में, आप इस तथ्य के बाद अनुमति नहीं मांग सकते, क्या आप ऐसा कर सकते हैं?

शायद एआई सीखने के लिए समाचार आउटलेट्स और सोशल मीडिया प्लेटफ़ॉर्म को स्क्रैप करने के बीच यही महत्वपूर्ण अंतर है। उत्तरार्द्ध लगभग पूरी तरह से उपयोगकर्ता द्वारा उत्पन्न सामग्री से भरा हुआ है; जिसका उपयोग पूरी तरह से उनके संबंधित प्रबंधन के विवेक पर निर्भर प्रतीत होता है।

अधिक विशिष्ट मानवीय गुणवत्ता वाले एजीआई (आर्टिफिशियल जनरल इंटेलिजेंस) प्लेटफॉर्म बनाने के बदले में, आने वाले वर्षों में इस प्रकार का सौदा संभवतः अधिक आम हो जाएगा।

हालांकि यह सकारात्मक लग सकता है, लेकिन जरा सोचिए कि यदि सब कुछ योजना के अनुसार हुआ तो यह अज्ञात शिक्षण मशीन गलत सूचना और बकवास के अंतहीन ढेर के अधीन होगी।

यह पीट की खातिर रेडिट है। उन एआई सुरक्षा उपायों को निश्चित रूप से सुदृढ़ करने की आवश्यकता होगी।

अभिगम्यता