القائمة القائمة

يقوم Reddit بتسجيل بيانات المستخدم الخاصة به لتدريب نموذج الذكاء الاصطناعي غير المسمى

نظرًا لأن بيانات المستخدم أصبحت سلعة رائجة بشكل متزايد، تفيد التقارير أن شركة ذكاء اصطناعي لم تذكر اسمها تخطط لهجوم بقيمة 60 مليون دولار لانتزاع موقع Reddit لأغراض التدريب على الذكاء الاصطناعي. هل يجب أن نشعر بالقلق؟

يمكن لعقود من التجوال على موقع Reddit أن تصبح وقودًا للجيل القادم من نماذج الذكاء الاصطناعي.

وبحسب ما ورد تفاوضت "الصفحة الأولى للإنترنت" التي نصبت نفسها بنفسها على صفقة ترخيص المحتوى مع شركة AI غير مسماة. مقابل سعر رائع قدره 60 مليون دولار، تتمتع هذه الشركة، من الناحية النظرية، الآن بالحق في تدريب نموذج الذكاء الاصطناعي الخاص بها باستخدام أي شيء وكل شيء منشور على Reddit.

ستصبح الملايين من المنشورات المتواصلة من مواقع subreddits الأكثر شهرة، والمتربصين، وحثالة المواضيع المشكوك فيها سلعة سنوية متداولة لهذا "اللاعب الكبير" الذي لم يُكشف عنه في وادي السيليكون.

تصل هذه الصفقة المفاجئة بعد أشهر من رديت هدد لقطع برامج زحف البحث الخاصة بـ Google وBing إذا لم يتم التوصل إلى اتفاق رسمي لتداول بياناتها. وقال أحد المصادر ل لواشنطن بوست في الوقت الذي يمكن للمنصة "البقاء" بدون بحث. ربما كانت صفقة الذكاء الاصطناعي الحالية هذه في الأفق في ذلك الوقت؟

على الرغم من أن إيرادات Reddit السنوية ارتفعت بنسبة 20% في عام 2023، إلا أنها كانت تقريبًا 200 مليون دولار خجولة من هدفها البالغ مليار دولار الذي تم تحديده قبل عامين. اتفاقية الذكاء الاصطناعي الوشيكة، مقترنة بفتحة لـ الاستثمار العام ومع ذلك، فمن المرجح أن يرسل الشهر المقبل استعدادات Reddit إلى الشمال من هذا الرقم.

بعد بضع سنوات صاخبة، فإن مقايضة البيانات هذه منطقية تمامًا بالنسبة لـ Reddit من الناحية المالية. ومع ذلك، فإن ما يعنيه ذلك بالضبط بالنسبة للمستهلكين، وما زالت أخلاقيات الذكاء الاصطناعي الغامضة محل نقاش.

إنها واحدة من أسوأ الأسرار التي يتم الاحتفاظ بها، وهي أن بيانات المستخدم الخاصة بنا ليست خاصة في العالم الحديث. تذكر أن الأخيرة دراسة الوكالة الدولية للطاقة في Meta التي أظهرت أن 48,000 شركة أرسلت بيانات النظام الأساسي لمستخدم واحد دون موافقة؟

حتى وقت قريب، استخدمت معظم شركات الذكاء الاصطناعي شبكة الإنترنت المفتوحة لتدريب نماذجها دون أي نوع من الضوء الأخضر الذي تم التحقق منه، ولكن يبدو أن مجموعة من الحالات البارزة في عام 2023 ستغير المشهد.

مراوغة OpenAI مع نيويورك تايمز و مفاوضات أبل اقترح شركاء الأخبار الرئيسيون أن شركات الذكاء الاصطناعي بدأت في إنشاء إطار قانوني قوي لاستخراج البيانات بما يتماشى مع قوانين حقوق النشر في القطاعات الأخرى.

وبالمثل، تظهر صفقة ريديت أن الشركات المضيفة بدأت في المطالبة بالتعويض عن البيانات، ولكن الفرق الرئيسي هنا هو أن 812 مليون مستخدم شهري لم يعطوا موافقتهم صراحةً على أن يصبحوا جزءًا من آلة الذكاء الاصطناعي.

سواء تم تحديث شروط خدمة Reddit في المستقبل أم لا من أجل الشفافية حول المكان الذي تذهب إليه بياناتنا، فإننا نعلم أن جميع المعلومات الرقمية قبل هذه الصفقة هي أيضًا لعبة عادلة. بعبارات عامة، لا يمكنك طلب الإذن بعد الواقعة، أليس كذلك؟

ولعل هذا هو الفرق الرئيسي بين استخلاص المنافذ الإخبارية ومنصات التواصل الاجتماعي لتعلم الذكاء الاصطناعي. يتم ملء الأخير بالكامل تقريبًا بالمحتوى الذي ينشئه المستخدم؛ والذي يبدو أن استخدامه يعود تمامًا إلى تقدير الإدارة الخاصة بهم.

وبدلا من إنشاء منصات الذكاء العام الاصطناعي ذات الجودة البشرية الأكثر وضوحا، فمن المرجح أن يصبح هذا النوع من الصفقات أكثر شيوعا في السنوات القادمة.

على الرغم من أن هذا قد يبدو إيجابيًا، فما عليك سوى التفكير في الكم الهائل من المعلومات الخاطئة والهراء التي ستخضع لها آلة التعلم المجهولة هذه إذا سارت الأمور كما هو مخطط لها.

إنه رديت من أجل بيت. ستحتاج ضمانات الذكاء الاصطناعي هذه إلى التعزيز بالتأكيد.

إمكانية الوصول