menu menu

Reddit menandatangani data penggunanya untuk melatih model AI yang tidak disebutkan namanya

Ketika data pengguna menjadi komoditas yang semakin populer, sebuah perusahaan AI yang tidak disebutkan namanya dilaporkan merencanakan dana sebesar $60 juta untuk memanfaatkan Reddit untuk tujuan pelatihan AI. Perlukah kita khawatir?

Ocehan Reddit selama beberapa dekade dapat menjadi bahan bakar bagi model AI generasi berikutnya.

'Halaman depan internet' yang memproklamirkan diri dilaporkan telah menegosiasikan a kesepakatan lisensi konten dengan perusahaan AI yang tidak disebutkan namanya. Dengan harga keren sebesar $60 juta, bisnis ini, secara teori, kini berhak melatih model AI-nya menggunakan apa saja yang diposting di Reddit.

Jutaan postingan tanpa henti dari subreddit paling populer, para pengintai, dan topik-topik yang meragukan akan menjadi komoditas tahunan yang bergulir bagi 'pemain besar' Silicon Valley yang dirahasiakan ini.

Kesepakatan mengejutkan ini terjadi beberapa bulan setelah Reddit terancam untuk memotong perayap pencarian Google dan Bing jika kesepakatan resmi tidak dapat dicapai untuk memperdagangkan datanya. Salah satu sumber mengatakan kepada Washington Post pada saat platform 'dapat bertahan' tanpa pencarian. Mungkin kesepakatan AI saat ini akan segera terjadi?

Meskipun pendapatan tahunan Reddit naik 20% pada tahun 2023, angka tersebut kira-kira meningkat $200 juta malu dari target $1 miliar yang ditetapkan dua tahun sebelumnya. Perjanjian AI yang akan datang, disertai dengan pembukaan investasi publik bulan depan, bagaimanapun, kemungkinan akan mengirimkan kesiapan Reddit jauh di atas angka ini.

Setelah beberapa tahun yang penuh gejolak, pertukaran data ini sangat masuk akal bagi Reddit secara finansial. Namun, apa sebenarnya arti AI bagi konsumen, dan etika AI yang selalu suram masih menjadi perdebatan.

Ini adalah salah satu rahasia terburuk yang disimpan bahwa data pengguna kami sama sekali tidak bersifat pribadi di dunia modern. Ingat itu baru-baru ini studi anjing penjaga ke Meta yang menunjukkan 48,000 perusahaan telah mengirimkan data platform pada satu pengguna tanpa persetujuan?

Sampai saat ini, sebagian besar perusahaan AI menggunakan web terbuka untuk melatih model mereka tanpa izin terverifikasi apa pun, namun kombinasi kasus-kasus penting pada tahun 2023 tampaknya mengubah lanskap.

Perdebatan OpenAI dengan dan Negosiasi Apple Mitra berita utama menyarankan agar perusahaan AI mulai membangun kerangka hukum yang kuat untuk pengumpulan data sejalan dengan undang-undang hak cipta di sektor lain.

Demikian pula, kesepakatan Reddit menunjukkan bahwa perusahaan tuan rumah mulai menuntut kompensasi atas data, namun perbedaan utamanya adalah hal tersebut 812 juta pengguna bulanan belum secara eksplisit memberikan persetujuan mereka untuk menjadi bagian dari mesin AI.

Terlepas dari apakah persyaratan layanan Reddit diperbarui di masa mendatang demi transparansi tentang ke mana data kami pergi, kami tahu bahwa semua informasi digital sebelum kesepakatan ini juga merupakan hal yang wajar. Dalam istilah awam, Anda tidak bisa meminta izin setelah kejadian itu terjadi, bukan?

Mungkin inilah perbedaan utama antara memanfaatkan outlet berita dan platform media sosial untuk pembelajaran AI. Yang terakhir ini hampir seluruhnya diisi oleh konten buatan pengguna; penggunaannya tampaknya sepenuhnya bergantung pada kebijaksanaan manajemen masing-masing.

Alih-alih menciptakan platform AGI (Artificial General Intelligence) dengan kualitas manusia yang lebih jelas, kesepakatan semacam ini kemungkinan akan menjadi lebih umum di tahun-tahun mendatang.

Meskipun hal ini mungkin terdengar positif, bayangkan saja banyaknya misinformasi dan omong kosong yang akan menimpa mesin pembelajaran tak dikenal ini jika semuanya berjalan sesuai rencana.

Ini Reddit demi Pete. Perlindungan AI tersebut tentunya perlu diperkuat.

Aksesibilitas