Menú Menú

Reddit cede los datos de sus usuarios para entrenar un modelo de IA sin nombre

A medida que los datos de los usuarios se convierten en un bien cada vez más popular, se informa que una empresa de inteligencia artificial anónima está planeando una redada de 60 millones de dólares para eliminar Reddit con fines de capacitación en inteligencia artificial. ¿Deberíamos preocuparnos?

Décadas de divagaciones en Reddit podrían convertirse en combustible para la próxima generación de modelos de IA.

La autoproclamada "primera página de Internet" habría negociado un acuerdo acuerdo de licencia de contenido con una empresa de IA anónima. Por el fantástico precio de 60 millones de dólares, esta empresa, en teoría, ahora tiene derecho a entrenar su modelo de IA utilizando cualquier cosa publicada en Reddit.

Millones de publicaciones incesantes de los subreddits más populares, los merodeadores y los restos de temas cuestionables se convertirán en un producto anual para este "gran jugador" no revelado de Silicon Valley.

Este sorprendente acuerdo llega meses después de Reddit amenazada cortar los rastreadores de búsqueda de Google y Bing si no se podía llegar a un acuerdo oficial para intercambiar sus datos. Una fuente le dijo a la El Correo de Washington en el momento en que la plataforma 'puede sobrevivir' sin búsquedas. ¿Quizás este acuerdo actual sobre IA estaba a la vista en aquel entonces?

Aunque los ingresos anuales de Reddit aumentaron un 20% en 2023, fueron aproximadamente 200 millones de dólares menos de su objetivo de mil millones de dólares fijado dos años antes. El inminente pacto sobre IA, junto con una apertura para inversión publica Sin embargo, el próximo mes probablemente enviará los preparativos de Reddit muy por encima de esta cifra.

Después de unos años tumultuosos, esta compensación de datos tiene mucho sentido para Reddit desde el punto de vista financiero. Sin embargo, exactamente lo que significa para los consumidores, y la siempre turbia ética de la IA, sigue siendo tema de debate.

Uno de los secretos peor guardados es que nuestros datos de usuario no son privados en el mundo moderno. Recuerda que reciente estudio de vigilancia en Meta que mostraba que 48,000 empresas habían enviado datos de la plataforma sobre un solo usuario sin consentimiento?

Hasta hace poco, la mayoría de las empresas de inteligencia artificial utilizaban la web abierta para entrenar sus modelos sin ningún tipo de luz verde verificada, pero una combinación de casos de alto perfil en 2023 parecía estar cambiando el panorama.

La objeción de OpenAI con el New York Times y Las negociaciones de Apple Los principales socios de noticias sugirieron que las empresas de inteligencia artificial estaban comenzando a establecer un marco legal sólido para la extracción de datos en línea con las leyes de derechos de autor de otros sectores.

De manera similar, el acuerdo de Reddit muestra que las empresas anfitrionas están comenzando a exigir una compensación por los datos, pero la diferencia clave aquí es que su 812 millones de usuarios mensuales no han dado explícitamente su consentimiento para formar parte de la máquina de IA.

Ya sea que los términos de servicio de Reddit se actualicen o no en el futuro para garantizar la transparencia sobre dónde van nuestros datos, sabemos que toda la información digital anterior a este acuerdo también es un juego limpio. En términos sencillos, no se puede pedir permiso después del hecho, ¿verdad?

Quizás esta sea la diferencia clave entre los medios de comunicación y las plataformas de redes sociales para el aprendizaje de la IA. Este último está compuesto casi en su totalidad por contenido generado por el usuario; cuyo uso parece depender completamente de la discreción de sus respectivas direcciones.

En lugar de crear plataformas AGI (Inteligencia General Artificial) con una calidad más claramente humana, este tipo de acuerdo probablemente se volverá más común en los próximos años.

Si bien esto puede parecer positivo, basta pensar en la interminable cantidad de información errónea y tonterías a las que estará sujeta esta máquina de aprendizaje no identificada si todo sale según lo planeado.

Es Reddit, por el amor de Dios. Seguramente será necesario reforzar esas salvaguardias de la IA.

Accesibilidad