Menu Menu

Reddit signe ses données utilisateur pour former un modèle d'IA anonyme

Alors que les données des utilisateurs deviennent un produit de plus en plus prisé, une société d’IA anonyme aurait préparé un plan de 60 millions de dollars pour supprimer Reddit à des fins de formation en IA. Devons-nous nous inquiéter ?

Des décennies de divagations sur Reddit pourraient devenir le carburant de la prochaine génération de modèles d’IA.

La « Une d'Internet » autoproclamée aurait négocié un accord accord de licence de contenu avec une société d’IA anonyme. Pour le prix sympa de 60 millions de dollars, cette entreprise a, en théorie, désormais le droit de former son modèle d'IA en utilisant tout ce qui est publié sur Reddit.

Des millions de messages incessants provenant des subreddits les plus populaires, des rôdeurs et des restes de sujets douteux deviendront une marchandise annuelle continue pour ce « grand acteur » non divulgué de la Silicon Valley.

Cet accord surprenant arrive des mois après Reddit menacée pour couper les robots de recherche de Google et Bing si un accord officiel ne pouvait pas être conclu pour échanger ses données. Une source a déclaré au Washington post au moment où la plateforme « peut survivre » sans recherche. Peut-être que l’accord actuel sur l’IA était en vue à l’époque ?

Bien que les revenus annuels de Reddit aient augmenté de 20 % en 2023, ils étaient d'environ 200 millions de dollars de moins de son objectif d’un milliard de dollars fixé deux ans auparavant. Le pacte imminent sur l’IA, associé à une ouverture pour investissement public Le mois prochain, cependant, les préparations de Reddit seront probablement bien au nord de ce chiffre.

Après un quelques années tumultueuses, ce compromis en matière de données est parfaitement logique pour Reddit sur le plan financier. Cependant, ce que cela signifie exactement pour les consommateurs, et l’éthique toujours trouble de l’IA reste à débattre.

C'est l'un des secrets les moins bien gardés : les données de nos utilisateurs sont tout sauf privées dans le monde moderne. Rappelez-vous que récemment étude de surveillance dans Meta qui montrait que 48,000 XNUMX entreprises avaient envoyé à la plateforme des données sur un seul utilisateur sans consentement ?

Jusqu’à récemment, la plupart des entreprises d’IA utilisaient le Web ouvert pour former leurs modèles sans aucune sorte de feu vert vérifié, mais une combinaison de cas très médiatisés en 2023 semble changer le paysage.

Le problème d'OpenAI avec le et Les négociations d'Apple Les principaux partenaires médiatiques ont suggéré que les sociétés d'IA commençaient à établir un cadre juridique solide pour le grattage de données, conformément aux lois sur le droit d'auteur dans d'autres secteurs.

De même, l'accord de Reddit montre que les sociétés d'hébergement commencent à exiger une compensation pour les données, mais la principale différence ici est que son 812 millions d'utilisateurs mensuels n’ont pas explicitement donné leur consentement pour faire partie de la machine à IA.

Que les conditions d'utilisation de Reddit soient mises à jour ou non à l'avenir pour plus de transparence sur la destination de nos données, nous savons que toutes les informations numériques antérieures à cet accord sont également équitables. En termes simples, vous ne pouvez pas demander la permission après coup, n'est-ce pas ?

C’est peut-être la principale différence entre le scraping des médias et les plateformes de médias sociaux pour l’apprentissage de l’IA. Ce dernier est presque entièrement rempli de contenu généré par les utilisateurs ; dont l'utilisation semble être entièrement laissée à la discrétion de leurs dirigeants respectifs.

Au lieu de créer des plateformes AGI (Artificial General Intelligence) ayant une qualité plus nettement humaine, ce type d’accord deviendra probablement plus courant dans les années à venir.

Même si cela peut paraître positif, il suffit de penser aux flots infinis de désinformation et d’absurdités auxquelles cette machine d’apprentissage non identifiée sera soumise si tout se passe comme prévu.

C'est Reddit pour le bien de Pete. Ces garanties en matière d’IA devront certainement être renforcées.

Accessibilité