Menu Menu

OpenAI allègue que le New York Times a trompé ChatGPT pour le faire plagier

Dans ce qui devrait être un argument définitif pour l'avenir de l'IA générative, le New York Times poursuit OpenAI pour avoir entraîné ChatGPT à l'aide de ses articles sans autorisation. L’accusé allègue que le média a trompé son modèle d’IA spécifiquement pour produire des réponses textuelles.

Le paysage de l’IA générative pourrait ne pas paraître aussi anarchique en 2024, si le New York Times parvient à gagner son procès historique contre la société mère d’OpenAI, Microsoft. Big si.

Dans ce qui s’annonce comme un moment charnière pour les plateformes d’IA générative et leurs processus innés, le média est poursuivre le créateur de ChatGPT pour avoir entraîné ses modèles de langage à l'aide du contenu du NYT sans autorisation.

Alors que la nature même d’un modèle d’apprentissage profond est de compartimenter autant de données que possible pour générer des réponses précieuses, le New York Times affirme que ChatGPT a récité son contenu textuellement à plusieurs reprises.

Un porte-parole a déclaré que cela « mine et nuit » à la réputation de l’entreprise tout en la privant « d’abonnements, de licences, de publicité et de revenus d’affiliation ». Le Times a mis à jour son rapport. conditions de service en août 2023 pour interdire le scraping de ses articles et images à des fins de formation à l’IA.

En termes simples, le New York Times considère désormais ChatGPT comme un concurrent direct dans le secteur de l’information et ne souhaite pas partager sa propriété intellectuelle sans compensation.

Cependant, dans une tournure juteuse des événements, OpenAI a a déclaré une croyance que les employés du New York Times ont délibérément trompé l'outil d'IA générative pour qu'il reproduise des extraits de ses articles. Rejetant l’affaire comme étant « sans fondement », OpenAI espère toujours s’associer au média – comme il l’a fait avec L'Associated Press, entre autres.

Parmi les exemples apparents de plagiat, dont le public n'est évidemment pas au courant, OpenAI affirme que le New York Times a soit explicitement demandé au modèle de régurgiter, soit sélectionné des exemples parmi de nombreuses tentatives.

Les citations sélectionnées « semblent provenir d’articles vieux d’un an qui ont proliféré sur plusieurs sites Web tiers », a déclaré un porte-parole de l’entreprise. OpenAI a précédemment supprimé une fonctionnalité ChatGPT appelée Explorer en découvrant du contenu reproduit involontairement, mais les seniors réfutent les allégations selon lesquelles son IA générative a maintenant le même problème.

Concernant l’utilisation du contenu du New York Times pour la formation du système, OpenAI affirme que ses pratiques relèvent des règles d’utilisation équitable qui autorisent la réutilisation d’œuvres protégées par le droit d’auteur. OpenAI permet aux entreprises d'empêcher son robot d'exploration Web de gratter directement bloquer son adresse IP, mais le New York Times estime avoir déjà pris l’initiative en introduisant des changements politiques généraux l’été dernier.

Exprimant une position similaire à celle du Chambre des Lords du Royaume-Uni, le propriétaire de ChatGPT a fait valoir que les œuvres protégées par le droit d’auteur doivent être incorporées pour « représenter toute la diversité de l’intelligence et de l’expérience humaines ». Cela n’est guère surprenant, étant donné que l’alternative représente la mort du concept même d’IA générative.

D’un autre côté, vous pouvez comprendre pourquoi les principales institutions du monde de l’édition ne sont pas ravies de l’idée de nouvelles entreprises technologiques ambiguës qui s’attaquent à leurs sources de revenus. L’éthique de l’IA est encore, au mieux, controversée, et les pousses vertes de la réglementation ne suivent pas la croissance commerciale incessante de la technologie.

Il incombe sans doute aux entreprises d’IA générative de forger des alliances en faisant en sorte que cela en vaille la peine pour les créateurs de contenu. Dans le cas contraire, une réplique juridique comme celle-ci sera toujours possible.

Dans ce cas, cependant, il ne semble pas qu’un compromis soit possible de la part de l’une ou l’autre des parties. La principale source d’intérêt se tourne désormais vers les ramifications potentielles de ce procès et leur importance pour l’avenir de l’IA générative en tant qu’entité.

Accessibilité