Meny Meny

OpenAI hevder at New York Times lurte ChatGPT til å plagiere

I det som skal være en definitiv sak for fremtiden til generativ AI, saksøker New York Times OpenAI for å trene ChatGPT ved å bruke artiklene sine uten tillatelse. Tiltalte hevder at media lurte AI-modellen spesifikt for å gi svar ordrett.

Landskapet med generativ AI ser kanskje ikke så lovløst ut i 2024, hvis New York Times kan vinne sin landemerkesak mot OpenAIs morselskap, Microsoft. Stor hvis.

I det som kommer til å bli et sentralt tidspunkt for generative AI-plattformer og deres medfødte prosesser, er mediene saksøke ChatGPTs skaper for opplæring av sine språkmodeller ved å bruke NYT-innhold uten tillatelse.

Mens selve naturen til en dyp læringsmodell er å dele så mye data som mulig for å generere verdifulle svar, hevder NYT at ChatGPT har resitert innholdet ordrett ved flere anledninger.

En talsperson sa at dette "undergraver og skader" selskapets omdømme samtidig som det frarøves det for "abonnement, lisensiering, annonsering og tilknyttede inntekter." The Times oppdaterte sin vilkårene for tjenesten i august 2023 for å forby skraping av artikler og bilder for AI-trening.

I lekmenns termer ser NYT nå på ChatGPT som direkte konkurranse i nyhetsbransjen og er ikke interessert i å dele sin intellektuelle eiendom uten kompensasjon.

I en saftig vending har imidlertid OpenAI uttalt en tro at ansatte ved NYT bevisst lurte det generative AI-verktøyet til å gjenskape utdrag fra artiklene. OpenAI avviser saken som «uten fortjeneste», og håper fortsatt å samarbeide med media – slik det har gjort med The Associated Press, Blant andre.

Av de tilsynelatende eksemplene på plagiat, som offentligheten åpenbart ikke er kjent med, hevder OpenAI at NYT enten eksplisitt instruerte modellen om å gjenoppstå eller kirsebærplukkede eksempler fra mange forsøk.

De valgte sitatene "ser ut til å være fra år gamle artikler som har spredt seg på flere tredjeparts nettsteder," sa en talsperson for selskapet. OpenAI har tidligere fjernet en ChatGPT-funksjon kalt Søk etter å ha oppdaget det utilsiktet reprodusert innhold, men seniorer tilbakeviser påstander om at dens generative AI har det samme problemet nå.

Når det gjelder bruk av NYTs innhold for systemtrening, argumenterer OpenAI for at praksisen faller inn under regler for rettferdig bruk som tillater gjenbruk av opphavsrettsbeskyttede verk. OpenAI tillater selskaper å blokkere sin webcrawler fra å skrape direkte blokkerer IP-adressen, men NYT føler at de allerede tok initiativet ved å introdusere sine generelle politiske endringer i fjor sommer.

Uttrykker en lignende holdning til UK House of Lords, hevdet ChatGPT-innehaveren at opphavsrettsbeskyttede verk må inkorporeres for å ‘representere hele mangfoldet av bredden av menneskelig intelligens og erfaring.’ Dette er neppe overraskende, gitt alternativet representerer døden til selve konseptet med generativ AI.

På den annen side kan du forstå hvorfor de viktigste institusjonene i publiseringsverdenen ikke er begeistret for forestillingen om nye, tvetydige teknologiske virksomheter som samler seg på inntektsstrømmene deres. Etikken til AI er fortsatt omstridt i beste fall, og de grønne skuddene av forskrifter holder ikke tritt med teknologiens ustanselige kommersielle vekst.

Det burde uten tvil ligge på generative AI-selskaper for å inngå allianser ved å gjøre det verdt tiden for innholdsskapere. Ellers vil juridisk replikk som dette alltid være en mulighet.

I dette tilfellet ser det imidlertid ikke ut til at det kommer et kompromiss fra noen av partene. Den primære interessekilden går nå til de potensielle konsekvensene av dette søksmålet, og hvor store de kan bli for fremtiden til generativ AI som en enhet.

tilgjengelighet