MENÜ MENÜ

Reddit überträgt seine Benutzerdaten, um ein unbenanntes KI-Modell zu trainieren

Da Benutzerdaten zu einem immer gefragteren Gut werden, plant ein namentlich nicht genanntes KI-Unternehmen Berichten zufolge einen 60-Millionen-Dollar-Schub, um Reddit für KI-Schulungszwecke abzuwerben. Sollten wir uns Sorgen machen?

Jahrzehntelanges Reddit-Geschwafel könnte zum Treibstoff für die nächste Generation von KI-Modellen werden.

Berichten zufolge hat die selbsternannte „Titelseite des Internets“ eine ausgehandelt Inhaltslizenzvertrag mit einem namentlich nicht genannten KI-Unternehmen. Für den stolzen Preis von 60 Millionen US-Dollar hat dieses Unternehmen nun theoretisch das Recht, sein KI-Modell mit allem zu trainieren, was auf Reddit gepostet wird.

Millionen unaufhörlicher Posts von den beliebtesten Subreddits, den Lurkern und dem Rest fragwürdiger Themen werden für diesen unbekannten „Big Player“ des Silicon Valley zu einer fortlaufenden jährlichen Ware.

Dieser überraschende Deal kommt Monate nach Reddit bedroht die Suchcrawler von Google und Bing abzuschneiden, wenn kein offizieller Deal zum Handel mit seinen Daten erzielt werden konnte. Eine Quelle sagte dem Die Washington Post zu der Zeit, dass die Plattform ohne Suche „überleben“ kann. Vielleicht war dieser aktuelle KI-Deal damals schon in Planung?

Obwohl der Jahresumsatz von Reddit im Jahr 20 um 2023 % gestiegen ist, war er ungefähr gleich hoch 200 Millionen Dollar schüchtern seines zwei Jahre zuvor gesetzten Ziels von 1 Milliarde US-Dollar. Der bevorstehende KI-Pakt, gepaart mit einer Öffnung für öffentliche Investition Im nächsten Monat dürften die Bereitschaftszahlen von Reddit jedoch deutlich über dieser Zahl liegen.

Nach einer turbulente Jahre, ist dieser Datenkompromiss für Reddit finanziell gesehen absolut sinnvoll. Was dies jedoch genau für die Verbraucher bedeutet, und die immer unklare Ethik der KI bleiben umstritten.

Es ist eines der am schlechtesten gehüteten Geheimnisse, dass unsere Benutzerdaten in der modernen Welt alles andere als privat sind. Denken Sie daran, dass es neu ist Watchdog-Studie in Meta, das zeigte, dass 48,000 Unternehmen die Plattformdaten ohne Zustimmung an einen einzelnen Benutzer gesendet hatten?

Bis vor Kurzem nutzten die meisten KI-Unternehmen das offene Web, um ihre Modelle zu trainieren, ohne dass dafür verifiziertes grünes Licht gegeben wurde, doch eine Kombination aufsehenerregender Fälle im Jahr 2023 schien die Landschaft zu verändern.

OpenAIs Streit mit dem New York Times und Apples Verhandlungen Für große Nachrichtenpartner wurde darauf hingewiesen, dass KI-Unternehmen damit beginnen, einen starken rechtlichen Rahmen für das Daten-Scraping im Einklang mit den Urheberrechtsgesetzen in anderen Sektoren zu schaffen.

In ähnlicher Weise zeigt der Deal mit Reddit, dass Host-Unternehmen beginnen, eine Entschädigung für Daten zu verlangen, aber der entscheidende Unterschied besteht darin, dass es so ist 812 Millionen monatliche Benutzer haben nicht ausdrücklich ihre Zustimmung gegeben, Teil der KI-Maschine zu werden.

Unabhängig davon, ob die Nutzungsbedingungen von Reddit in Zukunft aktualisiert werden, um Transparenz darüber zu gewährleisten, wohin unsere Daten gehen, wissen wir, dass alle digitalen Informationen vor diesem Deal ebenfalls Freiwild sind. Laienhaft ausgedrückt: Sie können nicht nachträglich um Erlaubnis bitten, oder?

Vielleicht ist dies der Hauptunterschied zwischen dem Scraping von Nachrichtenagenturen und Social-Media-Plattformen für KI-Lernen. Letzteres besteht fast ausschließlich aus benutzergenerierten Inhalten; Deren Verwendung scheint völlig im Ermessen des jeweiligen Managements zu liegen.

Anstatt AGI-Plattformen (Artificial General Intelligence) mit ausgeprägter menschlicher Qualität zu schaffen, wird diese Art von Geschäft in den kommenden Jahren wahrscheinlich häufiger vorkommen.

Das mag zwar positiv klingen, aber denken Sie nur an die endlosen Scharen an Fehlinformationen und Unsinn, denen diese unbekannte Lernmaschine ausgesetzt sein wird, wenn alles nach Plan läuft.

Es ist Reddit, Pete. Diese KI-Schutzmaßnahmen müssen auf jeden Fall verstärkt werden.

Zugänglichkeit