Die Nachrichtenagentur Reuters berichtet, dass Reddit mit einem Unternehmen einen Lizenz-Vertrag in Höhe von jährlich 60 Millionen Dollar abgeschlossen hat, um diesem beim KI-Training zu helfen – mit den Beiträgen der Nutzer.
Mit über 50 Millionen täglich aktiven Nutzern und mehr als 100.000 aktiven Communities bietet Reddit eine Fundgrube für das Training von KI-Systemen.
Für Reddit bietet dies eine potenzielle neue Einnahmequelle neben der Werbung.
Ich frag mich, ob Reddit ein guter Trainingsort für eine KI sind. Stell dir vor, du würdest eine neue Sprache lernen - und das nur indem du Reddit Kommentare liest. Klingt für mich nach keiner guten Datenbasis.
Hey ChatGPT write a small letter to my german aunt in which I tell her …
ChatGPT: SPRICH DEUTSCH DU HURENSOHN
This
Ich meine mich daran zu erinnern dass frühere GPT Iterationen Reddit nutzten um Artikel vorzufiltern. Alle verlinkten Artikel mit einer bestimmten Anzahl Likes (ich glaube 3?) wurden gescraped und ins Modell verramscht. Ich weiß gar nicht, ob Kommentare überhaupt genutzt wurden.
Dann ist also Reddit nur als Linksammung relevant, um die externen Inhalte zu scrapen? Das würde ja wieder nichts am Urheberrecht ändern.