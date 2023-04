Das Social Media-Angebot Reddit ist eine der größten Diskussions-Plattformen im Web - und als solche auch als Datenquelle für das KI-Training interessant. Jetzt will der Betreiber dafür aber nicht mehr kostenlos herhalten und fordert Geld von Google und Co.

Risiko für Reddit

Zusammenfassung Reddit will für seine Datenquellen Geld von Unternehmen wie Google und Microsoft.

57 Millionen Nutzer nutzen Reddit täglich.

KI-Algorithmen benötigen Daten für das Training.

Reddit-Gründer Steve Huffman sieht den Wert der Plattform.

Reddit stattet API mit Bezahlschranke aus, um Investitionen zu schützen.

Reddit wird täglich von rund 57 Millionen Nutzern besucht. Diese verwenden die Plattform, um sich über so unterschiedliche Themen wie Make-up, Videospiele und Tipps zum Reinigen von Einfahrten auszutauschen. In den letzten Jahren waren die zahlreichen Threads auch ein kostenloses Lehrmittel für die KI-Algorithmen von Unternehmen wie Google, OpenAI und Microsoft.Diese benötigen dringend solche Datenquellen, denn nur durch die massenhafte statistische Auswertung von Trainingsdaten können KI-Systeme echt klingende Sprachmodelle entwickeln und den Nutzern auch noch inhaltlich korrekte Aussagen präsentieren. Angesichts der inzwischen erreichten Qualität der künstlichen Bots und den Absichten ihrer Betreiber, deren Fähigkeiten endlich auch ordentlich zu kommerzialisieren, fragt man sich bei Reddit natürlich, warum man dafür kostenlos die Trainingsdaten bereitstellt.Das Unternehmen kündigte jetzt an, das API, mit dem man Daten von der Plattform beziehen kann, mit einer Bezahlschranke auszustatten. "Der Datenkorpus Reddits ist wirklich wertvoll", sagte Steve Huffman, Gründer und Geschäftsführer von Reddit, in einem Interview mit der New York Times . "Und wir müssen diesen Wert nicht kostenlos an einige der größten Unternehmen der Welt weitergeben."Dabei geht es nicht nur um den Gegenwert für die Ressourcen, die Reddit investiert hat, um seine Community aufzubauen und zu pflegen. Es geht auch um die Risiken, die für solch eine Plattform von Unternehmen ausgehen, die auf einer neuen technischen Grundlage groß werden. Diese neuen KI-Systeme könnten immerhin eines Tages verwendet werden, Konkurrenten zu schaffen - automatisierte Duplikate der Reddit-Unterhaltungen.