Reddit sperrt das Internet Archive, um die KI-Firmen auszusperren

Reddit blockiert ab sofort das Internet Archive und schränkt den Zugriff der Wayback Machine drastisch ein. Grund sind nach Angaben der Plattform KI-Unternehmen, die über das Archiv Reddits Datenschutz-Richtlinien umgehen und Nutzerdaten sammeln.
Reddit, Reddit Logo

Reddit sperrt Wayback Machine aus

Reddit blockiert die Wayback Machine vom Internet Archive nach eigenen Angaben, weil KI-Unternehmen über das Archiv Daten von der Plattform sammeln. Die drastischen Beschränkungen treten ab sofort schrittweise in Kraft und betreffen nahezu alle Reddit-Inhalte.

Die Wayback Machine kann künftig nur noch die Startseite von Reddit archivieren, nicht aber einzelne Posts, Kommentare oder Nutzerprofile. Damit verliert eines der wichtigsten digitalen Archive den Zugang zu einer der größten Diskussionsplattformen im Internet.


Laut Reddit-Sprecher Tim Rathschmidt verstoßen KI-Unternehmen gegen die Plattform-Richtlinien und sammeln mithilfe der Wayback Machine Daten über die Nutzer. Wie The Verge berichtet, begründet Reddit die Maßnahme mit dem Schutz der Nutzer: "Bis sie ihre Seite verteidigen und die Plattform-Richtlinien einhalten können (z.B. Respektierung der Privatsphäre der Nutzer bezüglich der Löschung entfernter Inhalte), beschränken wir ihren Zugang zu Reddit-Daten, um die Reddit-Nutzer zu schützen." Infografik YouTube, Facebook & X: Die größten Seiten mit User Generated ContentYouTube, Facebook & X: Die größten Seiten mit User Generated Content

Millionenschwere Datenverträge

Der "Schutz" der Nutzer ist freilich vorgeschoben: KI-Unternehmen sollen archivierte Reddit-Inhalte genutzt haben, um Reddits eigene Datenbeschränkungen und Lizenzvereinbarungen zu umgehen. Diese Praxis untergräbt also Reddits eigene lukrative Geschäftsstrategie mit Nutzerdaten. Reddit hat bereits Datenverträge mit Google und OpenAI abgeschlossen - der Google-Deal soll 60 Millionen Dollar wert sein.

Die Plattform erwartet in den nächsten drei Jahren über 200 Millionen Dollar aus solchen Lizenzgeschäften. Im Juni verklagte Reddit bereits Anthropic wegen angeblicher Datensammlung ohne Genehmigung. Die Plattform hat in den vergangenen Jahren systematisch den Zugang zu ihren Daten beschränkt und monetarisiert.

Bedrohung für Geschichtsschreibung

Forscher, Journalisten und Historiker, die auf die Wayback Machine angewiesen sind, verlieren den Zugang zu Reddit-Archiven. Vergangene Ereignisse und Community-Diskussionen könnten aus der zugänglichen Geschichte verschwinden. Besonders problematisch ist dies für die Dokumentation von gesellschaftlichen Bewegungen, politischen Diskussionen und kulturellen Phänomenen, die sich oft zuerst auf Reddit manifestieren.

Reddit signalisierte, dass der Zugang wiederhergestellt werden könnte, falls das Internet Archive bessere Schutzmaßnahmen gegen das Sammeln von Daten implementiert. Allerdings bleibt unklar, welche technischen Lösungen das gemeinnützige Archiv umsetzen könnte, um KI-Scraping zu verhindern, ohne seine Kernfunktion zu beeinträchtigen.

Was haltet ihr von Reddits Entscheidung, das Internet Archive zu blockieren? Teilt eure Gedanken zu diesem Konflikt zwischen Datenschutz und digitaler Archivierung in den Kommentaren!

Zusammenfassung
  • Reddit blockiert Wayback Machine und schränkt Zugriff drastisch ein
  • KI-Unternehmen sammeln laut Reddit Nutzerdaten über das Archiv
  • Künftig kann nur noch die Startseite von Reddit archiviert werden
  • Reddit monetarisiert Nutzerdaten durch Verträge mit Google und OpenAI
  • Forscher und Journalisten verlieren Zugang zu wichtigen Reddit-Archiven
  • Gesellschaftliche und kulturelle Dokumentation könnte aus der Geschichte verschwinden
  • Wiederherstellung möglich, falls Internet Archive bessere Schutzmaßnahmen bietet

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!