Anthropic zerstörte massenhaft Bücher für das Training seiner KI

Die KI-Firma Anthropic hat laut aktuellen Gerichtsdokumenten rie­sige Mengen echter Bücher zerstört, um ihre Sprachmodelle zu trainieren. Dies geht aus Gerichtsunterlagen zu einem Verfahren hervor, in dem um die Fair-Use-Regeln gestritten wird.
Piraterie, Bücher, Bibliothek, düstere Atmosphäre, Sci-Hub, LibGen, Schattenbibliothek, Totenkopf-Bücher, Piratenliteratur, verbotene Bücher, gefährliches Wissen, Gothic-Bibliothek, Schädel und Knochen, dunkle Literatur, mysteriöse Buchrücken, Horrorliteratur, okkulte Bücher, Vintage-Buchdesign, geheime Sammlung, antike Folianten, Bücherregal-Kunst
WinFuture/KI-generiert

Destruktives Scannen

Im Februar 2024 engagierte Anthropic demnach den früheren Leiter der Google-Books-Partnerschaften, Tom Turvey, mit dem Auftrag, möglichst "alle Bücher der Welt" zu beschaffen. Damit wollte man offenbar die erfolgreiche, aber umstrittene Strategie Googles beim Buch-Scanning wiederholen - ein Projekt, das entscheidende Präzedenzfälle im US-Urheberrecht schuf.

Die Bücher wurden angeschafft, aus ihren Einbänden entfernt, gescannt und anschließend vernichtet, berichtet Ars Technica. Zwar ist das sogenannte "destruktive Scannen" - bei dem Bücher für die Digitalisierung irreversibel beschädigt werden - in kleinen Forschungsprojekten nicht unüblich, doch Anthropics Vorgehen war aufgrund seines gewaltigen Umfangs außergewöhnlich. Der Fokus lag klar auf Effizienz und Kostenersparnis - der Erhalt der Originalbücher spielte keine Rolle.


Richter William Alsup bestätigte in seinem Urteil, dass das Vorgehen von Anthropic unter bestimmten Bedingungen als "Fair Use" einzustufen sei: Die Bücher wurden legal erworben, nach dem Scannen vernichtet und die digitalen Kopien nicht weiterverbreitet, sondern nur für das Training der KI-Modelle verwendet. Der Richter bezeichnete das Verfahren als "transformativen Akt", vergleichbar mit der digitalen Archivierung zur Platzersparnis.

Start mit E-Books

Allerdings bemängelte das Gericht auch, dass Anthropic zu Beginn nicht ausschließlich legale Wege ging. Stattdessen nutzte das Unternehmen zunächst E-Books, die man nicht auf offiziellem Weg beschaffte, um den aufwendigen und teuren Lizenzverhandlungen mit Verlagen zu entgehen. Erst später, aus rechtlichen Gründen, habe man auf den Erwerb und die Zerstörung physischer Bücher umgestellt.

Der Fall verdeutlicht den wachsenden Druck in der KI-Branche, an qualitativ hochwertige Texte zu gelangen. Denn die Leistungsfähigkeit großer Sprachmodelle hängt maßgeblich von der Qualität ihrer Trainingsdaten ab. In der Jagd nach diesen Daten überschreiten manche Unternehmen rechtliche und ethische Grenzen - und hoffen darauf, dass Gerichte ihnen im Nachhinein recht geben.

Zusammenfassung
  • Anthropic zerstörte zahlreiche physische Bücher zum KI-Training
  • Plan zur Beschaffung 'aller Bücher der Welt' mit Googles Ex-Manager
  • Destruktives Scannen: Bücher wurden entbunden, digitalisiert und vernichtet
  • Gericht stufte Vorgehen als 'Fair Use' ein, da Bücher legal erworben wurden
  • Anthropic nutzte zunächst nicht lizenzierte E-Books, später physische Exemplare
  • Der Fall zeigt die ethische Problematik der Datenbeschaffung in der KI-Branche

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!