Anthropic zerstörte massenhaft Bücher für das Training seiner KI

Die KI-Firma Anthropic hat laut aktuellen Gerichtsdokumenten riesige Mengen echter Bücher zerstört, um ihre Sprachmodelle zu trainieren. Dies geht aus Gerichtsunterlagen zu einem Verfahren hervor, in dem um die Fair-Use-Regeln gestritten wird.

Christian Kahle, 26.06.2025 15:56 Uhr

Piraterie, Bücher, Bibliothek, düstere Atmosphäre, Sci-Hub, LibGen, Schattenbibliothek, Totenkopf-Bücher, Piratenliteratur, verbotene Bücher, gefährliches Wissen, Gothic-Bibliothek, Schädel und Knochen, dunkle Literatur, mysteriöse Buchrücken, Horrorliteratur, okkulte Bücher, Vintage-Buchdesign, geheime Sammlung, antike Folianten, Bücherregal-Kunst

WinFuture/KI-generiert

Destruktives Scannen

Im Februar 2024 engagierte Anthropic demnach den früheren Leiter der Google-Books-Partnerschaften, Tom Turvey, mit dem Auftrag, möglichst "alle Bücher der Welt" zu beschaffen. Damit wollte man offenbar die erfolgreiche, aber umstrittene Strategie Googles beim Buch-Scanning wiederholen - ein Projekt, das entscheidende Präzedenzfälle im US-Urheberrecht schuf.

Die Bücher wurden angeschafft, aus ihren Einbänden entfernt, gescannt und anschließend vernichtet, berichtet Ars Technica. Zwar ist das sogenannte "destruktive Scannen" - bei dem Bücher für die Digitalisierung irreversibel beschädigt werden - in kleinen Forschungsprojekten nicht unüblich, doch Anthropics Vorgehen war aufgrund seines gewaltigen Umfangs außergewöhnlich. Der Fokus lag klar auf Effizienz und Kostenersparnis - der Erhalt der Originalbücher spielte keine Rolle.

Richter William Alsup bestätigte in seinem Urteil, dass das Vorgehen von Anthropic unter bestimmten Bedingungen als "Fair Use" einzustufen sei: Die Bücher wurden legal erworben, nach dem Scannen vernichtet und die digitalen Kopien nicht weiterverbreitet, sondern nur für das Training der KI-Modelle verwendet. Der Richter bezeichnete das Verfahren als "transformativen Akt", vergleichbar mit der digitalen Archivierung zur Platzersparnis.

Start mit E-Books

Allerdings bemängelte das Gericht auch, dass Anthropic zu Beginn nicht ausschließlich legale Wege ging. Stattdessen nutzte das Unternehmen zunächst E-Books, die man nicht auf offiziellem Weg beschaffte, um den aufwendigen und teuren Lizenzverhandlungen mit Verlagen zu entgehen. Erst später, aus rechtlichen Gründen, habe man auf den Erwerb und die Zerstörung physischer Bücher umgestellt.

Der Fall verdeutlicht den wachsenden Druck in der KI-Branche, an qualitativ hochwertige Texte zu gelangen. Denn die Leistungsfähigkeit großer Sprachmodelle hängt maßgeblich von der Qualität ihrer Trainingsdaten ab. In der Jagd nach diesen Daten überschreiten manche Unternehmen rechtliche und ethische Grenzen - und hoffen darauf, dass Gerichte ihnen im Nachhinein recht geben.

Zusammenfassung

Anthropic zerstörte zahlreiche physische Bücher zum KI-Training
Plan zur Beschaffung 'aller Bücher der Welt' mit Googles Ex-Manager
Destruktives Scannen: Bücher wurden entbunden, digitalisiert und vernichtet
Gericht stufte Vorgehen als 'Fair Use' ein, da Bücher legal erworben wurden
Anthropic nutzte zunächst nicht lizenzierte E-Books, später physische Exemplare
Der Fall zeigt die ethische Problematik der Datenbeschaffung in der KI-Branche

Siehe auch:

Thema:

Anthropic Claude AI

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren29

Hinweis einsenden

Weitere Nachrichten zum Thema KI-Streit eskaliert: US-Regierung droht Anthropic mit EnteignungKI sollte Verkaufsautomaten im Büro betreiben und fast alles ging schiefAnthropic geht auf Konfrontationskurs mit der US-RegierungKI & Accenture können's besser: Intel wirft sein Marketing-Team rausApple vs Samsung: Wer sichert sich mit Perplexity die KI-Zukunft?Papst Leo XIV. erklärt KI zur größten Bedrohung der Menschheit