Anthropic zerstörte massenhaft Bücher für das Training seiner KI
Die KI-Firma Anthropic hat laut aktuellen Gerichtsdokumenten riesige Mengen echter Bücher zerstört, um ihre Sprachmodelle zu trainieren. Dies geht aus Gerichtsunterlagen zu einem Verfahren hervor, in dem um die Fair-Use-Regeln gestritten wird.
Die Bücher wurden angeschafft, aus ihren Einbänden entfernt, gescannt und anschließend vernichtet, berichtet Ars Technica. Zwar ist das sogenannte "destruktive Scannen" - bei dem Bücher für die Digitalisierung irreversibel beschädigt werden - in kleinen Forschungsprojekten nicht unüblich, doch Anthropics Vorgehen war aufgrund seines gewaltigen Umfangs außergewöhnlich. Der Fokus lag klar auf Effizienz und Kostenersparnis - der Erhalt der Originalbücher spielte keine Rolle.
Richter William Alsup bestätigte in seinem Urteil, dass das Vorgehen von Anthropic unter bestimmten Bedingungen als "Fair Use" einzustufen sei: Die Bücher wurden legal erworben, nach dem Scannen vernichtet und die digitalen Kopien nicht weiterverbreitet, sondern nur für das Training der KI-Modelle verwendet. Der Richter bezeichnete das Verfahren als "transformativen Akt", vergleichbar mit der digitalen Archivierung zur Platzersparnis.
Der Fall verdeutlicht den wachsenden Druck in der KI-Branche, an qualitativ hochwertige Texte zu gelangen. Denn die Leistungsfähigkeit großer Sprachmodelle hängt maßgeblich von der Qualität ihrer Trainingsdaten ab. In der Jagd nach diesen Daten überschreiten manche Unternehmen rechtliche und ethische Grenzen - und hoffen darauf, dass Gerichte ihnen im Nachhinein recht geben.
Siehe auch:
Destruktives Scannen
Im Februar 2024 engagierte Anthropic demnach den früheren Leiter der Google-Books-Partnerschaften, Tom Turvey, mit dem Auftrag, möglichst "alle Bücher der Welt" zu beschaffen. Damit wollte man offenbar die erfolgreiche, aber umstrittene Strategie Googles beim Buch-Scanning wiederholen - ein Projekt, das entscheidende Präzedenzfälle im US-Urheberrecht schuf.Die Bücher wurden angeschafft, aus ihren Einbänden entfernt, gescannt und anschließend vernichtet, berichtet Ars Technica. Zwar ist das sogenannte "destruktive Scannen" - bei dem Bücher für die Digitalisierung irreversibel beschädigt werden - in kleinen Forschungsprojekten nicht unüblich, doch Anthropics Vorgehen war aufgrund seines gewaltigen Umfangs außergewöhnlich. Der Fokus lag klar auf Effizienz und Kostenersparnis - der Erhalt der Originalbücher spielte keine Rolle.
Richter William Alsup bestätigte in seinem Urteil, dass das Vorgehen von Anthropic unter bestimmten Bedingungen als "Fair Use" einzustufen sei: Die Bücher wurden legal erworben, nach dem Scannen vernichtet und die digitalen Kopien nicht weiterverbreitet, sondern nur für das Training der KI-Modelle verwendet. Der Richter bezeichnete das Verfahren als "transformativen Akt", vergleichbar mit der digitalen Archivierung zur Platzersparnis.
Start mit E-Books
Allerdings bemängelte das Gericht auch, dass Anthropic zu Beginn nicht ausschließlich legale Wege ging. Stattdessen nutzte das Unternehmen zunächst E-Books, die man nicht auf offiziellem Weg beschaffte, um den aufwendigen und teuren Lizenzverhandlungen mit Verlagen zu entgehen. Erst später, aus rechtlichen Gründen, habe man auf den Erwerb und die Zerstörung physischer Bücher umgestellt.Der Fall verdeutlicht den wachsenden Druck in der KI-Branche, an qualitativ hochwertige Texte zu gelangen. Denn die Leistungsfähigkeit großer Sprachmodelle hängt maßgeblich von der Qualität ihrer Trainingsdaten ab. In der Jagd nach diesen Daten überschreiten manche Unternehmen rechtliche und ethische Grenzen - und hoffen darauf, dass Gerichte ihnen im Nachhinein recht geben.
Zusammenfassung
- Anthropic zerstörte zahlreiche physische Bücher zum KI-Training
- Plan zur Beschaffung 'aller Bücher der Welt' mit Googles Ex-Manager
- Destruktives Scannen: Bücher wurden entbunden, digitalisiert und vernichtet
- Gericht stufte Vorgehen als 'Fair Use' ein, da Bücher legal erworben wurden
- Anthropic nutzte zunächst nicht lizenzierte E-Books, später physische Exemplare
- Der Fall zeigt die ethische Problematik der Datenbeschaffung in der KI-Branche
Siehe auch:
Thema:
Videos zum Thema KI
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Super Bowl 2026: Claude verrät, wie man einen Sixpack bekommt
- Anthropic Claude macht sich über Werbung in ChatGPT lustig
- Super Bowl 2025: OpenAI heißt uns im KI-Zeitalter willkommen
- Bing mit ChatGPT: Microsoft stellt seinen "Kopilot fürs Netz" vor
Beliebte KI-Downloads
Interessante Links
Neue Nachrichten
- Nach Flugzeugabsturz: Spielebranche trauert um Ubisoft-Gründer
- Galaxy Watch 9 & Ultra 2: Leak enthüllt Design der neuen Smartwatches
- Neue Weekend-Deals sind da: Media Markt & Saturn senken die Preise
- Aktuelle Technik-Blitzangebote von Amazon im Überblick
- Ryzen-CPUs: AMD killt RAM-Verschlüsselung - und rudert jetzt zurück
- Windows 11 26H2: Microsoft veröffentlicht allererste Vorschau-Version
- Apple M6-Prozessoren: TSMC liefert erste 2nm-Chips für neue Macs
Videos
Beliebte Downloads
Beliebte Nachrichten
Christian Kahle
Redakteur bei WinFuture
Ich empfehle ...
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen