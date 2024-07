Mehrere Webseiten wie iFixit berichten von Problemen durch massives Scraping. Bots des KI-Unternehmens Anthropic würden die Server an ihr Limit bringen, indem sie Millionen von Anfragen stellten, um Daten zu Trainingszwecken abzugreifen. Und das trotz eines Verbots.

Aggressives Abgreifen von Daten durch KI-Firmen

Webseiten kämpfen gegen Scraping

Wir haben eine ganze Reihe von Alarmen [bei hohem Traffic], die Leute werden um 3 Uhr morgens geweckt. Das hat jeden Alarm ausgelöst, den wir haben. Meine erste Botschaft an Anthropic lautet: Wenn ihr das zum Trainieren eures Modells verwendet, ist das illegal. Meine zweite Botschaft ist: Das ist kein höfliches Internetverhalten. Crawling ist eine Sache der Etikette. Kyle Wiens, CEO iFixit

Fragwürdige Mentalität bei KI-Firmen

Zusammenfassung KI-Modelle werden durch Analyse großer Datenmengen trainiert

Firmen füttern ihre KI-Modelle mit Daten aus dem Internet

Massives Scraping verursachte Server-Probleme bei Webseiten

iFixit-CEO berichtet von 1 Million Abrufen durch Anthropic-Bots

Freelancer.com erlebte 3,5 Millionen Bot-Anfragen in vier Stunden

Scraping, obwohl Nutzungsbedingungen der Webseiten KI-Training mit Daten verbieten

Microsofts AI CEO sieht Internet-Inhalte als für jeden nutzbare "Freeware" an

Bevor künstliche Intelligenz 'intelligent' sein kann, muss das zugrundeliegende Modell zuerst trainiert werden. Das geschieht durch die Analyse riesiger Datenmengen. Dabei gilt im Allgemeinen: je mehr Daten erfasst werden, desto schlauer ist hinterher die KI. Daher versuchen Firmen, die entsprechende Produkte herstellen, ihre Modelle mit so vielen Daten wie möglich zu füttern.Wie rücksichtslos einige Firmen dabei vorgehen, mussten jetzt auch mehrere Webseitenbetreiber erfahren, wie die Financial Times berichtet. Demnach führte massives Scraping, also das Abgreifen von Daten durch Bots, zu Server-Problemen.So erzählt etwa Kyle Wiens, der CEO der Reparatur-Plattform iFixit, dass Crawler des KI-Unternehmens Anthropic seine Seite innerhalb von 24 Stunden 1 Million Mal aufgerufen hätten, obwohl die Nutzungsbedingungen die Verwendung der Inhalte zum Trainieren von KI verbieten.Letztlich sei er aber kein Moralapostel, sondern versuche lediglich eine Webseite am Laufen zu halten, so Wiens.Auch Matt Berrie, der CEO von Freelancer.com berichtet Ähnliches. Hier sei das Scraping durch Bots von Anthropic mit 3,5 Millionen Anfragen in vier Stunden "höchst aggressiv" und damit sogar noch deutlich intensiver als bei iFixit gewesen."Das ist ungeheuerliches Scraping, das die Website für jeden, der sie nutzt, langsamer macht und letztlich unsere Einnahmen beeinträchtigt", sagte Berrie. Zuletzt habe man die Notbremse gezogen und alle Anfragen von Anthropic-Domains rigoros blockiert.Unternehmen wie Anthropic scheinen sich zunehmend rücksichtslos zu verhalten. Schon zuletzt hatte eine Aussage von Mustafa Suleyman die Diskussion um die Nutzung von Inhalten aus dem Internet zu KI-Trainingszwecken angeheizt.Microsofts AI CEO vertrat in einem erst kürzlich geführten Interview die Meinung, dass alle frei im Netz verfügbaren Inhalte wie "Freeware" anzusehen sind . Jeder dürfe sie im Rahmen von "Fair Use" kopieren, rekreieren oder reproduzieren. Auch das Trainieren einer KI mit diesen Inhalten sei demnach erlaubt. Es bedürfe keiner expliziten Zustimmung der Rechteinhaber.