"Aggressives" Scraping:
KI-Firma strapaziert Webseiten-Server massiv

Mehrere Webseiten wie iFixit berichten von Problemen durch massives Scraping. Bots des KI-Unternehmens Anthropic würden die Server an ihr Limit bringen, indem sie Millionen von Anfragen stellten, um Daten zu Trainingszwecken abzugreifen. Und das trotz eines Verbots.
Ki, Künstliche Intelligenz, Cpu, Forschung, Prozessor, Chip, Wissenschaft, AI, Artificial Intelligence, Stockfotos, Science, Wissenschaftler, Gehirn, scientist, Gehirnchip, Denken, Hirnforschung, Gehirnwellen, Hirnsteuerung, Künstliches Gehirn, Hirn, cyberkinetic, Gedanke, cyberkinetics

Aggressives Abgreifen von Daten durch KI-Firmen

Bevor künstliche Intelligenz 'intelligent' sein kann, muss das zugrundeliegende Modell trainiert werden. Das geschieht durch die Analyse riesiger Datenmengen. Dabei gilt im Allgemeinen: je mehr Daten erfasst werden, desto schlauer ist hinterher die KI. Daher versuchen Firmen, die entsprechende Produkte herstellen, ihre Modelle mit so vielen Daten wie möglich zu füttern.

Wie rücksichtslos einige Firmen dabei vorgehen, mussten jetzt auch mehrere Webseitenbetreiber erfahren, wie die Financial Times berichtet. Demnach führte massives Scraping, also das Abgreifen von Daten durch Bots, zu Serverproblemen.


Webseiten kämpfen gegen Scraping

So erzählt etwa Kyle Wiens, der CEO der Reparatur-Plattform iFixit, dass Crawler des KI-Unternehmens Anthropic seine Seite innerhalb von 24 Stunden eine Million Mal aufgerufen hätten, obwohl die Nutzungsbedingungen die Verwendung der Inhalte zum Trainieren von KI verbieten.

Wir haben eine ganze Reihe von Alarmen [bei hohem Traffic], die Leute werden um 3 Uhr morgens geweckt. Das hat jeden Alarm ausgelöst, den wir haben. Meine erste Botschaft an Anthropic lautet: Wenn ihr das zum Trainieren eures Modells verwendet, ist das illegal. Meine zweite Botschaft ist: Das ist kein höfliches Internetverhalten. Crawling ist eine Sache der Etikette.
Kyle Wiens, CEO iFixit
Letztlich sei er aber kein Moralapostel, sondern versuche lediglich eine Webseite am Laufen zu halten, so Wiens.

Auch Matt Berrie, der CEO von Freelancer.com, berichtet Ähnliches. Hier sei das Scraping durch Bots von Anthropic mit 3,5 Millionen Anfragen in vier Stunden "höchst aggressiv" und damit sogar noch deutlich intensiver als bei iFixit gewesen.

"Das ist ungeheuerliches Scraping, das die Website für jeden, der sie nutzt, langsamer macht und letztlich unsere Einnahmen beeinträchtigt", sagte Berrie. Zuletzt habe man die Notbremse gezogen und alle Anfragen von Anthropic-Domains rigoros blockiert.

Fragwürdige Mentalität bei KI-Firmen

Unternehmen wie Anthropic scheinen sich zunehmend rücksichtslos zu verhalten. Schon zuletzt hatte eine Aussage von Mustafa Suleyman die Diskussion um die Nutzung von Inhalten aus dem Internet zu KI-Trainingszwecken angeheizt.

Microsofts KI-CEO vertrat in einem erst kürzlich geführten Interview die Meinung, dass alle frei im Netz verfügbaren Inhalte wie "Freeware" anzusehen sind. Jeder dürfe sie im Rahmen von "Fair Use" kopieren, rekreieren oder reproduzieren. Auch das Trainieren einer KI mit diesen Inhalten sei demnach erlaubt. Es bedürfe keiner expliziten Zustimmung der Rechteinhaber.

Gehen die KI-Firmen eurer Meinung nach zu rücksichtslos vor? Oder sollten Webseiten wie iFixit aufhören, sich über den zusätzlichen Traffic zu beschweren?

Zusammenfassung
  • KI-Modelle werden durch Analyse großer Datenmengen trainiert
  • Firmen füttern ihre KI-Modelle mit Daten aus dem Internet
  • Massives Scraping verursachte Serverprobleme bei Webseiten
  • iFixit-CEO berichtet von einer Million Abrufen durch Anthropic-Bots
  • Freelancer.com erlebte 3,5 Millionen Bot-Anfragen in vier Stunden
  • Scraping, obwohl Nutzungsbedingungen der Webseiten KI-Training verbieten
  • Microsofts KI-CEO sieht Internet-Inhalte als für jeden nutzbare "Freeware" an

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!