KIs "ohne Hemmungen":
Cloudflare blockiert Scraping nun per Standard

Cloudflare blockiert ab sofort KI-Crawler standardmäßig und führt ein "Pay Per Crawl"-Modell ein. Die Maßnahme gibt Website-Betreibern mehr Kontrolle über ihre Inhalte und ermöglicht es ihnen, von KI-Unternehmen Geld zu verlangen.
CloudFlare, Cloudflare Inc

Macht zurück an die Content-Ersteller

Cloudflare hat am 1. Juli 2025 eine grundlegende Änderung seiner Richtlinien angekündigt: Das Content Delivery Network (CDN) blockiert ab sofort standardmäßig KI-Crawler, die ohne Erlaubnis oder Vergütung auf Inhalte zugreifen wollen. Jede neue Website, die sich bei Cloudflare anmeldet, wird nun gefragt, ob sie KI-Crawlern den Zugriff erlauben möchte. Diese Änderung betrifft potenziell einen erheblichen Teil des Internets, da laut Cloudflare etwa 16 bis 20 Prozent des globalen Internetverkehrs über dieses CDN läuft.

KI-Crawler haben Inhalte ohne Grenzen abgeschöpft. Unser Ziel ist es, die Macht zurück in die Hände der Ersteller zu legen und gleichzeitig KI-Unternehmen bei Innovationen zu unterstützen.
Matthew Prince, Mitbegründer und CEO von Cloudflare
Wie Wired berichtet, hat Cloudflare bereits im vergangenen Jahr Tools eingeführt, die es seinen Kunden ermöglichten, KI-Crawler zu blockieren. Mehr als eine Million Kunden haben diese Funktion seitdem aktiviert. Mit der jetzigen Umstellung geht das Unternehmen noch einen Schritt weiter, indem es die Blockierung zur Standardeinstellung macht.

Bezahlmodell für KI-Crawler

Neben der standardmäßigen Blockierung führt Cloudflare auch ein neues "Pay Per Crawl"-Modell ein. Dieses ermöglicht es Website-Betreibern, KI-Unternehmen für den Zugriff auf ihre Inhalte zur Kasse zu bitten. Publisher können einen Preis pro Anfrage festlegen und entscheiden, ob sie einen bestimmten Bot zulassen, blockieren oder bezahlen lassen wollen. Infografik: Wie sich KI in der deutschen Wirtschaft entwickeltWie sich KI in der deutschen Wirtschaft entwickelt Das neue System wird derzeit als "Experiment" in einer privaten Beta-Phase getestet. Website-Besitzer können KI-Crawler individuell zu einem festgelegten Tarif ihre Seite durchsuchen lassen - eine Mikrozahlung für jedes einzelne "Crawling". Alternativ können sie den KI-Crawlern auch kostenfreien Zugriff gewähren oder sie komplett blockieren.

Reaktionen der Branche

Die Initiative von Cloudflare hat bereits Unterstützung von zahlreichen Verlagen und Medienunternehmen erhalten, darunter Condé Nast, The Atlantic und Associated Press. OpenAI hingegen lehnte eine Teilnahme ab, als Cloudflare seinen Plan vorstellte, KI-Crawler standardmäßig zu blockieren. Das von Microsoft unterstützte Unternehmen betonte seine Rolle als Pionier bei der Nutzung von robots.txt, einem Code, der das automatisierte Scraping von Webdaten verhindert, und betonte, dass seine Crawler die Präferenzen der Publisher respektieren.

Die robots.txt-Datei, die bereits 1994 eingeführt wurde, war ursprünglich als Gentlemens Agreement gedacht. Website-Betreiber konnten damit Suchmaschinen-Crawlern mitteilen, welche Bereiche ihrer Website nicht indexiert werden sollten. Allerdings ist diese Datei rechtlich nicht bindend und kann von Crawlern ignoriert werden.

Ob sich das neue Modell durchsetzen wird, hängt jedoch davon ab, ob die großen KI-Unternehmen bereit sind, für den Zugriff auf Inhalte zu bezahlen oder alternative Wege finden, um an Trainingsdaten zu gelangen. Kritiker befürchten, dass eine zu restriktive Handhabung die Innovation im KI-Bereich bremsen könnte, während Befürworter argumentieren, dass Content-Ersteller endlich fair für ihre Arbeit entlohnt werden sollten.

Was haltet ihr von Cloudflares Schritt? Sollten KI-Unternehmen für das Crawlen von Inhalten bezahlen müssen, oder seht ihr darin eine Gefahr für die offene Natur des Internets? Teilt eure Meinung in den Kommentaren mit!

Was genau blockiert Cloudflare jetzt?
Cloudflare blockiert ab sofort standardmäßig sogenannte AI-Crawler - automatisierte Bots, die Inhalte von Webseiten für das Training von KI-Modellen sammeln. Diese Blockade tritt automatisch für alle neuen Domains in Kraft, die Cloudflare nutzen.

Website-Betreiber können dabei selbst entscheiden, ob sie einzelnen Crawlern Zugriff gewähren. Ziel ist es, die Kontrolle zurück in die Hände der Content-Ersteller zu legen und unautorisiertes Scraping zu verhindern.
Wie funktioniert das Pay-per-Crawl-Modell?
Mit dem neuen "Pay-per-Crawl"-Modell können Website-Betreiber künftig Gebühren verlangen, wenn AI-Crawler auf ihre Inhalte zugreifen wollen. Das Modell befindet sich derzeit in einer privaten Beta-Phase.

AI-Firmen müssen dabei angeben, ob sie Inhalte für Training, Suche oder Forschung nutzen. Dies soll Transparenz schaffen und eine faire Vergütung für Content-Ersteller ermöglichen. Erste Partner wie ProRata haben bereits zugesagt.
Warum ist diese Maßnahme wichtig?
AI-Crawler haben bisher massenhaft Inhalte gesammelt, ohne Erlaubnis oder Bezahlung. Das führte zu sinkendem Traffic auf Originalseiten - und damit zu Einnahmeverlusten bei Publishern, besonders durch entgangene Werbeeinnahmen.

Cloudflare will mit dem Blockieren und Bezahlen ein neues Gleichgewicht schaffen und so die wirtschaftliche Basis für hochwertigen Content im Netz sichern.
Welche Auswirkungen hat das auf KI-Modelle?
Kurzfristig könnte die Maßnahme die Datenbasis für das Training neuer KI-Modelle einschränken. Besonders kleinere oder neue Anbieter könnten Probleme bekommen, an hochwertige Inhalte zu gelangen.

Langfristig könnte sich dadurch ein Markt für lizenzierte Trainingsdaten etablieren. KI-Firmen müssten dann vermehrt auf legale Quellen setzen - was auch die Qualität und Transparenz verbessern kann.
Wie erkennt Cloudflare KI-Crawler?
Cloudflare nutzt eine Kombination aus Verhaltensanalyse, Fingerprinting und Machine Learning, um KI-Crawler zu identifizieren - auch solche, die sich nicht offen zu erkennen geben ("Shadow Scraper").

Damit geht Cloudflare über klassische Methoden wie die robots.txt-Datei hinaus, die oft ignoriert wird. Laut einer Analyse wurden allein im März 2025 über 26 Millionen Scrapes registriert, die robots.txt missachteten.
Können Website-Betreiber das Blockieren abschalten?
Ja, Cloudflare stellt die Blockade zwar standardmäßig ein, aber Betreiber können sie jederzeit deaktivieren. Die Option ist in den Einstellungen der Plattform leicht zugänglich.

Damit bleibt die Entscheidung vollständig beim Website-Betreiber. Wer Inhalte bewusst für KI-Anwendungen freigeben will - etwa für mehr Sichtbarkeit oder Vergütung - kann dies weiterhin tun.
Zusammenfassung
  • Cloudflare blockiert KI-Crawler nun standardmäßig für neue Websites
  • 16-20 Prozent des globalen Internetverkehrs läuft über Cloudflare
  • Neues Pay-Per-Crawl-Modell ermöglicht Vergütung für Content-Ersteller
  • Website-Betreiber können Zugriff erlauben, blockieren oder bezahlen lassen
  • Über eine Million Kunden nutzen bereits die Blockierungsfunktion
  • Große Verlage wie Condé Nast und Associated Press unterstützen die Initiative
  • OpenAI lehnte Teilnahme ab und betont Respekt für Publisher-Präferenzen

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!