KIs "ohne Hemmungen":
Cloudflare blockiert Scraping nun per Standard

Cloudflare blockiert ab sofort KI-Crawler standardmäßig und führt ein "Pay Per Crawl"-Modell ein. Die Maßnahme gibt Website-Betreibern mehr Kontrolle über ihre Inhalte und ermöglicht es ihnen, von KI-Unternehmen Geld zu verlangen.

Witold Pryjda, 02.07.2025 12:16 Uhr

Macht zurück an die Content-Ersteller

Cloudflare hat am 1. Juli 2025 eine grundlegende Änderung seiner Richtlinien angekündigt: Das Content Delivery Network (CDN) blockiert ab sofort standardmäßig KI-Crawler, die ohne Erlaubnis oder Vergütung auf Inhalte zugreifen wollen. Jede neue Website, die sich bei Cloudflare anmeldet, wird nun gefragt, ob sie KI-Crawlern den Zugriff erlauben möchte. Diese Änderung betrifft potenziell einen erheblichen Teil des Internets, da laut Cloudflare etwa 16 bis 20 Prozent des globalen Internetverkehrs über dieses CDN läuft.

KI-Crawler haben Inhalte ohne Grenzen abgeschöpft. Unser Ziel ist es, die Macht zurück in die Hände der Ersteller zu legen und gleichzeitig KI-Unternehmen bei Innovationen zu unterstützen.
Matthew Prince, Mitbegründer und CEO von Cloudflare

Wie Wired berichtet, hat Cloudflare bereits im vergangenen Jahr Tools eingeführt, die es seinen Kunden ermöglichten, KI-Crawler zu blockieren. Mehr als eine Million Kunden haben diese Funktion seitdem aktiviert. Mit der jetzigen Umstellung geht das Unternehmen noch einen Schritt weiter, indem es die Blockierung zur Standardeinstellung macht.

Bezahlmodell für KI-Crawler

Neben der standardmäßigen Blockierung führt Cloudflare auch ein neues "Pay Per Crawl"-Modell ein. Dieses ermöglicht es Website-Betreibern, KI-Unternehmen für den Zugriff auf ihre Inhalte zur Kasse zu bitten. Publisher können einen Preis pro Anfrage festlegen und entscheiden, ob sie einen bestimmten Bot zulassen, blockieren oder bezahlen lassen wollen. Infografik: Wie sich KI in der deutschen Wirtschaft entwickelt

Wie sich KI in der deutschen Wirtschaft entwickelt

Das neue System wird derzeit als "Experiment" in einer privaten Beta-Phase getestet. Website-Besitzer können KI-Crawler individuell zu einem festgelegten Tarif ihre Seite durchsuchen lassen - eine Mikrozahlung für jedes einzelne "Crawling". Alternativ können sie den KI-Crawlern auch kostenfreien Zugriff gewähren oder sie komplett blockieren.

Reaktionen der Branche

Die Initiative von Cloudflare hat bereits Unterstützung von zahlreichen Verlagen und Medienunternehmen erhalten, darunter Condé Nast, The Atlantic und Associated Press. OpenAI hingegen lehnte eine Teilnahme ab, als Cloudflare seinen Plan vorstellte, KI-Crawler standardmäßig zu blockieren. Das von Microsoft unterstützte Unternehmen betonte seine Rolle als Pionier bei der Nutzung von robots.txt, einem Code, der das automatisierte Scraping von Webdaten verhindert, und betonte, dass seine Crawler die Präferenzen der Publisher respektieren.

Die robots.txt-Datei, die bereits 1994 eingeführt wurde, war ursprünglich als Gentlemens Agreement gedacht. Website-Betreiber konnten damit Suchmaschinen-Crawlern mitteilen, welche Bereiche ihrer Website nicht indexiert werden sollten. Allerdings ist diese Datei rechtlich nicht bindend und kann von Crawlern ignoriert werden.

Ob sich das neue Modell durchsetzen wird, hängt jedoch davon ab, ob die großen KI-Unternehmen bereit sind, für den Zugriff auf Inhalte zu bezahlen oder alternative Wege finden, um an Trainingsdaten zu gelangen. Kritiker befürchten, dass eine zu restriktive Handhabung die Innovation im KI-Bereich bremsen könnte, während Befürworter argumentieren, dass Content-Ersteller endlich fair für ihre Arbeit entlohnt werden sollten.

Was haltet ihr von Cloudflares Schritt? Sollten KI-Unternehmen für das Crawlen von Inhalten bezahlen müssen, oder seht ihr darin eine Gefahr für die offene Natur des Internets? Teilt eure Meinung in den Kommentaren mit!

Was genau blockiert Cloudflare jetzt?

Cloudflare blockiert ab sofort standardmäßig sogenannte AI-Crawler - automatisierte Bots, die Inhalte von Webseiten für das Training von KI-Modellen sammeln. Diese Blockade tritt automatisch für alle neuen Domains in Kraft, die Cloudflare nutzen.

Website-Betreiber können dabei selbst entscheiden, ob sie einzelnen Crawlern Zugriff gewähren. Ziel ist es, die Kontrolle zurück in die Hände der Content-Ersteller zu legen und unautorisiertes Scraping zu verhindern.

Wie funktioniert das Pay-per-Crawl-Modell?

Mit dem neuen "Pay-per-Crawl"-Modell können Website-Betreiber künftig Gebühren verlangen, wenn AI-Crawler auf ihre Inhalte zugreifen wollen. Das Modell befindet sich derzeit in einer privaten Beta-Phase.

AI-Firmen müssen dabei angeben, ob sie Inhalte für Training, Suche oder Forschung nutzen. Dies soll Transparenz schaffen und eine faire Vergütung für Content-Ersteller ermöglichen. Erste Partner wie ProRata haben bereits zugesagt.

Warum ist diese Maßnahme wichtig?

AI-Crawler haben bisher massenhaft Inhalte gesammelt, ohne Erlaubnis oder Bezahlung. Das führte zu sinkendem Traffic auf Originalseiten - und damit zu Einnahmeverlusten bei Publishern, besonders durch entgangene Werbeeinnahmen.

Cloudflare will mit dem Blockieren und Bezahlen ein neues Gleichgewicht schaffen und so die wirtschaftliche Basis für hochwertigen Content im Netz sichern.

Welche Auswirkungen hat das auf KI-Modelle?

Kurzfristig könnte die Maßnahme die Datenbasis für das Training neuer KI-Modelle einschränken. Besonders kleinere oder neue Anbieter könnten Probleme bekommen, an hochwertige Inhalte zu gelangen.

Langfristig könnte sich dadurch ein Markt für lizenzierte Trainingsdaten etablieren. KI-Firmen müssten dann vermehrt auf legale Quellen setzen - was auch die Qualität und Transparenz verbessern kann.

Wie erkennt Cloudflare KI-Crawler?

Cloudflare nutzt eine Kombination aus Verhaltensanalyse, Fingerprinting und Machine Learning, um KI-Crawler zu identifizieren - auch solche, die sich nicht offen zu erkennen geben ("Shadow Scraper").

Damit geht Cloudflare über klassische Methoden wie die robots.txt-Datei hinaus, die oft ignoriert wird. Laut einer Analyse wurden allein im März 2025 über 26 Millionen Scrapes registriert, die robots.txt missachteten.

Können Website-Betreiber das Blockieren abschalten?

Ja, Cloudflare stellt die Blockade zwar standardmäßig ein, aber Betreiber können sie jederzeit deaktivieren. Die Option ist in den Einstellungen der Plattform leicht zugänglich.

Damit bleibt die Entscheidung vollständig beim Website-Betreiber. Wer Inhalte bewusst für KI-Anwendungen freigeben will - etwa für mehr Sichtbarkeit oder Vergütung - kann dies weiterhin tun.

Zusammenfassung

Cloudflare blockiert KI-Crawler nun standardmäßig für neue Websites
16-20 Prozent des globalen Internetverkehrs läuft über Cloudflare
Neues Pay-Per-Crawl-Modell ermöglicht Vergütung für Content-Ersteller
Website-Betreiber können Zugriff erlauben, blockieren oder bezahlen lassen
Über eine Million Kunden nutzen bereits die Blockierungsfunktion
Große Verlage wie Condé Nast und Associated Press unterstützen die Initiative
OpenAI lehnte Teilnahme ab und betont Respekt für Publisher-Präferenzen

Siehe auch:

Thema:

Künstliche Intelligenz

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren13

Hinweis einsenden

Weitere Nachrichten zum Thema Cloudflare: Das war der Grund für den massiven Ausfall des InternetsCloudflare kämpft mit Problemen, reißt halbes Internet mit (Update)KI oder echt? Cloudflare integriert Verfolgungssystem für BilderCloudflare: Anzahl der DDoS-Angriffe stieg zuletzt massiv anGericht ordnet an: Cloudflare muss Piraten blocken und identifizierenHome-Router und Videorekorder: Cloudflare misst neuen DDoS-Rekord