Vorsicht! Neue KI-Suchmaschinen machen massenhaft Fehler

Die großen KI-Anbieter versuchen sich inzwischen auch als Alternative zu klassischen Suchmaschinen - sprich Google - zu positionieren. Eine Untersuchung zeigte nun allerdings, dass die neuen Systeme dabei eine enorme Fehlerquote produzieren.

Christian Kahle, 14.03.2025 08:15 Uhr

Microsoft, Windows 10, Fehler, Hack, Bug, Computer, Schadsoftware, Fehlerbehebung, Bugs, Absturz, Crash, Error, Fehlermeldung, Bluescreen, Update Fehler, Windows 10 bugs, Windows 10 Bug, Fehlercode, Neon, Windows 10 Fehler, Softwarefehler, Achtung, Bluescreens, Attantion, Windows 10 Bluescreen, Dead, Hardwarefehler, Computertot, Programmabsturz

Lieber falsch als gar nicht antworten

Am Tow Center for Digital Journalism wurde ein entsprechender Test durchgeführt, der vor allem erhebliche Genauigkeitsprobleme bei der KI-gestützten Nachrichtensuche zeigte. Acht getestete KI-Modelle beantworteten beispielsweise über 60 Prozent der Anfragen zu Nachrichtenquellen fehlerhaft.

Laut den Forscherinnen Klaudia Jawiska und Aisvarya Chandrasekar nutzt inzwischen etwa ein Viertel der Nutzer in den USA KI-Modelle als Alternative zu herkömmlichen Suchmaschinen. Angesichts der Testergebnisse kann dies zu einem echten Problem werden. Auch Fehlerraten variierten dabei stark: Während Perplexity in 37 Prozent der Fälle falsche Informationen lieferte, lag die Fehlerquote bei ChatGPT Search bei 67 Prozent. Besonders schlecht schnitt Grok 3 ab, das fast immer (94 Prozent) inkorrekte Antworten gab. KI-Suchmaschinen-Studie

Ergebnisse des Tests Für die Tests sollten die KI-Modelle Titel, Verlag, Veröffentlichungsdatum und URL realer Nachrichtenartikel korrekt identifizieren. Insgesamt führten die Forscher 1600 Anfragen über acht Systeme durch. Ein besorgniserregender Trend zeigte sich dabei: Anstatt keine Antwort zu geben, präsentierten die KI-Modelle lieber plausible, aber falsche oder spekulative Antworten - man bekam es also mit den bekannten Halluzinationen zu tun.

Gratis-Versionen besser

Auffällig war zudem, dass kostenpflichtige Versionen mancher KI-Suchtools teilweise schlechter abschnitten als die kostenlosen Varianten. So gaben Perplexity Pro (20 Dollar monatlich) und die Premium-Version von Grok 3 (40 Dollar monatlich) häufiger fehlerhafte Ergebnisse aus, da sie seltener auf eine Antwort verzichteten.

Die Studie zeigt zudem, dass das Robot Exclusion Protocol von einigen KI-Tools ignoriert wird, mit dem Verlage unerwünschte Webcrawler aussperren. So identifizierte Perplexity korrekt zehn Auszüge aus Paywall-geschützten National-Geographic-Artikeln, obwohl der Verlag der KI den Zugriff untersagt hatte. Zusätzlich verweisen die KI-Modelle oft auf syndizierte Versionen von Artikeln statt auf Originalquellen. Besonders problematisch war die hohe Zahl fehlerhafter URLs: Mehr als die Hälfte der getesteten Links von Googles Gemini und Grok 3 führte zu nicht existierenden Seiten.

Zusammenfassung

KI-Suchmaschinen weisen laut Studie hohe Fehlerquoten auf
Über 60 Prozent falsche Antworten bei Nachrichtenquellen-Anfragen
Fehlerraten variieren stark zwischen verschiedenen KI-Modellen
KI-Systeme liefern oft plausible, aber falsche Informationen
Kostenpflichtige Versionen schneiden teilweise schlechter ab
Einige KI-Tools ignorieren das Robot Exclusion Protocol
Hohe Zahl fehlerhafter URLs bei manchen KI-Suchmaschinen

Siehe auch:

Thema:

Künstliche Intelligenz

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren3

Hinweis einsenden

Weitere Nachrichten zum Thema Nachgewiesen: Suchmaschinen beeinflussen extrem unsere MeinungGoogle kontert ChatGPT: KI-Suchmaschine jetzt experimentell verfügbarChatGPT-Suche nun ohne Login: OpenAI öffnet KI-Tool für alleWindows 11 Insider-Update: Microsoft stellt neue KI-Suche bereit