Apple-Team entlarvt KI-Illusion:
scheinbare Intelligenz nur Täuschung
Sind KI-Systeme wirklich intelligent oder nur geschickte Imitatoren? Eine neue Studie von Apple-Forschern stellt die Fähigkeit von Sprachmodellen zum logischen und mathematischen Denken infrage. Mit einem einfachen Trick lassen sich ChatGPT und Co. leicht verwirren.
Der Trick, der alle KI-Systeme ins Stolpern brachte: Die Forscher fügten irrelevante Informationen hinzu oder änderten nur die Zahlenwerte in einer Frage. Die zusätzlichen, nicht relevanten Daten führten dazu, dass die LLMs falsche oder sogar unsinnige Antworten auf Fragen gaben, die sie zuvor korrekt beantwortet hatten.
Ein besonders auffälliges Ergebnis war, dass das Hinzufügen eines einzigen, scheinbar relevanten Satzteils zu einer Frage die Leistung aller getesteten Modelle um bis zu 65% einbrechen ließ. Dies geschah, obwohl der zusätzliche Satzteil für die Lösung der Aufgabe nicht notwendig war.
Die Studie zeigte auch, dass die Leistung der KI-Systeme erheblich nachlässt, wenn die Anzahl der Satzteile in einer Frage zunimmt. Dies deutet darauf hin, dass kritische Stimmen mit ihren Annahmen bisher noch recht behalten: KI-Systeme verstehen die gestellten Fragen nicht wirklich, sondern antworten lediglich auf Basis gelernter Muster.
Die Forscher veröffentlichten ihre Ergebnisse auf dem Preprint-Server arXiv unter dem Titel "GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models". Sie interpretieren ihre Erkenntnisse als Beweis dafür, dass LLMs nicht zu echtem logischen und mathematischen Denken fähig sind.
Diese Studie wirft wichtige Fragen zur tatsächlichen Fähigkeit von KI-Systemen auf, nuancierte Informationen zu verarbeiten. Die Forscher schließen: Es scheint, dass die scheinbar intelligenten Antworten größtenteils eine Illusion sind. LLMs sind demnach hervorragend darin, Antworten zu geben, die korrekt erscheinen, aber bei genauerer Betrachtung falsch sind.
Die Erkenntnisse von Apple liefern wichtige Einblicke in die tatsächlichen Fähigkeiten und Grenzen von KI-Systemen im Bereich des mathematischen und logischen Denkens. Sie unterstreichen die Notwendigkeit, die Leistung von LLMs kritisch zu hinterfragen und weiter an der Verbesserung ihrer echten Verständnis- und Denkfähigkeiten zu arbeiten.
Siehe auch:
Apple entlarvt KI-Mängel: Keine Logik, kein Verstand
Apple-Wissenschaftler um Iman Mirzadeh haben die Leistung von großen Sprachmodellen (LLMs) wie ChatGPT unter die Lupe genommen. Sie entwickelten einen verbesserten Benchmark namens GSM-Symbolic, um die Grenzen dieser KI-Systeme aufzuzeigen. Die Forscher stellten den Modellen Hunderte von Fragen, die zuvor zur Bewertung von LLMs verwendet wurden und von den Systemen eigentlich einfach zu lösen sein sollten.Der Trick, der alle KI-Systeme ins Stolpern brachte: Die Forscher fügten irrelevante Informationen hinzu oder änderten nur die Zahlenwerte in einer Frage. Die zusätzlichen, nicht relevanten Daten führten dazu, dass die LLMs falsche oder sogar unsinnige Antworten auf Fragen gaben, die sie zuvor korrekt beantwortet hatten.
Ein besonders auffälliges Ergebnis war, dass das Hinzufügen eines einzigen, scheinbar relevanten Satzteils zu einer Frage die Leistung aller getesteten Modelle um bis zu 65% einbrechen ließ. Dies geschah, obwohl der zusätzliche Satzteil für die Lösung der Aufgabe nicht notwendig war.
Die Studie zeigte auch, dass die Leistung der KI-Systeme erheblich nachlässt, wenn die Anzahl der Satzteile in einer Frage zunimmt. Dies deutet darauf hin, dass kritische Stimmen mit ihren Annahmen bisher noch recht behalten: KI-Systeme verstehen die gestellten Fragen nicht wirklich, sondern antworten lediglich auf Basis gelernter Muster.
Die Forscher veröffentlichten ihre Ergebnisse auf dem Preprint-Server arXiv unter dem Titel "GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models". Sie interpretieren ihre Erkenntnisse als Beweis dafür, dass LLMs nicht zu echtem logischen und mathematischen Denken fähig sind.
Diese Studie wirft wichtige Fragen zur tatsächlichen Fähigkeit von KI-Systemen auf, nuancierte Informationen zu verarbeiten. Die Forscher schließen: Es scheint, dass die scheinbar intelligenten Antworten größtenteils eine Illusion sind. LLMs sind demnach hervorragend darin, Antworten zu geben, die korrekt erscheinen, aber bei genauerer Betrachtung falsch sind.
Die Erkenntnisse von Apple liefern wichtige Einblicke in die tatsächlichen Fähigkeiten und Grenzen von KI-Systemen im Bereich des mathematischen und logischen Denkens. Sie unterstreichen die Notwendigkeit, die Leistung von LLMs kritisch zu hinterfragen und weiter an der Verbesserung ihrer echten Verständnis- und Denkfähigkeiten zu arbeiten.
Zusammenfassung
- Apple-Forscher testen Grenzen von KI in neuer Studie
- Die Studie verwendet GSM-Symbolic Benchmark für Tests
- Irrelevante Informationen bringen KI-Systeme zum Scheitern
- Ein falscher Satzteil kann Leistung von KI um 65% mindern
- Ergebnisse zeigen, dass KI echtes Verständnis fehlt
- Forscher betonen Notwendigkeit, KI-Fähigkeiten zu verbessern
Siehe auch:
- Smart Display & HomeOS: Apple plant KI-Offensive fürs Smart Home
- KI-basierte Hardware: Ex-Apple-Designchef Jony Ive arbeitet für OpenAI
- Apple Intelligence in neuer iOS 18.1 Beta: Erste KI-Features für iPhones
- Apple Intelligence: KI-Funktionen kommen bald per Software-Update
- Apple iPhone 16 vorgestellt: Frisches Design mit neuen KI-Funktionen
Thema:
Apples Aktienkurs in Euro
Videos von und über Apple
- Silo: Apple zeigt den offiziellen Trailer zu Staffel 3 der Sci-Fi-Serie
- Tipps zum Tablet: Nützliches Zubehör für iPad 10 und iPad 11 im Test
- Getestet: Wie stark unterscheiden sich MacBook Neo und MacBook Pro?
- Ähnlicher Preis bringt die Frage auf: MacBook Neo oder ein iPad?
- Ted Lasso: Apple TV zeigt ersten Teaser zu Staffel 4, Start im August
Neue Downloads zum Thema Apple
Beiträge aus dem Forum
-
Wie alt sollte ein MacBook höchstens sein?
MiezMau -
Virtuellen PDF Drucker auf Macbook installieren - wie ?
Sonnenschein11 -
AppleTV
MiezMau -
Surfstick für MacBook Air mit Sonoma 14
landbastler -
iPhone 13 + Smartwatch (keine Apple Watch)
Bilaltore -
Win-Viren am Mac prüfen?
mondayand0 -
IPhone Ortung verhindern.
PC.Nutzer -
Kontextmenu bearbeiten
Brutschi -
Office 2019 MAC Problem
MiyaGi -
Windows Computer vergleichbar Apple M1 Mini
Lewio82
Weiterführende Links
Neue Nachrichten
- Aktuelle Technik-Blitzangebote von Amazon im Überblick
- The Witcher: CD Projekt plant angeblich neues Multiplayer-Spiel
- Forscher bauen aus alten Handys erstaunlich leistungsstarke Server
- Xbox-Exodus: Chef von Microsofts Spielestudios geht
- Galaxy A27: Samsung leakt sein neues Jedermann-Smartphone selbst
- Spiele als Dauerwerbesendung: EA plant Reklame 'direkt im Gameplay'
- Nutzen umstritten, UK bannt dennoch Social Media für Unter-16-Jährige
Videos
Neueste Downloads
Beliebte Nachrichten
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen