Enorme Fehlerquote: Kinder besser nicht mit ChatGPT behandeln

KI-Modelle wie ChatGPT sind zwar gut darin, weitgehend korrekte Sprache zu formulieren. Doch sollte man auf keinen Fall darauf vertrauen, dass die dabei mitgelieferten Informationen auch stimmen - vor allem im medizinischen Bereich versagt die Technik kläglich.

ChatGPT 4 besonders schlecht

Wenn man das KI-System OpenAIs einsetzen will, um eine passende Diagnose zu finden, sollte man sehr vorsichtig sein. Denn bereits im letzten Jahr kam man bei einem Test zu der Erkenntnis, dass ChatGPT bei schwierigeren medizinischen Fällen lediglich auf eine Trefferquote von 39 Prozent kam. Und mit der Einführung der neuesten Version hat sich die Lage keineswegs verbessert - im Gegenteil.

Im kinderärztlichen Fachjournal JAMA Pediatrics wurde nun eine Analyse veröffentlicht, bei der die vierte Generation des GPT-Systems einem Test unterzogen wurde. Und hier kam es bei der Diagnose pädiatrischer medizinischer Fälle auf eine Trefferquote von nur 17 Prozent. Die niedrige Erfolgsquote deutet darauf hin, dass Kinderärzte allzu schnell nicht arbeitslos werden - falls das ein Grund zur Sorge war.


"Diese Studie unterstreicht die unschätzbare Rolle, die klinische Erfahrung mitbringt", so das Fazit der Autoren. Denn vor allem beim Umgang mit Kindern sind allein die offensichtlichen Symptome oft nicht ausreichend, um die richtige Diagnose zu treffen. Es bedarf auch einigen Einfühlungsvermögens, um Patienten Informationen zu entlocken, die sich selten konkret und zielgerichtet ausdrücken können.

Es gibt hoffnungsvolle Fälle

Die Untersuchung zeigt aber auch die kritischen Schwachstellen auf, die zu der hohen Fehlerquote von ChatGPT geführt haben. Denn die Forscher am Cohen Children's Medical Center in New York, wo die Tests durchgeführt wurden, stehen der Nutzung der Technologie keineswegs ablehnend gegenüber und suchen nach Möglichkeiten, diese auch sinnvoll im medizinischen Bereich nutzbar zu machen.

Es gibt durchaus Fachbereiche, in denen der KI-Einsatz sehr erfolgreich verläuft. Dies ist vor allem dort der Fall, wo die Technologie ihre Stärken ausspielen kann - und diese liegen vor allem in der Erkennung von Mustern in unstrukturierten Daten. So sind Bildanalyse-KIs beispielsweise oft besser in der Lage, bestimmte Krebsformen zu erkennen, als selbst ein geübter Arzt.

Zusammenfassung
  • KI-Modelle oft sprachlich korrekt, aber inhaltlich unzuverlässig
  • ChatGPT für medizinische Diagnosen wenig treffsicher
  • Aktuelle Version von GPT zeigt in Pädiatrie nur 17% Trefferrate
  • Klinische Erfahrung für Diagnosen bei Kindern unersetzlich
  • Cohen Children's Medical Center sucht KI-Nutzung im Medizinbereich
  • KI erfolgreich in Mustererkennung und Datenanalyse
  • Bildanalyse-KIs erkennen teilweise Krebs besser als Ärzte

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!