ChatGPT liefert realistisch aussehende, gefälschte Forschungs-Daten

Die Schwierigkeiten, die durch die Verfügbarkeit generativer KI-Systeme auf die Universitäten zukommt, sind weit größer als computergenerierte Hausarbeiten. Denn das GPT-4-Modell kann erfundene Daten liefern, die kaum von echten Messungen unterscheidbar sind.
Forschung, Wissenschaft, Labor, Stockfotos, Forscher, Science, Wissenschaftler, scientist, Chemie, Testlabor, Forschen, Testen, Laborkittel, Kittel, Pipette, Schutzanzug, Forscherin

Die bessere Augen-OP

Testweise haben italienische Forscher der italienischen Universität von Cagliari gefälschte Datensätze für klinische Studien erstellt, um eine nicht verifizierte wissenschaftliche Behauptung zu untermauern. Die von der KI generierten Daten verglichen die Ergebnisse zweier chirurgischer Eingriffe und gaben - fälschlicherweise - an, dass die eine Behandlung besser sei als die andere.

Die künstlich generierten Informationen wurden zur Grundlage eines Papers, das von den Wissenschaftlern Anfang des Monats in Form eines Preprints publiziert wurde. Es gelang dabei tatsächlich, den Anschein zu wahren und zumindest einer oberflächlichen Prüfung hielt die Sache stand. Die gute Nachricht: Eine tiefergehende Betrachtung im Rahmen des üblichen Peer-Review-Prozesses sorgte dann aber doch dafür, dass verräterische Anzeichen für die Fälschung gefunden wurden.


"Unser Ziel war es, deutlich zu machen, dass man in wenigen Minuten einen Datensatz erstellen kann, der nicht durch echte Originaldaten gestützt wird und auch im Vergleich zu den verfügbaren Beweisen in die entgegengesetzte oder andere Richtung geht", sagte Studienmitautor und Augenchirurg Giuseppe Giannaccare, in einem Bericht des Journals Nature.

Mehr Aufmerksamkeit nötig

Die Fähigkeit der künstlichen Intelligenz, überzeugende Daten zu fabrizieren, gibt Forschern und Herausgebern von Fachzeitschriften Anlass zur Sorge über die Integrität der Forschung. "Es war eine Sache, dass generative KI dazu verwendet werden konnte, Texte zu generieren, die mit Plagiatssoftware nicht auffindbar waren, aber die Fähigkeit, gefälschte, aber realistische Datensätze zu erstellen, ist eine neue Stufe der Besorgnis", sagt Elisabeth Bik, eine Mikrobiologin und unabhängige Beraterin für Forschungsintegrität in San Francisco, Kalifornien.

Man könnte nun sagen, dass alles gut sei - immerhin wurde die Fälschung im richtigen Moment erkannt. Allerdings zeigt die Praxis, dass da bereits Schaden entstanden sein kann. Immerhin lassen sich auch Papers, die nicht gründlich geprüft sind, einsetzen, um die öffentliche Meinung stark zu beeinflussen. Wenn die darin enthaltenen Fälschungen von niemandem, der nicht selbst tief im Fachbereich drinsteckt, enttarnt werden können, wird eine korrekte Wissenschaftskommunikation schwierig.

Insbesondere nach den Erfahrungen, die man im Umgang mit solchen Themen in der Corona-Pandemie bereits erleben musste, als die Qualität der fragwürdigen Daten noch wesentlich geringer war. Das wird entsprechend höhere Anforderungen bei der Bewertung von Papers an die Forschungs-Gemeinschaft richten.

Zusammenfassung
  • KI-System GPT-4 kann täuschend echte Daten erzeugen.
  • Italienische Forscher erschufen gefälschte klinische Datensätze.
  • Preprint des Papers täuschte Echtheit vor, fiel aber im Review auf.
  • Giannaccare warnt vor leichter Erstellung falscher Datensätze.
  • Forschungsintegrität durch KI-generierte Daten bedroht.
  • Gefahr: Ungeprüfte Papers könnten öffentliche Meinung beeinflussen.
  • Höhere Anforderungen an Paper-Prüfungen werden notwendig.

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!