KI in Social Networks leicht erkennbar:
Kein Mensch ist so freundlich

In sozialen Netzwerken lässt es sich recht einfach erkennen, ob man gerade mit einem echten Menschen oder einer KI kommuniziert. Wie eine Untersuchung zeigt, fällt die KI insbesondere durch die Freundlichkeit auf, die sonst nur wenig zu finden ist.
Ki, Künstliche Intelligenz, AI, Artificial Intelligence, Roboter, Chatbot, KI-Chatbot, Robot, Bots, Chatbots, AI-ChatBot, Verrückte Roboter, Verrückte Bots, Crazy Robots, Robots, Durchgedreht

Schlicht nicht aggressiv

Forschende der Universitäten Zürich, Amsterdam, Duke und New York untersuchten neun sogenannte Open-Weight-Sprachmodelle, darunter Llama, Mistral und Gemma, und testeten sie auf Plattformen wie Twitter/X, Bluesky und Reddit. Ihr Ergebnis: Selbst optimierte KI-Antworten verraten sich noch mit einer Trefferquote von 70 bis 80 Prozent, vor allem durch ihren "übertrieben freundlichen, emotionalen Tonfall".

Das Forschungsteam um Nicolò Pagan bezeichnet seinen Ansatz als computergestützten Turing-Test. Statt Menschen darüber urteilen zu lassen, ob ein Text authentisch klingt, nutzten die Wissenschaftler algorithmische Klassifikatoren und sprachliche Analysen, um typische Merkmale maschineller Texte zu identifizieren.

Dabei zeigte sich, dass große Sprachmodelle trotz unterschiedlicher Anpassungsstrategien vom Feinjustieren über kontextbasiertes Schreiben bis hin zu Beispieltexten, Schwierigkeiten haben, die emotionale Nuanciertheit echter Nutzerbeiträge nachzuahmen.


Anpassung geht nur bedingt

Besonders auffällig: KI-Antworten waren durchgehend weniger toxisch, also weniger negativ oder aggressiv, als menschliche Kommentare. Selbst wenn Strukturmerkmale wie Satzlänge und Wortwahl angeglichen wurden, blieben Unterschiede in der emotionalen Ausdrucksweise bestehen. Die Forschenden sehen darin ein Anzeichen dafür, dass aktuelle Optimierungsmethoden nicht zwangsläufig zu menschlicher klingenden Ergebnissen führen.

Unerwartet war zudem, dass Modelle mit zusätzlichem "Instruction Tuning", also speziellem Training auf hilfreiches Verhalten, schlechter abschnitten als ihre Basisversionen. Auch größere Modelle erzielten keine überzeugenderen Ergebnisse: Das 70-Milliarden-Parameter-Modell Llama 3.1 wirkte nicht authentischer als kleinere Varianten.

Zwischen inhaltlicher Ähnlichkeit und stilistischer Glaubwürdigkeit besteht laut Studie ein grundlegender Zielkonflikt: Wird ein Modell so angepasst, dass es menschliche Ausdrucksweise besser trifft, verliert es an inhaltlicher Nähe zu echten Antworten - und umgekehrt.

Zusammenfassung
  • KI-Modelle fallen in sozialen Medien durch übermäßige Freundlichkeit auf
  • Spezielle Algorithmen erkennen KI-Texte mit 70-80 Prozent Trefferquote
  • Maschinelle Texte sind deutlich weniger toxisch als menschliche Kommentare
  • Spezielles Training für hilfreiche Antworten verschlechtert die Authentizität
  • Zwischen inhaltlicher Ähnlichkeit und Stilnähe besteht ein ungelöster Konflikt
  • Größere KI-Modelle klingen nicht automatisch menschlicher als kleinere
  • Emotionale Nuancen echter Nutzerbeiträge werden von KI nicht erreicht

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!