KI in Social Networks leicht erkennbar:
Kein Mensch ist so freundlich

In sozialen Netzwerken lässt es sich recht einfach erkennen, ob man gerade mit einem echten Menschen oder einer KI kommuniziert. Wie eine Untersuchung zeigt, fällt die KI insbesondere durch die Freundlichkeit auf, die sonst nur wenig zu finden ist.

Christian Kahle, 13.11.2025 10:21 Uhr

Ki, Künstliche Intelligenz, AI, Artificial Intelligence, Roboter, Chatbot, KI-Chatbot, Robot, Bots, Chatbots, AI-ChatBot, Verrückte Roboter, Verrückte Bots, Crazy Robots, Robots, Durchgedreht

Schlicht nicht aggressiv

Forschende der Universitäten Zürich, Amsterdam, Duke und New York untersuchten neun sogenannte Open-Weight-Sprachmodelle, darunter Llama, Mistral und Gemma, und testeten sie auf Plattformen wie Twitter/X, Bluesky und Reddit. Ihr Ergebnis: Selbst optimierte KI-Antworten verraten sich noch mit einer Trefferquote von 70 bis 80 Prozent, vor allem durch ihren "übertrieben freundlichen, emotionalen Tonfall".

Das Forschungsteam um Nicolò Pagan bezeichnet seinen Ansatz als computergestützten Turing-Test. Statt Menschen darüber urteilen zu lassen, ob ein Text authentisch klingt, nutzten die Wissenschaftler algorithmische Klassifikatoren und sprachliche Analysen, um typische Merkmale maschineller Texte zu identifizieren.

Dabei zeigte sich, dass große Sprachmodelle trotz unterschiedlicher Anpassungsstrategien vom Feinjustieren über kontextbasiertes Schreiben bis hin zu Beispieltexten, Schwierigkeiten haben, die emotionale Nuanciertheit echter Nutzerbeiträge nachzuahmen.

Anpassung geht nur bedingt

Besonders auffällig: KI-Antworten waren durchgehend weniger toxisch, also weniger negativ oder aggressiv, als menschliche Kommentare. Selbst wenn Strukturmerkmale wie Satzlänge und Wortwahl angeglichen wurden, blieben Unterschiede in der emotionalen Ausdrucksweise bestehen. Die Forschenden sehen darin ein Anzeichen dafür, dass aktuelle Optimierungsmethoden nicht zwangsläufig zu menschlicher klingenden Ergebnissen führen.

Unerwartet war zudem, dass Modelle mit zusätzlichem "Instruction Tuning", also speziellem Training auf hilfreiches Verhalten, schlechter abschnitten als ihre Basisversionen. Auch größere Modelle erzielten keine überzeugenderen Ergebnisse: Das 70-Milliarden-Parameter-Modell Llama 3.1 wirkte nicht authentischer als kleinere Varianten.

Zwischen inhaltlicher Ähnlichkeit und stilistischer Glaubwürdigkeit besteht laut Studie ein grundlegender Zielkonflikt: Wird ein Modell so angepasst, dass es menschliche Ausdrucksweise besser trifft, verliert es an inhaltlicher Nähe zu echten Antworten - und umgekehrt.

Zusammenfassung

KI-Modelle fallen in sozialen Medien durch übermäßige Freundlichkeit auf
Spezielle Algorithmen erkennen KI-Texte mit 70-80 Prozent Trefferquote
Maschinelle Texte sind deutlich weniger toxisch als menschliche Kommentare
Spezielles Training für hilfreiche Antworten verschlechtert die Authentizität
Zwischen inhaltlicher Ähnlichkeit und Stilnähe besteht ein ungelöster Konflikt
Größere KI-Modelle klingen nicht automatisch menschlicher als kleinere
Emotionale Nuancen echter Nutzerbeiträge werden von KI nicht erreicht

Siehe auch:

Thema:

Soziale Netzwerke

Kommentieren10

Hinweis einsenden

Weitere Nachrichten zum Thema KI-Teddybär sprach mit Kindern über Sex, Messer und StreichhölzerEU will unendliches Scrollen in Social Media-Plattformen unterbindenGoogles Veo 3: KI-Videos, die niemand mehr erkennt - ihr vielleicht?Captcha: Bot-Erkennung ist durch neue KI-Systeme am EndeOpenAI hat Tool zur KI-Erkennung lange fertig - hält es aber zurück