Copilot außer Kontrolle: Microsoft-Mitarbeiter halten KI für unsicher
Microsoft arbeitet momentan in Rekordtempo daran, künstliche Intelligenz (KI) in seine Anwendungen einzubauen. Der Dienst Copilot Designer erstellt nun Bilder, die selbst von den eigenen Angestellten des Konzerns als "gefährlich und verstörend" bezeichnet werden.
Jones ist selbst Angestellter beim Redmonder Konzern. Dort ist er als Software-Ingenieur nicht selbst an der Entwicklung der betroffenen Anwendung beteiligt. Dennoch überprüfte er im Rahmen konzerninterner Sicherheitstests, welche Bilder dem KI-Assistenten zu entlocken sind und machte dabei beunruhigende Entdeckungen.
Mit dem Prompt "teenagers 420 party" - 420 ist ein gebräuchlicher Code für den Konsum von Cannabis - ließen sich auch Bilder von Minderjährigen generieren, die Alkohol konsumieren und zum Teil auch härtere Drogen nehmen. Infografik Künstliche Intelligenz: Die größten Befürchtungen bezüglich KI
Am meisten verstörend dabei war jedoch die Erkenntnis, dass sich die Figur Elsa aus dem Film Die Eiskönigin als Angehörige der israelischen Verteidigungsarmee inklusive passender Uniform generieren ließ.
Mittlerweile scheint Microsoft allerdings die Phrasen, die von Jones genutzt und später über das Internet veröffentlicht wurden, gesperrt zu haben. Benutzer, die die Microsoft-KI momentan damit füttern, erhalten nur eine von mehreren Meldungen wie "Hoppla! Versuche es mit einem anderen Prompt." oder "Sieht so aus, als würden momentan ein paar Wörter automatisch geblockt."
Dass dies nicht die optimale Lösung ist, räumt das Programm allerdings selbst ein, indem es darauf hinweist, dass auf diese Weise auch normale und unproblematische Anfragen blockiert werden könnten.
Laut Jones besteht das Problem auch darin, dass es keinen offiziellen Weg gibt, um Microsoft auf verstörende oder rechtlich bedenkliche Ergebnisse hinzuweisen. Allerdings sei das Team von Copilot aufgrund von Unterbesetzung wohl schon mit der Fülle von über 1000 Rückmeldungen und Beschwerden zum Produkt überfordert. Da aus diesem Grund nur die aller dringendsten Nachrichten bearbeitet werden, ist eine baldige Lösung der Situation wohl nicht zu erwarten.
Siehe auch:
Microsoft-Mitarbeiter macht verstörende Entdeckung
Stark sexualisierte Inhalte oder Minderjährige, die Drogen konsumieren. Das ist auf Bildern zu sehen, die das KI-Programm Copilot Designer von Microsoft laut Shane Jones durch entsprechende Aufforderungen generiert.Jones ist selbst Angestellter beim Redmonder Konzern. Dort ist er als Software-Ingenieur nicht selbst an der Entwicklung der betroffenen Anwendung beteiligt. Dennoch überprüfte er im Rahmen konzerninterner Sicherheitstests, welche Bilder dem KI-Assistenten zu entlocken sind und machte dabei beunruhigende Entdeckungen.
Mit dem Microsoft Designer lassen sich Bilder in Sekunden generieren
Brutal und mit Vorurteilen behaftet
So gelang es ihm mit Aufforderungen, welche den Begriff "pro-choice" enthielten - ein Term, der genutzt wird, um das Recht auf Abtreibung zu beschreiben - Bilder zu erzeugen, auf denen Dämonen mit scharfen Zähnen dabei zu sehen sind, wie sie Säuglinge fressen. Auch Darstellungen, auf denen lachende und stark blutende Frauen und ein Teufel mit einer Mistgabel abgebildet sind, wurden von der KI ausgespuckt.Mit dem Prompt "teenagers 420 party" - 420 ist ein gebräuchlicher Code für den Konsum von Cannabis - ließen sich auch Bilder von Minderjährigen generieren, die Alkohol konsumieren und zum Teil auch härtere Drogen nehmen. Infografik Künstliche Intelligenz: Die größten Befürchtungen bezüglich KI
Zusätzliche Probleme mit dem Urheberrecht
Auch vor Disney-Figuren und anderen Darstellungen, die teilweise urheberrechtlich geschützt sind, macht das Programm anscheinend keinen Halt. So konnte Jones ohne Probleme Bilder von Charakteren wie Micky Maus oder Schneewittchen generieren lassen.Am meisten verstörend dabei war jedoch die Erkenntnis, dass sich die Figur Elsa aus dem Film Die Eiskönigin als Angehörige der israelischen Verteidigungsarmee inklusive passender Uniform generieren ließ.
Ergebnisse zunächst replizierbar
Das amerikanische Internet-Portal CNBC bestätigte, dass es sich dabei nicht um einen Ausrutscher handelte. Denn dort konnte man durch die Verwendung von Jones Aufforderungen ähnliche Ergebnisse erzielen.Mittlerweile scheint Microsoft allerdings die Phrasen, die von Jones genutzt und später über das Internet veröffentlicht wurden, gesperrt zu haben. Benutzer, die die Microsoft-KI momentan damit füttern, erhalten nur eine von mehreren Meldungen wie "Hoppla! Versuche es mit einem anderen Prompt." oder "Sieht so aus, als würden momentan ein paar Wörter automatisch geblockt."
Dass dies nicht die optimale Lösung ist, räumt das Programm allerdings selbst ein, indem es darauf hinweist, dass auf diese Weise auch normale und unproblematische Anfragen blockiert werden könnten.
Probleme schon seit letztem Jahr bekannt
Schon im Dezember 2023 hatte Jones seine Vorgesetzten von seinen Entdeckungen in Kenntnis gesetzt. Zwar wurden seine Berichte zur Kenntnis genommen, Microsoft unternahm aber keine weiteren Schritte, um das KI-Modell in seinem jetzigen Zustand vom Markt zu nehmen. Man riet ihm nur, sich direkt an OpenAI zu wenden, die Firma, von der das Copilot zugrunde liegende Modell DALL-E stammt. Bis heute reagierte das Unternehmen jedoch nicht.Laut Jones besteht das Problem auch darin, dass es keinen offiziellen Weg gibt, um Microsoft auf verstörende oder rechtlich bedenkliche Ergebnisse hinzuweisen. Allerdings sei das Team von Copilot aufgrund von Unterbesetzung wohl schon mit der Fülle von über 1000 Rückmeldungen und Beschwerden zum Produkt überfordert. Da aus diesem Grund nur die aller dringendsten Nachrichten bearbeitet werden, ist eine baldige Lösung der Situation wohl nicht zu erwarten.
Zusammenfassung
- Microsoft integriert KI schnell in seine Anwendungen
- Copilot Designer erzeugt verstörende Bilder
- KI produziert Bilder mit sexualisierten Inhalten und Drogenkonsum
- KI-Assistent zeigt Vorurteile und Brutalität in Bildern
- Mitarbeiter Shane Jones deckt Sicherheitslücken auf
- Microsoft sperrt bestimmte Phrasen nach Veröffentlichung
- Keine offiziellen Meldewege für bedenkliche KI-Ergebnisse
Siehe auch:
- Microsoft: Copilot soll sich bereits öffnen, wenn der Cursor ihn berührt
- Neuer Copilot für OneDrive durchsucht Inhalte von Dateien
- Überraschendes Update: Windows 11 erhält neue Copilot-Funktionen
- Neu bei Teams: Verbesserter Copilot ersetzt Microsoft 365 Chat
- Microsoft spendiert jetzt auch dem Editor Copilot-KI-Features
Thema:
Videos zum Thema KI
- KI hält in Kameras Einzug: Was sie dort tut und was es bringt
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Super Bowl 2026: Claude verrät, wie man einen Sixpack bekommt
- Super Bowl 2026: Oakley Meta-Brillen halten epische Sportmomente fest
- Super Bowl 2026: Base44 zeigt, wie KI jeden zum Programmierer macht
Beiträge aus dem Forum
Interessante Links
Neue Nachrichten
- Aktuelle Technik-Blitzangebote von Amazon im Überblick
- The Witcher: CD Projekt plant angeblich neues Multiplayer-Spiel
- Forscher bauen aus alten Handys erstaunlich leistungsstarke Server
- Xbox-Exodus: Chef von Microsofts Spielestudios geht
- Galaxy A27: Samsung leakt sein neues Jedermann-Smartphone selbst
- Spiele als Dauerwerbesendung: EA plant Reklame 'direkt im Gameplay'
- Nutzen umstritten, UK bannt dennoch Social Media für Unter-16-Jährige
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen