Gemini 3: Jailbreak liefert nach nur Minuten Anleitung für Biowaffen

Googles neues KI-Modell Gemini 3 Pro gilt als extrem leistungsfähig, doch Sicherheitsforscher deckten nun massive Lücken auf. Einem Startup gelang es in gerade einmal fünf Minuten, die Schutzfilter zu umgehen und Baupläne für Biowaffen abzurufen.
Google, Ki, Künstliche Intelligenz, Datenschutz, Hack, AI, Artificial Intelligence, Cybersicherheit, Jailbreak, Maschinelles Lernen, Schloss-Symbol, KI-Sicherheit, Gemini 3, Tech-Innovation, Digitale Technologie

Gefährliche Baupläne statt Sicherheit

Googles neuestes und leistungsstärkstes KI-Modell, Gemini 3 Pro, weist gravierende Mängel bei den Sicherheitsmechanismen auf. Dem südkoreanischen Sicherheits-Startup Aim Intelligence ist es nämlich nun gelungen, die ethischen Schutzfilter der künstlichen Intelligenz praktisch sofort zu umgehen: Nach einem sogenannten Jailbreak lieferte das Modell detaillierte Instruktionen zur Herstellung von biochemischen Waffen und Sprengstoffen, obwohl solche Inhalte durch interne Richtlinien strikt blockiert werden sollten.

Das Experiment verdeutlicht ein wachsendes Problem in der IT-Branche: Die generative Leistungsfähigkeit der Sprachmodelle entwickelt sich derzeit schneller als die entsprechenden digitalen Abwehrmechanismen. Aim Intelligence agierte hierbei als sogenanntes "Red Team". Diese Praxis stammt ursprünglich aus militärischen Simulationen des Kalten Krieges, bei denen eine Gruppe gezielt die Rolle des Feindes einnimmt, um Sicherheitslücken in den eigenen Reihen aufzudecken.

Google ruft mit Gemini 3 eine "neue Ära der Intelligenz" aus

Die Experten nutzten spezifische Prompts und Rollenspielszenarien, um die KI dazu zu bringen, ihre Sicherheitsvorgaben zu ignorieren. Das Ergebnis war laut den Forschern erschreckend präzise: Gemini 3 generierte über dutzende Zeilen hinweg eine praktikable Anleitung zur Erzeugung des Pockenvirus.

Die Sicherheitstests beschränkten sich nicht nur auf biologische Kampfstoffe. Den Forschern gelang es zudem, mittels der Code-Generierungsfunktionen von Gemini 3 eine Webseite zu erstellen, die Anleitungen zur Herstellung von Sarin-Gas sowie selbstgebauten Sprengsätzen bereitstellte.

Wie Maeil Business Newspaper berichtet (via Android Authority), waren die gelieferten Ergebnisse äußerst detailliert und zeigten, dass die KI ihre eigenen Restriktionen vollständig missachtete. Das koreanische Blatt zitiert interne Analysen, wonach die Filtermechanismen bei komplex verschachtelten Anfragen versagten, die den Kontext der schädlichen Absicht verschleierten.

Satire und Systemgrenzen

Besonders zynisch mutet ein weiterer Teil des Experiments an, der die Grenzen des aktuellen KI-Verständnisses aufzeigt. Als das Forschungsteam die KI aufforderte, eine Präsentation zu erstellen, die das eigene Sicherheitsversagen satirisch aufarbeitet, lieferte Gemini 3 prompt eine Datensammlung mit dem Titel "Excused Stupid Gemini 3" (etwa: "Entschuldigtes, dummes Gemini 3"). Das demonstriert, dass das Modell den Kontext seines Versagens zwar erfassen und sogar ironisch reflektieren, aber im Rahmen des Jailbreaks nicht verhindern kann.

Findet ihr die Sicherheitsmaßnahmen bei modernen KI-Modellen ausreichend oder hemmen sie den Fortschritt? Wir sind gespannt auf eure Perspektive zu diesem Vorfall. Teilt eure Meinung gerne in den Kommentaren mit uns.

Zusammenfassung
  • Sicherheitsexperten knackten Googles KI-Modell Gemini 3 in nur fünf Minuten
  • Südkoreanisches Startup erhielt nach Jailbreak Anleitungen für Biowaffen
  • Sprachmodelle entwickeln sich schneller als ihre Sicherheitsmechanismen
  • Forscher nutzten spezifische Prompts und Rollenspielszenarien als Angriff
  • KI erstellte detaillierte Anleitung zur Erzeugung des gefährlichen Pockenvirus
  • Gemini 3 generierte auch Code für eine Website mit Anleitungen zu Sarin-Gas
  • Selbst eine satirische Aufarbeitung des eigenen Versagens war für die KI möglich

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!