Google DeepMind: Upgrade für realistische Bildbearbeitungen in Gemini

Google präsentiert ein verbessertes Bildbearbeitungsmodell für Gemini, das die Ähnlichkeit von Personen und Haustieren über verschiedene Bearbeitungsschritte hinweg bewahrt. Alle Nutzer können kostenlos auf das Tool zugreifen.

Nadine Dressler, 26.08.2025 18:05 Uhr

Google, Ki, Google Gemini, Sprachmodell, Google DeepMind

Gemini erhält neue Bildbearbeitung

Google hat für seine Gemini-App ein neues Bildbearbeitungsmodell von DeepMind eingeführt, das auf der Imagen 3-Technologie basiert. Das Update bringt deutliche Verbesserungen bei der Bearbeitung von Fotos mit sich und steht allen Gemini-Nutzern zur Verfügung - nicht nur den Abonnenten kostenpflichtiger Versionen.

Kein Vergessen charakteristischer Merkmale

Der wichtigste Fortschritt liegt in der verbesserten Konsistenz bei der Darstellung von Personen und Haustieren. Das neue System sorgt dafür, dass charakteristische Merkmale wie Gesichtszüge, Frisuren oder Fellmuster auch bei umfangreichen Bildmanipulationen zuverlässig erhalten bleiben. Nutzer können sich selbst oder ihre Haustiere in verschiedene Szenarien versetzen, ohne dass das ursprüngliche Erscheinungsbild verfremdet wird.

Ein Upgrade für die Bildbearbeitung in Gemini

Vielfältige Anwendungsmöglichkeiten

Die Anwendungsmöglichkeiten sind vielfältig: Von der Änderung von Kostümen und Orten bis hin zur Kombination mehrerer Fotos zu einer neuen Komposition. Imagen 3 kann Bilder in verschiedenen Stilen erstellen - wie fotorealistische Landschaften, strukturierte Ölgemälde oder skurrile Claymation-Szenen. Nutzer können etwa ein Foto von sich mit einem Bild ihres Hundes kombinieren und beide in eine völlig neue Umgebung einbetten.

Das System ermöglicht schrittweise Bearbeitungen, bei denen jede Änderung auf die vorherige aufbaut. So lassen sich leere Räume mit Farbe füllen und anschließend Möbel oder andere Objekte hinzufügen. Auch das Übertragen von Designelementen zwischen Bildern ist möglich - etwa das Muster von Schmetterlingsflügeln auf ein Kleid oder die Textur von Blütenblättern auf Gummistiefel.

Transparenz und Kennzeichnung

Zur Transparenz versieht Gemini jedes bearbeitete Bild mit einem sichtbaren Wasserzeichen. Zusätzlich wird ein unsichtbares digitales SynthID-Wasserzeichen eingebettet, um KI-generierte Inhalte eindeutig zu identifizieren. Diese Maßnahmen sollen helfen, die Verbreitung von Deepfakes und anderen manipulierten Inhalten zu bekämpfen.

Verfügbarkeit und Ausblick

Das neue Bildgenerierungsmodell ist sowohl in der kostenfreien Version von Gemini als auch in den Advanced-, Business- und Enterprise-Versionen verfügbar. Die aktualisierte App wird schrittweise ausgerollt, wobei der vollständige Rollout einige Wochen dauern kann.

Google plant, die Bildbearbeitungsfunktionen kontinuierlich zu erweitern und weitere kreative Werkzeuge zu integrieren. Das Unternehmen sieht in der KI-gestützten Bildbearbeitung einen wichtigen Baustein für die Zukunft der digitalen Kreativität.

Was haltet ihr von den neuen Bildbearbeitungsmöglichkeiten in Gemini? Teilt eure Erfahrungen und Meinungen zu den erweiterten KI-Funktionen in den Kommentaren mit.

Was ist neu bei Gemini Bildbearbeitung?

Mit dem Update integriert Google DeepMind ein neues Modell in die Gemini-App, das auf der Imagen-3-Technologie basiert. Es erlaubt fotorealistische Bearbeitungen, kreative Szenen und konsistente Darstellungen von Personen oder Tieren - auch bei komplexen Änderungen.

Besonders hervorzuheben ist die Fähigkeit, das Erscheinungsbild von Personen über mehrere Bearbeitungen hinweg konsistent zu halten. Damit wird die Bearbeitung persönlicher Fotos deutlich natürlicher und realistischer.

Wie funktioniert die Konsistenz bei Gesichtern?

Gemini nutzt fortschrittliche KI-Modelle, um charakteristische Merkmale wie Gesichtszüge, Frisuren oder Fellmuster bei Tieren zuverlässig zu erkennen und über mehrere Bearbeitungsschritte hinweg beizubehalten.

Dadurch bleibt das "Ich" auf dem Bild erhalten, auch wenn man sich selbst in neue Szenarien versetzt - etwa mit einem anderen Outfit oder an einem neuen Ort. Das erhöht die Authentizität der Ergebnisse deutlich.

Welche Bearbeitungen sind möglich?

Nutzer können Outfits oder Hintergründe ändern, Szenen kombinieren oder sogar Designs übertragen - etwa das Muster von Schmetterlingsflügeln auf Kleidung. Auch das Zusammenfügen mehrerer Bilder ist möglich.

Besonders praktisch: Die Bearbeitung erfolgt schrittweise. So lassen sich Räume einrichten, Farben ändern und Objekte hinzufügen, ohne dass der Rest des Bildes verloren geht.

Wie sicher ist die Nutzung für Unternehmen?

Google versieht alle KI-generierten Bilder mit sichtbaren und unsichtbaren Wasserzeichen (SynthID), um Transparenz zu gewährleisten. Dies entspricht den Empfehlungen der EU AI Act und der FTC-Richtlinien.

Für Unternehmen bedeutet das: Sie können visuelle Inhalte rechtssicher nutzen, etwa für Werbung oder E-Commerce, ohne gegen Kennzeichnungspflichten zu verstoßen - ein wichtiger Aspekt in regulierten Märkten.

Welche Vorteile bringt Gemini im Alltag?

Für IT-Profis oder Kreative bietet Gemini eine schnelle Möglichkeit, hochwertige Bilder zu erstellen - sei es für Präsentationen, Social Media oder Prototyping. Auch ohne Designkenntnisse lassen sich überzeugende Visuals erzeugen.

Durch die native Integration in die App entfällt der Umweg über externe Tools. Das spart Zeit und senkt die Hürde für kreative Bildbearbeitung im Arbeitsalltag.

Gibt es technische Voraussetzungen?

Die Bildbearbeitung läuft direkt in der Gemini-App, ein separates Tool ist nicht nötig. Für Entwickler steht Gemini auch über Googles Vertex AI API zur Verfügung, etwa zur Integration in eigene Workflows.

Allerdings erfordert die Nutzung hoher Auflösungen (bis 2048x2048 Pixel) entsprechende Rechenleistung. Für kleine Unternehmen könnten die GPU-Kosten laut AWS-Trends um bis zu 25 % steigen, wenn keine Optimierungen erfolgen.

Wie erkennt man KI-generierte Bilder?

Alle in Gemini bearbeiteten oder erzeugten Bilder enthalten ein sichtbares Wasserzeichen sowie ein unsichtbares SynthID-Wasserzeichen. Letzteres lässt sich auch maschinell auslesen.

Damit reagiert Google auf ethische Bedenken wie Deepfakes oder Desinformation. Für professionelle Nutzer ist das ein wichtiges Signal für Transparenz und Vertrauen - gerade bei öffentlich genutzten Bildern.

Zusammenfassung

Neues DeepMind-Bildbearbeitungsmodell in Gemini bewahrt Personenmerkmale
Imagen 3-Technologie ermöglicht konsistente Darstellung bei Bildmanipulationen
Vielfältige Anwendungen von Kostümänderungen bis zu Bildkompositionen
Das System unterstützt schrittweise Bearbeitungen und Stilübertragungen
Wasserzeichen und SynthID schützen vor unbemerkter Verbreitung von Deepfakes
Die Funktion ist für alle Gemini-Nutzer kostenlos verfügbar, nicht nur Abonnenten
Google plant kontinuierliche Erweiterung der kreativen Bildbearbeitungsfunktionen

Siehe auch:

Thema:

Kommentieren3

Hinweis einsenden

Weitere Nachrichten zum Thema Minecraft nie gespielt, Diamanten gefarmt: Experten sind baff von AgentMacOS & Windows mit Prompt geklont? KI-Hype-News stimmt so nichtLetzte Hoffnung Gemini? Apple verhandelt mit Google für "neue" SiriGoogle Gemini Live Updates: Visuelle Unterstützung kommt auf Pixel 10Gefangen im eigenen Zuhause: Gemini lässt Hacker Smart Home kapernGoogle Gemini hasst sich selbst, nennt sich "Versager" und "Schande"

Jetzt einen Kommentar schreiben

Alle Kommentare zu dieser News anzeigen

Videos zum Thema KI

Neueste
Beliebte
Empfehlung

Mehr Videos zum Thema KI

Beiträge aus dem Forum

Zum WinFuture Forum

Interessante Links

Neue Nachrichten

Tipp einsenden

Hinweise zum Einsenden von Tipps

❤ WinFuture unterstützen

Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen:

Vielen Dank!