Google DeepMind: Upgrade für realistische Bildbearbeitungen in Gemini
Google präsentiert ein verbessertes Bildbearbeitungsmodell für Gemini, das die Ähnlichkeit von Personen und Haustieren über verschiedene Bearbeitungsschritte hinweg bewahrt. Alle Nutzer können kostenlos auf das Tool zugreifen.
Das System ermöglicht schrittweise Bearbeitungen, bei denen jede Änderung auf die vorherige aufbaut. So lassen sich leere Räume mit Farbe füllen und anschließend Möbel oder andere Objekte hinzufügen. Auch das Übertragen von Designelementen zwischen Bildern ist möglich - etwa das Muster von Schmetterlingsflügeln auf ein Kleid oder die Textur von Blütenblättern auf Gummistiefel.
Google plant, die Bildbearbeitungsfunktionen kontinuierlich zu erweitern und weitere kreative Werkzeuge zu integrieren. Das Unternehmen sieht in der KI-gestützten Bildbearbeitung einen wichtigen Baustein für die Zukunft der digitalen Kreativität.
Was haltet ihr von den neuen Bildbearbeitungsmöglichkeiten in Gemini? Teilt eure Erfahrungen und Meinungen zu den erweiterten KI-Funktionen in den Kommentaren mit.
Siehe auch:
Gemini erhält neue Bildbearbeitung
Google hat für seine Gemini-App ein neues Bildbearbeitungsmodell von DeepMind eingeführt, das auf der Imagen 3-Technologie basiert. Das Update bringt deutliche Verbesserungen bei der Bearbeitung von Fotos mit sich und steht allen Gemini-Nutzern zur Verfügung - nicht nur den Abonnenten kostenpflichtiger Versionen.Kein Vergessen charakteristischer Merkmale
Der wichtigste Fortschritt liegt in der verbesserten Konsistenz bei der Darstellung von Personen und Haustieren. Das neue System sorgt dafür, dass charakteristische Merkmale wie Gesichtszüge, Frisuren oder Fellmuster auch bei umfangreichen Bildmanipulationen zuverlässig erhalten bleiben. Nutzer können sich selbst oder ihre Haustiere in verschiedene Szenarien versetzen, ohne dass das ursprüngliche Erscheinungsbild verfremdet wird.Ein Upgrade für die Bildbearbeitung in Gemini
Vielfältige Anwendungsmöglichkeiten
Die Anwendungsmöglichkeiten sind vielfältig: Von der Änderung von Kostümen und Orten bis hin zur Kombination mehrerer Fotos zu einer neuen Komposition. Imagen 3 kann Bilder in verschiedenen Stilen erstellen - wie fotorealistische Landschaften, strukturierte Ölgemälde oder skurrile Claymation-Szenen. Nutzer können etwa ein Foto von sich mit einem Bild ihres Hundes kombinieren und beide in eine völlig neue Umgebung einbetten.Das System ermöglicht schrittweise Bearbeitungen, bei denen jede Änderung auf die vorherige aufbaut. So lassen sich leere Räume mit Farbe füllen und anschließend Möbel oder andere Objekte hinzufügen. Auch das Übertragen von Designelementen zwischen Bildern ist möglich - etwa das Muster von Schmetterlingsflügeln auf ein Kleid oder die Textur von Blütenblättern auf Gummistiefel.
Transparenz und Kennzeichnung
Zur Transparenz versieht Gemini jedes bearbeitete Bild mit einem sichtbaren Wasserzeichen. Zusätzlich wird ein unsichtbares digitales SynthID-Wasserzeichen eingebettet, um KI-generierte Inhalte eindeutig zu identifizieren. Diese Maßnahmen sollen helfen, die Verbreitung von Deepfakes und anderen manipulierten Inhalten zu bekämpfen.Verfügbarkeit und Ausblick
Das neue Bildgenerierungsmodell ist sowohl in der kostenfreien Version von Gemini als auch in den Advanced-, Business- und Enterprise-Versionen verfügbar. Die aktualisierte App wird schrittweise ausgerollt, wobei der vollständige Rollout einige Wochen dauern kann.Google plant, die Bildbearbeitungsfunktionen kontinuierlich zu erweitern und weitere kreative Werkzeuge zu integrieren. Das Unternehmen sieht in der KI-gestützten Bildbearbeitung einen wichtigen Baustein für die Zukunft der digitalen Kreativität.
Was haltet ihr von den neuen Bildbearbeitungsmöglichkeiten in Gemini? Teilt eure Erfahrungen und Meinungen zu den erweiterten KI-Funktionen in den Kommentaren mit.
Was ist neu bei Gemini Bildbearbeitung?
Mit dem Update integriert Google DeepMind ein neues Modell in die Gemini-App, das auf der Imagen-3-Technologie basiert. Es erlaubt fotorealistische Bearbeitungen, kreative Szenen und konsistente Darstellungen von Personen oder Tieren - auch bei komplexen Änderungen.
Besonders hervorzuheben ist die Fähigkeit, das Erscheinungsbild von Personen über mehrere Bearbeitungen hinweg konsistent zu halten. Damit wird die Bearbeitung persönlicher Fotos deutlich natürlicher und realistischer.
Besonders hervorzuheben ist die Fähigkeit, das Erscheinungsbild von Personen über mehrere Bearbeitungen hinweg konsistent zu halten. Damit wird die Bearbeitung persönlicher Fotos deutlich natürlicher und realistischer.
Wie funktioniert die Konsistenz bei Gesichtern?
Gemini nutzt fortschrittliche KI-Modelle, um charakteristische Merkmale wie Gesichtszüge, Frisuren oder Fellmuster bei Tieren zuverlässig zu erkennen und über mehrere Bearbeitungsschritte hinweg beizubehalten.
Dadurch bleibt das "Ich" auf dem Bild erhalten, auch wenn man sich selbst in neue Szenarien versetzt - etwa mit einem anderen Outfit oder an einem neuen Ort. Das erhöht die Authentizität der Ergebnisse deutlich.
Dadurch bleibt das "Ich" auf dem Bild erhalten, auch wenn man sich selbst in neue Szenarien versetzt - etwa mit einem anderen Outfit oder an einem neuen Ort. Das erhöht die Authentizität der Ergebnisse deutlich.
Welche Bearbeitungen sind möglich?
Nutzer können Outfits oder Hintergründe ändern, Szenen kombinieren oder sogar Designs übertragen - etwa das Muster von Schmetterlingsflügeln auf Kleidung. Auch das Zusammenfügen mehrerer Bilder ist möglich.
Besonders praktisch: Die Bearbeitung erfolgt schrittweise. So lassen sich Räume einrichten, Farben ändern und Objekte hinzufügen, ohne dass der Rest des Bildes verloren geht.
Besonders praktisch: Die Bearbeitung erfolgt schrittweise. So lassen sich Räume einrichten, Farben ändern und Objekte hinzufügen, ohne dass der Rest des Bildes verloren geht.
Wie sicher ist die Nutzung für Unternehmen?
Google versieht alle KI-generierten Bilder mit sichtbaren und unsichtbaren Wasserzeichen (SynthID), um Transparenz zu gewährleisten. Dies entspricht den Empfehlungen der EU AI Act und der FTC-Richtlinien.
Für Unternehmen bedeutet das: Sie können visuelle Inhalte rechtssicher nutzen, etwa für Werbung oder E-Commerce, ohne gegen Kennzeichnungspflichten zu verstoßen - ein wichtiger Aspekt in regulierten Märkten.
Für Unternehmen bedeutet das: Sie können visuelle Inhalte rechtssicher nutzen, etwa für Werbung oder E-Commerce, ohne gegen Kennzeichnungspflichten zu verstoßen - ein wichtiger Aspekt in regulierten Märkten.
Welche Vorteile bringt Gemini im Alltag?
Für IT-Profis oder Kreative bietet Gemini eine schnelle Möglichkeit, hochwertige Bilder zu erstellen - sei es für Präsentationen, Social Media oder Prototyping. Auch ohne Designkenntnisse lassen sich überzeugende Visuals erzeugen.
Durch die native Integration in die App entfällt der Umweg über externe Tools. Das spart Zeit und senkt die Hürde für kreative Bildbearbeitung im Arbeitsalltag.
Durch die native Integration in die App entfällt der Umweg über externe Tools. Das spart Zeit und senkt die Hürde für kreative Bildbearbeitung im Arbeitsalltag.
Gibt es technische Voraussetzungen?
Die Bildbearbeitung läuft direkt in der Gemini-App, ein separates Tool ist nicht nötig. Für Entwickler steht Gemini auch über Googles Vertex AI API zur Verfügung, etwa zur Integration in eigene Workflows.
Allerdings erfordert die Nutzung hoher Auflösungen (bis 2048x2048 Pixel) entsprechende Rechenleistung. Für kleine Unternehmen könnten die GPU-Kosten laut AWS-Trends um bis zu 25 % steigen, wenn keine Optimierungen erfolgen.
Allerdings erfordert die Nutzung hoher Auflösungen (bis 2048x2048 Pixel) entsprechende Rechenleistung. Für kleine Unternehmen könnten die GPU-Kosten laut AWS-Trends um bis zu 25 % steigen, wenn keine Optimierungen erfolgen.
Wie erkennt man KI-generierte Bilder?
Alle in Gemini bearbeiteten oder erzeugten Bilder enthalten ein sichtbares Wasserzeichen sowie ein unsichtbares SynthID-Wasserzeichen. Letzteres lässt sich auch maschinell auslesen.
Damit reagiert Google auf ethische Bedenken wie Deepfakes oder Desinformation. Für professionelle Nutzer ist das ein wichtiges Signal für Transparenz und Vertrauen - gerade bei öffentlich genutzten Bildern.
Damit reagiert Google auf ethische Bedenken wie Deepfakes oder Desinformation. Für professionelle Nutzer ist das ein wichtiges Signal für Transparenz und Vertrauen - gerade bei öffentlich genutzten Bildern.
Zusammenfassung
- Neues DeepMind-Bildbearbeitungsmodell in Gemini bewahrt Personenmerkmale
- Imagen 3-Technologie ermöglicht konsistente Darstellung bei Bildmanipulationen
- Vielfältige Anwendungen von Kostümänderungen bis zu Bildkompositionen
- Das System unterstützt schrittweise Bearbeitungen und Stilübertragungen
- Wasserzeichen und SynthID schützen vor unbemerkter Verbreitung von Deepfakes
- Die Funktion ist für alle Gemini-Nutzer kostenlos verfügbar, nicht nur Abonnenten
- Google plant kontinuierliche Erweiterung der kreativen Bildbearbeitungsfunktionen
Siehe auch:
- Meta plant gigantische KI-Datenzentren in der Größe von Manhattan
- KIs sollen Coder schneller machen, doch real ist das Gegenteil der Fall
- Microsoft hat eine halbe Milliarde Dollar mit KI in Call-Centern gespart
- USA: Stromkosten für Endkunden explodieren wegen Netzausbau für KI
- KI baut Killer-Protein gegen antibiotikaresistente Superbakterien
Thema:
Videos zum Thema KI
Beiträge aus dem Forum
Interessante Links
Neue Nachrichten
- Arc: Keine Gaming-Grafikkarten mehr? Doch, sagt Intel
- NASA erklärt Mars-Sonde Maven nach elf Jahren offiziell für tot
- Trump-Ballsaal: Spendende Tech-Firmen erhalten Aufträge für 50 Mrd. $
- Very Large Array der nächsten Generation: Neues Teleskop besteht Tests
- Top-Tarif für Vielsurfer: 300 GB 5G-Flat jetzt für nur 14,99 Euro
- US-Regierung soll bei KI-Firmen einsteigen, um Bürger ruhig zu stellen
- Russland will einen modernen Überschall-Passagierjet bauen
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen