Googles neue DeepMind-KIs machen Roboter zu flexiblen Alleskönnern

Name: Gemini Robotics: "Generalität" der KI-Robotersteuerung in Aktion
Uploaded: 2025-03-13T16:36:10+01:00
Duration: 54 s
Description: Gemini Robotics: "Generalität" der KI-Robotersteuerung in Aktion

Google DeepMind stellt zwei neue KI-Modelle vor, die Robotern menschenähnliche Fähigkeiten verleihen. Die Systeme verstehen natürliche Sprache, passen sich flexibel an und können Alltagsgegenstände präzise handhaben.

Witold Pryjda, 13.03.2025 17:59 Uhr

Google

Roboter mit menschenähnlichen Fähigkeiten

Googles KI-Forschungssparte DeepMind hat zwei neue KI-Modelle vorgestellt, die Robotern ein bisher unerreichtes Maß an Flexibilität und Interaktionsfähigkeit verleihen sollen. Gemini Robotics und Gemini Robotics-ER basieren auf der leistungsstarken Gemini 2.0-Architektur und versprechen nach Google-Angaben, die Robotik auf ein neues Level zu heben.

Das Herzstück der neuen Entwicklung ist Gemini Robotics, ein fortschrittliches Vision-Language-Action-Modell (VLA). Es vereint Bildverarbeitung, Sprachverständnis und physische Aktionen in einem System. Wie ein Blogbeitrag von Google DeepMind hervorhebt, zeichnet sich Gemini Robotics durch drei Haupteigenschaften aus:

Generalität: Das Modell kann sich an verschiedene Situationen anpassen und Aufgaben lösen, für die es nicht explizit trainiert wurde.
Interaktivität: Es versteht natürliche Sprache und reagiert in Echtzeit auf Anweisungen oder Umgebungsänderungen.
Geschicklichkeit: Gemini Robotics ermöglicht präzise Manipulationen, wie sie bisher nur Menschen vorbehalten waren.

In Demonstrationsvideos zeigte Google DeepMind die Fähigkeiten der KI-gesteuerten Roboter. Sie falteten Papier, packten Snacks in Zip-Beutel und führten andere komplexe Aufgaben aus - alles auf einfache Sprachbefehle hin.

Gemini Robotics: "Generalität" der KI-Robotersteuerung in Aktion

Gemini Robotics kann verschiedene Robotertypen steuern. Das System wurde primär mit Daten der bi-arm Robotikplattform ALOHA 2 trainiert, lässt sich aber auch auf andere Systeme übertragen. Besonders interessant ist die Kooperation mit Apptronik zur Entwicklung humanoider Roboter auf Basis von Gemini 2.0. Diese Entwicklung ist Teil einer längerfristigen Strategie von DeepMind. Bereits 2023 hatte CEO Demis Hassabis angedeutet, dass das Unternehmen erforsche, wie Gemini mit Robotik kombiniert werden könnte, um physisch mit der Welt zu interagieren.

Als Ergänzung zu Gemini Robotics wurde Gemini Robotics-ER (Embodied Reasoning) vorgestellt. Dieses Modell verbessert Geminis Weltverständnis, speziell für robotische Anwendungen. Es fokussiert sich auf räumliches Denken und ermöglicht Robotikern die Verbindung mit bestehenden Low-Level-Controllern.

Gemini Robotics: Das System versteht auch natürliche Sprache

Gemini Robotics-ER kann komplexe räumliche Aufgaben bewältigen, wie das intuitive Greifen einer Kaffeetasse am Henkel. Es verbindet Geminis Programmierfähigkeiten mit verbessertem 3D-Verständnis und kann so neue Fähigkeiten sprichwörtlich im Vorbeigehen generieren.

Sicherheit und Ethik

Bei der Entwicklung so leistungsfähiger KI-Systeme für die Robotik stehen Sicherheit und ethische Aspekte im Vordergrund. Google DeepMind betont seinen ganzheitlichen Ansatz, der von der Motorsteuerung bis zum semantischen Verständnis reicht. Das Unternehmen hat auch einen neuen Datensatz namens ASIMOV veröffentlicht, der die Bewertung und Verbesserung der semantischen Sicherheit in der verkörperten KI und Robotik ermöglichen soll.

Gemini Robotics: Geschicklichkeit des neuen DeepMind-Modells

Gemini Robotics und Gemini Robotics-ER markieren einen bedeutenden Schritt in Richtung alltagstauglicher, vielseitiger Roboter. Die Fähigkeit, natürliche Sprache zu verstehen und komplexe Aufgaben auszuführen, könnte die Mensch-Roboter-Interaktion revolutionieren. Von Haushaltsrobotern bis hin zu industriellen Anwendungen - die Einsatzmöglichkeiten scheinen vielfältig.

Was denkt ihr über diese Entwicklung? Seht ihr eher Chancen oder Risiken in der Verbindung von KI und Robotik? Teilt eure Gedanken in den Kommentaren mit uns!

Zusammenfassung

Google DeepMind stellt KI-Modelle für flexiblere Robotersteuerung vor
Gemini Robotics vereint Bildverarbeitung, Sprache und physische Aktionen
KI-Roboter können komplexe Aufgaben auf Sprachbefehle hin ausführen
Gemini Robotics-ER verbessert räumliches Denken für Roboteranwendungen
Entwicklung zielt auf alltagstaugliche und vielseitige Robotersysteme ab
Sicherheit und ethische Aspekte stehen bei der Entwicklung im Vordergrund
Potenzial für Revolution der Mensch-Roboter-Interaktion in vielen Bereichen

Siehe auch:

Thema:

Künstliche Intelligenz

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren0

Hinweis einsenden

Weitere Nachrichten zum Thema Kawasaki Heavy Industries stellt futuristischen Roboter zum Reiten vorMinecraft nie gespielt, Diamanten gefarmt: Experten sind baff von AgentDeepMind-Mitgründer: In fünf Jahren hat jeder eigenen KI-"Stabschef"Google gründet neue KI-Abteilung: DeepMind soll Microsoft angreifenDeepMind-KI hat Faltung aller 200 Mio. bekannten Proteine berechnetDeepMind: Google-KI sorgt für Durchbruch in der Protein-Forschung