Googles neue DeepMind-KIs machen Roboter zu flexiblen Alleskönnern

Google DeepMind stellt zwei neue KI-Modelle vor, die Robotern menschenähnliche Fähigkeiten verleihen. Die Systeme verstehen natürliche Sprache, passen sich flexibel an und können Alltagsgegenstände präzise handhaben.
Google, Ki, Künstliche Intelligenz, DeepMind, Gemini Robotics
Google

Roboter mit menschenähnlichen Fähigkeiten

Googles KI-Forschungssparte DeepMind hat zwei neue KI-Modelle vorgestellt, die Robotern ein bisher unerreichtes Maß an Flexibilität und Interaktionsfähigkeit verleihen sollen. Gemini Robotics und Gemini Robotics-ER basieren auf der leistungsstarken Gemini 2.0-Architektur und versprechen nach Google-Angaben, die Robotik auf ein neues Level zu heben.

Das Herzstück der neuen Entwicklung ist Gemini Robotics, ein fortschrittliches Vision-Language-Action-Modell (VLA). Es vereint Bildverarbeitung, Sprachverständnis und physische Aktionen in einem System. Wie ein Blogbeitrag von Google DeepMind hervorhebt, zeichnet sich Gemini Robotics durch drei Haupteigenschaften aus:

  1. Generalität: Das Modell kann sich an verschiedene Situationen anpassen und Aufgaben lösen, für die es nicht explizit trainiert wurde.
  2. Interaktivität: Es versteht natürliche Sprache und reagiert in Echtzeit auf Anweisungen oder Umgebungsänderungen.
  3. Geschicklichkeit: Gemini Robotics ermöglicht präzise Manipulationen, wie sie bisher nur Menschen vorbehalten waren.

In Demonstrationsvideos zeigte Google DeepMind die Fähigkeiten der KI-gesteuerten Roboter. Sie falteten Papier, packten Snacks in Zip-Beutel und führten andere komplexe Aufgaben aus - alles auf einfache Sprachbefehle hin.

Gemini Robotics: "Generalität" der KI-Robotersteuerung in Aktion

Gemini Robotics kann verschiedene Robotertypen steuern. Das System wurde primär mit Daten der bi-arm Robotikplattform ALOHA 2 trainiert, lässt sich aber auch auf andere Systeme übertragen. Besonders interessant ist die Kooperation mit Apptronik zur Entwicklung humanoider Roboter auf Basis von Gemini 2.0. Diese Entwicklung ist Teil einer längerfristigen Strategie von DeepMind. Bereits 2023 hatte CEO Demis Hassabis angedeutet, dass das Unternehmen erforsche, wie Gemini mit Robotik kombiniert werden könnte, um physisch mit der Welt zu interagieren.

Als Ergänzung zu Gemini Robotics wurde Gemini Robotics-ER (Embodied Reasoning) vorgestellt. Dieses Modell verbessert Geminis Weltverständnis, speziell für robotische Anwendungen. Es fokussiert sich auf räumliches Denken und ermöglicht Robotikern die Verbindung mit bestehenden Low-Level-Controllern.

Gemini Robotics: Das System versteht auch natürliche Sprache

Gemini Robotics-ER kann komplexe räumliche Aufgaben bewältigen, wie das intuitive Greifen einer Kaffeetasse am Henkel. Es verbindet Geminis Programmierfähigkeiten mit verbessertem 3D-Verständnis und kann so neue Fähigkeiten sprichwörtlich im Vorbeigehen generieren.

Sicherheit und Ethik

Bei der Entwicklung so leistungsfähiger KI-Systeme für die Robotik stehen Sicherheit und ethische Aspekte im Vordergrund. Google DeepMind betont seinen ganzheitlichen Ansatz, der von der Motorsteuerung bis zum semantischen Verständnis reicht. Das Unternehmen hat auch einen neuen Datensatz namens ASIMOV veröffentlicht, der die Bewertung und Verbesserung der semantischen Sicherheit in der verkörperten KI und Robotik ermöglichen soll.

Gemini Robotics: Geschicklichkeit des neuen DeepMind-Modells

Gemini Robotics und Gemini Robotics-ER markieren einen bedeutenden Schritt in Richtung alltagstauglicher, vielseitiger Roboter. Die Fähigkeit, natürliche Sprache zu verstehen und komplexe Aufgaben auszuführen, könnte die Mensch-Roboter-Interaktion revolutionieren. Von Haushaltsrobotern bis hin zu industriellen Anwendungen - die Einsatzmöglichkeiten scheinen vielfältig.

Was denkt ihr über diese Entwicklung? Seht ihr eher Chancen oder Risiken in der Verbindung von KI und Robotik? Teilt eure Gedanken in den Kommentaren mit uns!

Zusammenfassung
  • Google DeepMind stellt KI-Modelle für flexiblere Robotersteuerung vor
  • Gemini Robotics vereint Bildverarbeitung, Sprache und physische Aktionen
  • KI-Roboter können komplexe Aufgaben auf Sprachbefehle hin ausführen
  • Gemini Robotics-ER verbessert räumliches Denken für Roboteranwendungen
  • Entwicklung zielt auf alltagstaugliche und vielseitige Robotersysteme ab
  • Sicherheit und ethische Aspekte stehen bei der Entwicklung im Vordergrund
  • Potenzial für Revolution der Mensch-Roboter-Interaktion in vielen Bereichen

Siehe auch:


Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!