OpenAI startet Operator:
Tool übernimmt Routine-Arbeiten am PC

Der KI-Entwickler OpenAI hat mit Operator ein neues Werkzeug zur Computer-Automation vorgestellt. Basierend auf dem Computer-Using Agent (CUA), einem neuen KI-Modell, ermöglicht Operator die Steuerung von Computern über eine visuelle Oberfläche.
OpenAI, ChatGPT

KI nutzt Maus und Tastatur

Das Tool interagiert mit dem Rechner also ähnlich, wie ein Mensch es per Maus und Tastatur tun würde. Operator ist derzeit für Abonnenten des ChatGPT Pro-Tarifs unter operator.chatgpt.com verfügbar und soll später auch für Nutzer von Plus-, Team- und Enterprise-Abos eingeführt werden. OpenAI plant zudem, CUA in die ChatGPT-Funktionen zu integrieren und Entwicklern über eine API zugänglich zu machen.

Das System arbeitet in mehreren Schritten: Es erstellt Screenshots, analysiert diese mithilfe der visuellen Fähigkeiten von GPT-4o und entscheidet auf Basis der Bilddaten, welche Aktionen wie Klicken oder Tippen ausgeführt werden sollen. Diese iterative Vorgehensweise erlaubt es Operator, Fehler zu korrigieren und auch komplexere Aufgaben zu bewältigen.

OpenAI zeigt, wie Operator ein Rezept sucht und die Zutaten bestellt

Laut OpenAI eignet sich Operator besonders gut für wiederkehrende Webaufgaben, wie das Erstellen von Einkaufslisten oder Playlists. Schwächen zeigt das System hingegen bei komplexen Aufgaben, etwa der Bearbeitung von Tabellen oder Kalendern.

In internen Tests erreichte das Modell auf dem WebVoyager-Benchmark (Tests mit Live-Websites wie Amazon) eine Erfolgsquote von 87 Prozent. Auf dem WebArena-Benchmark, der Offline-Testseiten nutzt, fiel die Erfolgsquote jedoch auf 58,1 Prozent. Bei Aufgaben innerhalb eines Betriebssystems erreichte CUA einen Erfolg von 38,1 Prozent und übertraf damit frühere Modelle, blieb jedoch hinter menschlicher Leistung (72,4 Prozent) zurück.

Datenschutz ist schwierig

Da Operator Zugriff auf den Bildschirminhalt hat und diesen an OpenAI-Server sendet, sind Datenschutz und Sicherheit zentrale Themen. OpenAI betont, mehrere Sicherheitsmaßnahmen integriert zu haben. So benötigt das System eine Bestätigung des Nutzers, bevor sensible Aktionen wie das Senden von E-Mails oder Einkäufe ausgeführt werden. Zudem sind bestimmte Websites, etwa Glücksspielseiten, gesperrt.

Ein weiteres Problem bleibt die Anfälligkeit für Angriffe, etwa durch sogenannte Prompt-Injections, bei denen das Modell manipuliert wird. OpenAI gibt zu, dass trotz umfassender Tests nicht alle Risiken vollständig ausgeschlossen werden können. Nutzer können laut OpenAI jedoch ihre Daten schützen, indem sie beispielsweise alle Browserdaten mit einem Klick löschen oder den Take-over-Modus aktivieren, um sensible Eingaben wie Passwörter zu sichern.

Zusammenfassung
  • OpenAI stellt Operator vor: KI-Tool zur Computer-Automation
  • Basiert auf CUA-Modell und steuert den Rechner visuell
  • Verfügbar für ChatGPT Pro-Abonnenten, Erweiterung geplant
  • Operator arbeitet schrittweise mit Screenshots und GPT-4o
  • Geeignet für Webaufgaben, Schwächen bei komplexeren Tätigkeiten
  • Erfolgsquoten variieren je nach Benchmark und Aufgabenbereich
  • Datenschutz und Sicherheit: OpenAI implementiert Schutzmaßnahmen

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!