OpenAI startet Operator:
Tool übernimmt Routine-Arbeiten am PC

Der KI-Entwickler OpenAI hat mit Operator ein neues Werkzeug zur Computer-Automation vorgestellt. Basierend auf dem Computer-Using Agent (CUA), einem neuen KI-Modell, ermöglicht Operator die Steuerung von Computern über eine visuelle Oberfläche.

Christian Kahle, 24.01.2025 12:26 Uhr

KI nutzt Maus und Tastatur

Das Tool interagiert mit dem Rechner also ähnlich, wie ein Mensch es per Maus und Tastatur tun würde. Operator ist derzeit für Abonnenten des ChatGPT Pro-Tarifs unter operator.chatgpt.com verfügbar und soll später auch für Nutzer von Plus-, Team- und Enterprise-Abos eingeführt werden. OpenAI plant zudem, CUA in die ChatGPT-Funktionen zu integrieren und Entwicklern über eine API zugänglich zu machen.

Das System arbeitet in mehreren Schritten: Es erstellt Screenshots, analysiert diese mithilfe der visuellen Fähigkeiten von GPT-4o und entscheidet auf Basis der Bilddaten, welche Aktionen wie Klicken oder Tippen ausgeführt werden sollen. Diese iterative Vorgehensweise erlaubt es Operator, Fehler zu korrigieren und auch komplexere Aufgaben zu bewältigen.

OpenAI zeigt, wie Operator ein Rezept sucht und die Zutaten bestellt

Laut OpenAI eignet sich Operator besonders gut für wiederkehrende Webaufgaben, wie das Erstellen von Einkaufslisten oder Playlists. Schwächen zeigt das System hingegen bei komplexen Aufgaben, etwa der Bearbeitung von Tabellen oder Kalendern.

In internen Tests erreichte das Modell auf dem WebVoyager-Benchmark (Tests mit Live-Websites wie Amazon) eine Erfolgsquote von 87 Prozent. Auf dem WebArena-Benchmark, der Offline-Testseiten nutzt, fiel die Erfolgsquote jedoch auf 58,1 Prozent. Bei Aufgaben innerhalb eines Betriebssystems erreichte CUA einen Erfolg von 38,1 Prozent und übertraf damit frühere Modelle, blieb jedoch hinter menschlicher Leistung (72,4 Prozent) zurück.

Datenschutz ist schwierig

Da Operator Zugriff auf den Bildschirminhalt hat und diesen an OpenAI-Server sendet, sind Datenschutz und Sicherheit zentrale Themen. OpenAI betont, mehrere Sicherheitsmaßnahmen integriert zu haben. So benötigt das System eine Bestätigung des Nutzers, bevor sensible Aktionen wie das Senden von E-Mails oder Einkäufe ausgeführt werden. Zudem sind bestimmte Websites, etwa Glücksspielseiten, gesperrt.

Ein weiteres Problem bleibt die Anfälligkeit für Angriffe, etwa durch sogenannte Prompt-Injections, bei denen das Modell manipuliert wird. OpenAI gibt zu, dass trotz umfassender Tests nicht alle Risiken vollständig ausgeschlossen werden können. Nutzer können laut OpenAI jedoch ihre Daten schützen, indem sie beispielsweise alle Browserdaten mit einem Klick löschen oder den Take-over-Modus aktivieren, um sensible Eingaben wie Passwörter zu sichern.

Zusammenfassung

OpenAI stellt Operator vor: KI-Tool zur Computer-Automation
Basiert auf CUA-Modell und steuert den Rechner visuell
Verfügbar für ChatGPT Pro-Abonnenten, Erweiterung geplant
Operator arbeitet schrittweise mit Screenshots und GPT-4o
Geeignet für Webaufgaben, Schwächen bei komplexeren Tätigkeiten
Erfolgsquoten variieren je nach Benchmark und Aufgabenbereich
Datenschutz und Sicherheit: OpenAI implementiert Schutzmaßnahmen

Siehe auch:

Thema:

OpenAI

Gefällt dir dieser Artikel? WinFuture in der Google-Suche bevorzugen WinFuture auf folgen

Kommentieren5

Hinweis einsenden

Weitere Nachrichten zum Thema ChatGPT wird Superanalyst: OpenAI stellt "Deep Research" KI-Tool vorOpenAI: Erster Europa-Standort wird in Deutschland eröffnetThe Stargate Project: OpenAI & Partner investieren 500 Mrd. $ in KIOpenAI hat Probleme: GPT-5 ist deutlich verzögert und extrem teuerOpenAI startet nach monatelangen Tests seine Video-KI Sora