OpenAI startet Operator:
Tool übernimmt Routine-Arbeiten am PC
Der KI-Entwickler OpenAI hat mit Operator ein neues Werkzeug zur Computer-Automation vorgestellt. Basierend auf dem Computer-Using Agent (CUA), einem neuen KI-Modell, ermöglicht Operator die Steuerung von Computern über eine visuelle Oberfläche.
Das System arbeitet in mehreren Schritten: Es erstellt Screenshots, analysiert diese mithilfe der visuellen Fähigkeiten von GPT-4o und entscheidet auf Basis der Bilddaten, welche Aktionen wie Klicken oder Tippen ausgeführt werden sollen. Diese iterative Vorgehensweise erlaubt es Operator, Fehler zu korrigieren und auch komplexere Aufgaben zu bewältigen.
Laut OpenAI eignet sich Operator besonders gut für wiederkehrende Webaufgaben, wie das Erstellen von Einkaufslisten oder Playlists. Schwächen zeigt das System hingegen bei komplexen Aufgaben, etwa der Bearbeitung von Tabellen oder Kalendern.
In internen Tests erreichte das Modell auf dem WebVoyager-Benchmark (Tests mit Live-Websites wie Amazon) eine Erfolgsquote von 87 Prozent. Auf dem WebArena-Benchmark, der Offline-Testseiten nutzt, fiel die Erfolgsquote jedoch auf 58,1 Prozent. Bei Aufgaben innerhalb eines Betriebssystems erreichte CUA einen Erfolg von 38,1 Prozent und übertraf damit frühere Modelle, blieb jedoch hinter menschlicher Leistung (72,4 Prozent) zurück.
Ein weiteres Problem bleibt die Anfälligkeit für Angriffe, etwa durch sogenannte Prompt-Injections, bei denen das Modell manipuliert wird. OpenAI gibt zu, dass trotz umfassender Tests nicht alle Risiken vollständig ausgeschlossen werden können. Nutzer können laut OpenAI jedoch ihre Daten schützen, indem sie beispielsweise alle Browserdaten mit einem Klick löschen oder den Take-over-Modus aktivieren, um sensible Eingaben wie Passwörter zu sichern.
Siehe auch:
KI nutzt Maus und Tastatur
Das Tool interagiert mit dem Rechner also ähnlich, wie ein Mensch es per Maus und Tastatur tun würde. Operator ist derzeit für Abonnenten des ChatGPT Pro-Tarifs unter operator.chatgpt.com verfügbar und soll später auch für Nutzer von Plus-, Team- und Enterprise-Abos eingeführt werden. OpenAI plant zudem, CUA in die ChatGPT-Funktionen zu integrieren und Entwicklern über eine API zugänglich zu machen.Das System arbeitet in mehreren Schritten: Es erstellt Screenshots, analysiert diese mithilfe der visuellen Fähigkeiten von GPT-4o und entscheidet auf Basis der Bilddaten, welche Aktionen wie Klicken oder Tippen ausgeführt werden sollen. Diese iterative Vorgehensweise erlaubt es Operator, Fehler zu korrigieren und auch komplexere Aufgaben zu bewältigen.
OpenAI zeigt, wie Operator ein Rezept sucht und die Zutaten bestellt
Laut OpenAI eignet sich Operator besonders gut für wiederkehrende Webaufgaben, wie das Erstellen von Einkaufslisten oder Playlists. Schwächen zeigt das System hingegen bei komplexen Aufgaben, etwa der Bearbeitung von Tabellen oder Kalendern.
In internen Tests erreichte das Modell auf dem WebVoyager-Benchmark (Tests mit Live-Websites wie Amazon) eine Erfolgsquote von 87 Prozent. Auf dem WebArena-Benchmark, der Offline-Testseiten nutzt, fiel die Erfolgsquote jedoch auf 58,1 Prozent. Bei Aufgaben innerhalb eines Betriebssystems erreichte CUA einen Erfolg von 38,1 Prozent und übertraf damit frühere Modelle, blieb jedoch hinter menschlicher Leistung (72,4 Prozent) zurück.
Datenschutz ist schwierig
Da Operator Zugriff auf den Bildschirminhalt hat und diesen an OpenAI-Server sendet, sind Datenschutz und Sicherheit zentrale Themen. OpenAI betont, mehrere Sicherheitsmaßnahmen integriert zu haben. So benötigt das System eine Bestätigung des Nutzers, bevor sensible Aktionen wie das Senden von E-Mails oder Einkäufe ausgeführt werden. Zudem sind bestimmte Websites, etwa Glücksspielseiten, gesperrt.Ein weiteres Problem bleibt die Anfälligkeit für Angriffe, etwa durch sogenannte Prompt-Injections, bei denen das Modell manipuliert wird. OpenAI gibt zu, dass trotz umfassender Tests nicht alle Risiken vollständig ausgeschlossen werden können. Nutzer können laut OpenAI jedoch ihre Daten schützen, indem sie beispielsweise alle Browserdaten mit einem Klick löschen oder den Take-over-Modus aktivieren, um sensible Eingaben wie Passwörter zu sichern.
Zusammenfassung
- OpenAI stellt Operator vor: KI-Tool zur Computer-Automation
- Basiert auf CUA-Modell und steuert den Rechner visuell
- Verfügbar für ChatGPT Pro-Abonnenten, Erweiterung geplant
- Operator arbeitet schrittweise mit Screenshots und GPT-4o
- Geeignet für Webaufgaben, Schwächen bei komplexeren Tätigkeiten
- Erfolgsquoten variieren je nach Benchmark und Aufgabenbereich
- Datenschutz und Sicherheit: OpenAI implementiert Schutzmaßnahmen
Siehe auch:
Thema:
Videos zum Thema OpenAI
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Anthropic Claude macht sich über Werbung in ChatGPT lustig
- Super Bowl 2025: OpenAI heißt uns im KI-Zeitalter willkommen
- Microsoft stellt das neue Bing und vieles mehr für Windows 11 vor
- Bing mit ChatGPT: Microsoft stellt seinen "Kopilot fürs Netz" vor
Beliebte OpenAI-Downloads
Interessante Links
Neue Nachrichten
- Aktuelle Technik-Blitzangebote von Amazon im Überblick
- The Witcher: CD Projekt plant angeblich neues Multiplayer-Spiel
- Forscher bauen aus alten Handys erstaunlich leistungsstarke Server
- Xbox-Exodus: Chef von Microsofts Spielestudios geht
- Galaxy A27: Samsung leakt sein neues Jedermann-Smartphone selbst
- Spiele als Dauerwerbesendung: EA plant Reklame 'direkt im Gameplay'
- Nutzen umstritten, UK bannt dennoch Social Media für Unter-16-Jährige
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen