Maus-Arbeit: Claude-KI kann die Steuerung des Computers übernehmen
Das KI-Unternehmen Anthropic hat ein neues Tool vorgestellt, das selbstständig Aufgaben am Rechner des Nutzers übernehmen kann. Es simuliert dafür einen User, übernimmt Maus-Eingaben und kann verschiedene alltägliche Aufgaben komplett übernehmen.
Das Tool kann Aufgaben ausführen, indem es den Bildschirm betrachtet, den Mauszeiger bewegt, Schaltflächen anklickt und Texte eingibt. Um dies zu ermöglichen, analysiert die Claude-KI Screenshots des Bildschirms, zählt die Pixel und bestimmt, wohin etwa der Mauspfeil bewegt werden muss.
Allerdings gibt es auch Einschränkungen. Das Tool arbeitet nicht mit einem Live-Video-Stream, sondern mit schnellen aufeinanderfolgenden Screenshots. Dadurch kann es kurzlebige Benachrichtigungen oder andere Bildschirmänderungen verpassen. Auch einfache Aktionen wie Drag-and-drop sind dem Tool bisher nicht möglich, hieß es. Zudem sei es manchmal noch "umständlich und fehleranfällig", räumt Anthropic ein. In einem Beispiel aus der Testphase wurde berichtet, dass das System aus unbekannten eine Programmieraufgabe unbeendet ließ und stattdessen begann, Bilder des Yellowstone-Nationalparks zu durchstöbern - was allerdings auch stark an einen menschlichen User erinnern kann.
In einer Demo zeigt Anthropic, wie die KI die Aufgabe bekommt, eine Datensammlung um die Informationen über ein bestimmtes Unternehmen zu ergänzen. Die KI wechselt dafür in den Browser, nutzt dort die Suchfunktion und holt sich die benötigten Daten von einer Webseite. Diese überträgt das Tool anschließend in das passende Formular. Anthropic hat "Computer Use" für öffentliche Tests freigegeben, um mögliche Probleme zu finden und das Tool gemeinsam mit externen Nutzern zu verbessern.
Siehe auch:
Automatisierung von Routine-Aufgaben
Das Feature, das im Rahmen der Weiterentwicklungen von Anthropics Claude- und Haiku-Modellen präsentiert wurde, heißt schlicht "Computer Use" und ist derzeit nur über die API des mittleren Modells Claude 3.5 Sonnet verfügbar. Mit "Computer Use" können Nutzer dem KI-System mehrschrittige Anweisungen geben, die laut Anthropic aus Dutzenden oder sogar Hunderten von Schritten bestehen können.Das Tool kann Aufgaben ausführen, indem es den Bildschirm betrachtet, den Mauszeiger bewegt, Schaltflächen anklickt und Texte eingibt. Um dies zu ermöglichen, analysiert die Claude-KI Screenshots des Bildschirms, zählt die Pixel und bestimmt, wohin etwa der Mauspfeil bewegt werden muss.
Claude-KI erledigt Aufgaben wie ein echter Computer-Nutzer
Allerdings gibt es auch Einschränkungen. Das Tool arbeitet nicht mit einem Live-Video-Stream, sondern mit schnellen aufeinanderfolgenden Screenshots. Dadurch kann es kurzlebige Benachrichtigungen oder andere Bildschirmänderungen verpassen. Auch einfache Aktionen wie Drag-and-drop sind dem Tool bisher nicht möglich, hieß es. Zudem sei es manchmal noch "umständlich und fehleranfällig", räumt Anthropic ein. In einem Beispiel aus der Testphase wurde berichtet, dass das System aus unbekannten eine Programmieraufgabe unbeendet ließ und stattdessen begann, Bilder des Yellowstone-Nationalparks zu durchstöbern - was allerdings auch stark an einen menschlichen User erinnern kann.
Beta läuft
Das Tool befindet sich derzeit in der öffentlichen Beta-Phase, nachdem es zuvor in Zusammenarbeit mit Unternehmen wie Amazon, Canva, Asana und Notion getestet wurde. Bei der Entwicklung liegt der Fokus auf der Automatisierung häufig vorkommender Aufgaben und der Vereinfachung zeitaufwendiger Arbeiten.In einer Demo zeigt Anthropic, wie die KI die Aufgabe bekommt, eine Datensammlung um die Informationen über ein bestimmtes Unternehmen zu ergänzen. Die KI wechselt dafür in den Browser, nutzt dort die Suchfunktion und holt sich die benötigten Daten von einer Webseite. Diese überträgt das Tool anschließend in das passende Formular. Anthropic hat "Computer Use" für öffentliche Tests freigegeben, um mögliche Probleme zu finden und das Tool gemeinsam mit externen Nutzern zu verbessern.
Zusammenfassung
- Anthropic stellt neues KI-Tool 'Computer Use' für Aufgabenübernahme vor
- Tool simuliert Nutzerverhalten und übernimmt Maus- und Tastatureingaben
- Analyse von Screenshots ermöglicht präzise Steuerung des Mauszeigers
- Einschränkungen: Kein Livestream, keine Drag-and-drop-Funktionalität
- Öffentliche Beta-Phase nach Tests mit großen Unternehmen gestartet
- Ziel: Automatisierung häufiger Aufgaben und Vereinfachung zeitintensiver Arbeiten
- Die Demo zeigt Datenrecherche und -übertragung durch KI-gesteuerte Browsernutzung
Siehe auch:
Thema:
Videos zum Thema KI
- Super Bowl 2026: OpenAI lässt uns mit Codex Neues erschaffen
- Super Bowl 2026: Claude verrät, wie man einen Sixpack bekommt
- Anthropic Claude macht sich über Werbung in ChatGPT lustig
- Super Bowl 2025: OpenAI heißt uns im KI-Zeitalter willkommen
- Bing mit ChatGPT: Microsoft stellt seinen "Kopilot fürs Netz" vor
Beliebte KI-Downloads
Interessante Links
Neue Nachrichten
- Wird Windows Version 27H2 das größte Update seit Langem?
- Kunde zahlt RTX 5070, doch Amazon liefert nur einen alten DVD-Brenner
- Disney+ europaweit eingeschränkt: Dolby-Vision-Streit geht weiter
- Nach Flugzeugabsturz: Spielebranche trauert um Ubisoft-Gründer
- Galaxy Watch 9 & Ultra 2: Leak enthüllt Design der neuen Smartwatches
- Neue Weekend-Deals sind da: Media Markt & Saturn senken die Preise
- Aktuelle Technik-Blitzangebote von Amazon im Überblick
❤ WinFuture unterstützen
Sie wollen online einkaufen?
Dann nutzen Sie bitte einen der folgenden Links,
um WinFuture zu unterstützen:
Vielen Dank!
Alle Kommentare zu dieser News anzeigen