OpenAI’s Operator: A New AI Agent for Internet Tasks

Operator : OpenAI's Operator: A New AI Agent for Internet Tasks

OpenAI hat eine frühe Version seines ersten KI-Agenten namens “Operator” veröffentlicht. Dieser Agent kann Aufgaben im Internet ausführen, wie Informationen suchen oder Bestellungen aufgeben. Für kritische Aktionen wie das Eingeben von Zahlungsinformationen oder das Bestätigen von Bestellungen ist jedoch das Eingreifen des Nutzers erforderlich. Der Operator ist derzeit nur für Abonnenten von ChatGPT Pro in den USA verfügbar. Die Entwickler planen, den Zugang in den kommenden Wochen zu erweitern, wobei es in Europa noch etwas dauern könnte.

Der Operator verwendet das Internet ähnlich wie ein Mensch. Er hat einen eigenen Browser in der Cloud, mit dem er interagiert, tippt, klickt und scrollt. Diese Schritte werden dem Nutzer visuell dargestellt, sodass er jederzeit die Kontrolle übernehmen kann. Der Operator ist derzeit eine “research preview”, also eine frühe Entwicklerversion. OpenAI stellt ihn einer begrenzten Nutzergruppe zur Verfügung, um mehr über seine Funktionsweise zu lernen. Ein Abonnement von ChatGPT Pro kostet 200 Dollar.

Der Operator basiert auf einem neuen KI-Modell namens “Computer-Using Agent” (CUA). Dieses Modell kombiniert die Bildverarbeitungsfähigkeiten von GPT-4 mit Reasoning durch bestärkendes Lernen. Der KI-Agent ist speziell darauf trainiert, grafische Benutzeroberflächen zu bedienen, aber Fehler sind nicht ausgeschlossen. Wenn der Operator nicht weiterkommt, übergibt er die Kontrolle an den Nutzer. Er verweigert beispielsweise den Zugriff auf unsichere Webseiten und bleibt dann stehen. Auch für das Einloggen und die Eingabe von Zahlungsinformationen benötigt der Operator den Nutzer.

OpenAI arbeitet bereits mit Unternehmen wie DoorDash, Instacart, OpenTable, StubHub und Uber zusammen. Nutzer können diese Dienste direkt im Operator auswählen, um Lebensmittel zu bestellen, einen Tisch zu reservieren, Eintrittskarten zu kaufen oder eine Fahrt zu bestellen. Der Nutzer kann dem KI-Agenten auch überlassen, welchen Anbieter er als geeignet erachtet.

OpenAI verspricht, dass sensible Informationen wie Login- oder Kreditkartendaten nicht protokolliert werden. Der Operator ist darauf trainiert, Banktransaktionen oder kritische Entscheidungen wie Bewerbungen abzulehnen. OpenAI gibt jedoch zu, dass die Bestätigung von Bestellungen dem Nutzer überlassen “sollte”. Dies ist vorgesehen, aber nicht garantiert.

Der Operator soll aus Interaktionen mit Menschen lernen, aber Nutzer können verhindern, dass ihre Aufträge für das Training der KI verwendet werden. Diese Option kann in den Einstellungen von ChatGPT deaktiviert werden. Nutzer können auch alle Konversationen mit dem KI-Agenten und den Browser-Verlauf des Operators löschen. OpenAI hat den Operator auch auf bösartige Webseiten trainiert. Wenn Betrugsversuche erkannt werden, stoppt der KI-Agent seine Arbeit und informiert den Nutzer.

Der Operator ist derzeit nur für Abonnenten von ChatGPT Pro in den USA verfügbar. OpenAI plant jedoch, den KI-Agenten bald auch für Plus-, Team- und Enterprise-Nutzer zugänglich zu machen. Die Fähigkeiten sollen in ChatGPT integriert werden, sobald der Operator als sicher genug erachtet wird. Zudem ist geplant, das CUA-Modell per API bereitzustellen, damit Entwickler eigene KI-Agenten erstellen können.

Exit mobile version