OpenAI 推出可独立执行任务的自动代理 "操作员"-电脑志

OpenAI 发布了一款新的人工智能代理 Operator，它可以浏览网页并独立完成任务。Operator 不仅仅是一个聊天机器人，它还能浏览网站、点击按钮、填写表格并独立完成任务。

当你向 Operator 下达任务时，它会将任务分解成更小的步骤。OpenAI 在现场直播中展示的一个例子是，Operator 在收到一张手写购物单的图片后，被要求从 Instacart 订购杂货。操作员在云上启动了一个浏览器实例，能够打开 Instacart 的网站，搜索单个商品并将其添加到购物车，甚至还能完成结账（不过在网站上执行任何不可逆的操作之前，它仍需要用户在各个步骤上进行确认）。

操作员使用计算机使用代理（CUA）模型，该模型结合了 GPT 4o 的视觉功能和通过强化学习进行的高级推理。该模型专门设计用于与图形用户界面（GUI）进行交互，基本上可以让人工智能通过屏幕截图 “看到” 网页，并使用鼠标和键盘操作与网页进行交互。

该模型甚至还能在遇到挑战时进行自我修正，并在需要时将控制权交还给用户，以确保它不会失控并开始自动做事。这对处理付款或其他敏感信息等敏感任务尤其有用。

小米小爱同学在内：新一批国产AI大模型通过备案

到目前为止，Operator 只是一个研究预览版，只对美国的 ChatGPT Pro 用户开放，不过 OpenAI 承诺在未来几个月内将其推广到其他地区。由于更严格的合规性要求，欧盟地区的用户可能需要再等一等。

您可以点击下面的链接阅读 OpenAI 运营商的完整公告：