OpenAI 发布了一款新的人工智能代理 Operator,它可以浏览网页并独立完成任务。Operator 不仅仅是一个聊天机器人,它还能浏览网站、点击按钮、填写表格并独立完成任务。
当你向 Operator 下达任务时,它会将任务分解成更小的步骤。OpenAI 在现场直播中展示的一个例子是,Operator 在收到一张手写购物单的图片后,被要求从 Instacart 订购杂货。操作员在云上启动了一个浏览器实例,能够打开 Instacart 的网站,搜索单个商品并将其添加到购物车,甚至还能完成结账(不过在网站上执行任何不可逆的操作之前,它仍需要用户在各个步骤上进行确认)。
操作员使用计算机使用代理(CUA)模型,该模型结合了 GPT 4o 的视觉功能和通过强化学习进行的高级推理。该模型专门设计用于与图形用户界面(GUI)进行交互,基本上可以让人工智能通过屏幕截图 “看到” 网页,并使用鼠标和键盘操作与网页进行交互。
该模型甚至还能在遇到挑战时进行自我修正,并在需要时将控制权交还给用户,以确保它不会失控并开始自动做事。这对处理付款或其他敏感信息等敏感任务尤其有用。
到目前为止,Operator 只是一个研究预览版,只对美国的 ChatGPT Pro 用户开放,不过 OpenAI 承诺在未来几个月内将其推广到其他地区。由于更严格的合规性要求,欧盟地区的用户可能需要再等一等。
您可以点击下面的链接阅读 OpenAI 运营商的完整公告: