OpenAI 推出可独立执行任务的自动代理 "操作员"

微信扫一扫,分享到朋友圈

OpenAI 推出可独立执行任务的自动代理 "操作员"

OpenAI 发布了一款新的人工智能代理 Operator,它可以浏览网页并独立完成任务。Operator 不仅仅是一个聊天机器人,它还能浏览网站、点击按钮、填写表格并独立完成任务。

OpenAI 推出可独立执行任务的自动代理 "操作员"

当你向 Operator 下达任务时,它会将任务分解成更小的步骤。OpenAI 在现场直播中展示的一个例子是,Operator 在收到一张手写购物单的图片后,被要求从 Instacart 订购杂货。操作员在云上启动了一个浏览器实例,能够打开 Instacart 的网站,搜索单个商品并将其添加到购物车,甚至还能完成结账(不过在网站上执行任何不可逆的操作之前,它仍需要用户在各个步骤上进行确认)。

操作员使用计算机使用代理(CUA)模型,该模型结合了 GPT 4o 的视觉功能和通过强化学习进行的高级推理。该模型专门设计用于与图形用户界面(GUI)进行交互,基本上可以让人工智能通过屏幕截图 “看到” 网页,并使用鼠标和键盘操作与网页进行交互。

该模型甚至还能在遇到挑战时进行自我修正,并在需要时将控制权交还给用户,以确保它不会失控并开始自动做事。这对处理付款或其他敏感信息等敏感任务尤其有用。

到目前为止,Operator 只是一个研究预览版,只对美国的 ChatGPT Pro 用户开放,不过 OpenAI 承诺在未来几个月内将其推广到其他地区。由于更严格的合规性要求,欧盟地区的用户可能需要再等一等。

您可以点击下面的链接阅读 OpenAI 运营商的完整公告:

https://openai.com/index/introducing-operator/

上一篇

AMD Radeon WHQL v25.1.1 显卡驱动下载:优化《蜘蛛侠 2》和《最终幻想 7 重生》

下一篇

传采用 ARM 芯片的 Surface Pro 笔记本电脑将于今年春季面世

你也可能喜欢

评论已经被关闭。

插入图片

公众号

公众号
关注我们

排行榜

返回顶部

欢度春节

烟火起,照人间,举杯敬此年,
烟花落,四季平,举杯贺新岁。
所得皆所愿,所行亦无憾,
岁岁常喜乐,万事皆顺意!