和操作员,开放人工智能在人工智能融入日常生活方面又迈出了一步。该代理利用了高级推理能力GPT-4, 能通过集成浏览器直接与网站交互。
运营商:一种新的网络自主人工智能
Operator 代理基于名为 Computer-Using Agent 的模型,该模型结合了先进的计算机视觉功能和机器学习增强的推理功能。在实践中,该工具能够查阅网页,通过模拟键盘和鼠标的动作与网页进行交互,甚至在遇到障碍时进行自我纠正。
OpenAI 指定该代理可以完成各种任务,例如通过 DoorDash 等合作伙伴平台(目前是美国)预订餐厅或订购服务,优步或 Instacart。与基于 API 的集成不同,Operator 使用屏幕截图以及与站点 GUI 的实时交互来自主工作。但该工具也有其局限性:复杂的界面(例如创建演示文稿或管理日历)仍然会带来困难。
人为控制还是有必要的
Operator 旨在在执行敏感操作(例如发送电子邮件或输入机密信息)之前请求用户批准。此外,它还拒绝可能被视为有害或不适当的请求。
Operator 的研究预览,它是一个可以使用自己的浏览器为您执行任务的代理。pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI)2025 年 1 月 23 日
目前,Operator 仅在美国可用,并为计划订阅者保留ChatGPT Pro,每月费用 200 美元。尽管如此,OpenAI 计划逐步扩大对其他类型订阅的访问,例如 Plus、Team 和 Enterprise 产品,并将 Operator 功能直接集成到聊天GPT。
如果这个工具看起来很有前途,开放人工智能呼吁谨慎行事,并回顾操作员仍处于测试阶段,在某些情况下可能无法最佳工作。如果你想在法国使用并且你愿意花200美元,你总是会经过VPN 优惠券让 OpenAI 工具相信您在美国。
Opera One - AI 驱动的网络浏览器
作者:歌剧
来源 : 开放人工智能