和操作員,開放人工智慧在人工智慧融入日常生活方面又邁出了一步。該代理利用了高級推理能力GPT-4, 能透過整合瀏覽器直接與網站交互。
營運商:一種新的網路自主人工智慧
Operator 代理程式基於名為 Computer-Using Agent 的模型,該模型結合了先進的電腦視覺功能和機器學習增強的推理功能。在實踐中,該工具能夠查閱網頁,透過模擬鍵盤和滑鼠的動作與網頁進行交互,甚至在遇到障礙時進行自我修正。
OpenAI 指定該代理商可以完成各種任務,例如透過 DoorDash 等合作夥伴平台(目前是美國)預訂餐廳或訂購服務,優步或 Instacart。與基於 API 的整合不同,Operator 使用螢幕截圖以及與網站 GUI 的即時互動來自主工作。但該工具也有其限制:複雜的介面(例如建立簡報或管理日曆)仍然會帶來困難。
人為控制還是有必要的
Operator 旨在執行敏感操作(例如發送電子郵件或輸入機密資訊)之前請求使用者批准。此外,它還拒絕可能被視為有害或不適當的請求。
Operator 的研究預覽,它是一個可以使用自己的瀏覽器為您執行任務的代理。pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI)2025 年 1 月 23 日
目前,Operator 僅在美國可用,並為計劃訂閱者保留ChatGPT Pro,每月費用 200 美元。儘管如此,OpenAI 計劃逐步擴大對其他類型訂閱的訪問,例如 Plus、Team 和 Enterprise 產品,並將 Operator 功能直接整合到聊天GPT。
如果這個工具看起來很有前途,開放人工智慧呼籲謹慎行事,並回顧操作員仍處於測試階段,在某些情況下可能無法最佳工作。如果你想在法國使用並且你願意花200美元,你總是會經過VPN 優惠券讓 OpenAI 工具相信您在美國。
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇
來源 : 開放人工智慧