IT之家 1 月 24 日消息,OpenAI 公司昨日(1 月 23 日)發(fā)布博文,宣布推出名為“Operator”的 AI 智能體,使用自己的瀏覽器為用戶執(zhí)行任務(wù),現(xiàn)階段僅向美國(guó) Pro 訂閱用戶開(kāi)放。
IT之家援引博文介紹,Operator 使用自家瀏覽器,可以執(zhí)行填寫(xiě)表單、訂購(gòu)雜貨,甚至創(chuàng)建表情包等各種重復(fù)的瀏覽器任務(wù)。
Operator 向美國(guó)的 Pro 版訂閱用戶開(kāi)放,網(wǎng)址為 operator.chatgpt.com,后續(xù)將擴(kuò)展到 Plus、Team 和 Enterprise 用戶,并在未來(lái)將這些功能集成到 ChatGPT 中。
Operator 由名為 Computer-Using Agent(CUA)的新型模型驅(qū)動(dòng)。CUA 結(jié)合了 GPT-4 的視覺(jué)功能和通過(guò)強(qiáng)化學(xué)習(xí)獲得的高級(jí)推理能力,經(jīng)過(guò)訓(xùn)練可以與圖形用戶界面(GUI,即人們?cè)谄聊簧峡吹降陌粹o、菜單和文本字段)進(jìn)行交互。
Operator 可以通過(guò)屏幕截圖“看到”瀏覽器內(nèi)容,并使用鼠標(biāo)和鍵盤允許的所有操作進(jìn)行“交互”,從而能夠在無(wú)需自定義 API 集成的情況下在網(wǎng)絡(luò)上采取行動(dòng)。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。