設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

自主操作電腦的多模態(tài) Agent 升級,智譜 GLM-PC 開放體驗

2025/1/23 14:12:56 來源:IT之家 作者:歸瀧(實習(xí)) 責(zé)編:歸瀧
感謝IT之家網(wǎng)友 有鯽雪狐、軟媒新友2335129 的線索投遞!

IT之家 1 月 23 日消息,北京智譜華章科技有限公司今日發(fā)文宣布,旗下智譜 GLM-PC 開放體驗,宣稱“自主操作電腦的多模態(tài) Agent 再升級”。

圖片

據(jù)介紹,GLM-PC 是基于智譜多模態(tài)大模型 CogAgent,全球首個面向公眾、回車即用的電腦智能體(agent)。它能像人類一樣「觀察」和「操作」計算機,協(xié)助用戶完成各類電腦任務(wù)。GLM-PC v1.0 于 2024 年 11 月 29 日發(fā)布并開放內(nèi)測,目前最新推出「深度思考」模式、增加專用于做邏輯推理和代碼生成的功能、并提供了對 Windows 系統(tǒng)的支持。

IT之家從智譜官方獲悉,GLM-PC 具備如下能力:

代碼生成與邏輯執(zhí)行

  • 規(guī)劃:支持綜合分析目標(biāo)以及可用資源,生成執(zhí)行路線圖,并將大型任務(wù)自動分解為可管理的子任務(wù),以構(gòu)建出清晰的執(zhí)行路徑。

  • 循環(huán)執(zhí)行:規(guī)劃階段結(jié)束后,支持啟動代碼生成模塊,執(zhí)行邏輯循環(huán),逐步推進(jìn)任務(wù)完成。該循環(huán)機制確保了任務(wù)的精確執(zhí)行與高度自動化,從而實現(xiàn)從輸入到輸出的完整閉環(huán),無需人工干預(yù)

  • 長思考能力:支持實時調(diào)整、反思修正和自我糾錯,持續(xù)優(yōu)化解決方案。具體表現(xiàn)為:流程因外部因素中斷時,可重構(gòu)邏輯路徑;遇到信息缺失時,可主動與用戶進(jìn)行交互,通過提問來完善任務(wù)執(zhí)行方案

圖像與 GUI 認(rèn)知

  • GUI 圖像理解:準(zhǔn)確識別圖形界面元素(如按鈕、圖標(biāo)、布局等),并理解其功能與交互邏輯

  • 用戶行為認(rèn)知:結(jié)合對用戶界面的學(xué)習(xí)及歷史操作信息的理解,為用戶提供當(dāng)前界面的智能推薦操作

  • 圖像語義解析:對復(fù)雜圖像進(jìn)行深入語義分析,提取關(guān)鍵信息如文字、標(biāo)識符及數(shù)據(jù)可視化圖表中的趨勢和指標(biāo)

  • 多模態(tài)信息融合:融合圖像與文字信息,形成全面感知結(jié)果。例如,在用戶界面中同時識別按鈕位置與文字標(biāo)簽,助力「左腦」制定精準(zhǔn)操作計劃

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI,智譜,GLMPC

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知