IT之家 10 月 23 日消息,當地時間 10 月 22 日,Anthropic 推出了升級版的 Claude 3.5 Sonnet 以及新的 Claude 3.5 Haiku 模型,升級版 Claude 3.5 Sonnet 不僅編程能力更強,還帶來全新功能 computer use(計算機使用),支持像人類一樣操作計算機,可以遵循用戶的命令在計算機屏幕上移動光標,點擊相關位置,并通過虛擬鍵盤輸入信息,模擬人們與自己計算機的交互方式。
IT之家注意到,升級版 Claude 3.5 Sonnet 現已可以使用,computer use 測試版也已開放使用。
進化后的 Claude 3.5 Sonnet 在各個方面得到了全面顯著的提升,尤其是業(yè)界領先的編碼能力。
Anthropic 首席科學官 Jared Kaplan 表示:“我認為我們將進入一個新時代,模型可以像人一樣使用所有的工具來完成任務?!?/p>
升級版 Claude 3.5 Sonnet 的發(fā)布標志著 Anthropic 在商業(yè) AI 模型領域的一項重要進展。該模型旨在超越傳統的聊天框,成為真正的“AI 代理”。
所謂的“AI 代理”是指能夠像人類一樣使用軟件并執(zhí)行其他計算機任務的 AI 模型。有些 AI 代理,如 Cognition AI 的 Devin,專門用于編程。而 Anthropic 則將其 AI 代理定位為一個多面手,聲稱它可以瀏覽網頁并使用任何網站或應用程序。用戶可以根據自己的需求來使用 AI 代理,無論是編程等技術任務,還是旅行規(guī)劃等簡單任務。
在 Wired 描述的一個演示中,Claude 被要求規(guī)劃一次與朋友一起在日出時觀看金門大橋的旅行。AI 打開了一個網頁瀏覽器,在谷歌上搜索了一個好的觀景點和其他細節(jié),并將行程添加到日歷應用程序中。雖然令人印象深刻,但 Wired 指出,Claude 沒有考慮到其他有用的細節(jié),比如如何到達那里。
在另一個演示中,Claude 被要求創(chuàng)建一個簡單的網站,它使用微軟的 Visual Studio Code 來完成這項任務,甚至打開了一個本地服務器來測試它剛剛創(chuàng)建的網站。雖然在創(chuàng)建過程中出現了一個小錯誤,但當給予提示后,其糾正了代碼。
然而,盡管這些 AI 模型看起來很有前景,但它們仍然存在可靠性的問題,尤其是在編寫代碼方面,Anthropic 的模型也不例外。據 TechCrunch 報道,即使在簡單的測試中,如預訂航班和修改預訂,Claude 3.5 Sonnet 也只成功完成了不到一半的任務。
除了技術上的不完善,AI 代理還帶來了明顯的安全風險。用戶是否愿意讓這些不穩(wěn)定且有時難以預測的技術訪問個人電腦文件并使用網絡瀏覽器,仍是一個值得深思的問題。
Anthropic 對此表示,通過逐步開放這種有限、相對更安全的 AI 模型,能夠幫助提升 AI 代理的安全性。他們在聲明中寫道:“我們認為,與其等到更強大的模型出現,不如讓現有較為安全的模型接觸電腦,這樣我們可以開始觀察并應對潛在問題,在提升使用水平的同時逐步增強安全措施?!?/p>
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。