設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

2025 年,AI Agent 還會(huì)是風(fēng)口嗎?11 個(gè)問題揭秘智能體技術(shù)發(fā)展全貌

新智元 2024/12/19 15:53:47 責(zé)編:清源

經(jīng)過了 LLM、RAG、多模態(tài)等多輪技術(shù)風(fēng)口的洗禮后,AI 智能體的應(yīng)用現(xiàn)狀究竟如何?Langbase 公司最近發(fā)布的調(diào)查報(bào)告通過 11 個(gè)關(guān)鍵問題,為我們提供了一份有價(jià)值的現(xiàn)狀切面。

2024 年,AI 智能體技術(shù)無疑是科技界的焦點(diǎn)。

通過對來自 100 多個(gè)國家的 3400 名開發(fā)者進(jìn)行深入調(diào)查,Langbase 公司近日發(fā)布的一項(xiàng)報(bào)告揭示了智能體開發(fā)中的關(guān)鍵問題。這項(xiàng)調(diào)查的受訪者中,有 46% 是企業(yè)領(lǐng)導(dǎo)層,26% 是工程師。

Langbase 專注于提供無服務(wù)器的 AI 云開發(fā)體驗(yàn)。作為一個(gè)提供可組合基礎(chǔ)設(shè)施的 AI 平臺,他們在 2024 年一共處理了來自 3.6 萬開發(fā)人員的 1840 億個(gè) token 和 7.86 億個(gè) API 請求。

提起 Langbase 這個(gè)名字,你也許不太熟悉。事實(shí)上,這家公司非常年輕,2023 年剛剛成立。

根據(jù) Crunchbase 披露的數(shù)據(jù),他們剛剛才在 9 月份進(jìn)行了 pre-seed 輪融資,但已經(jīng)得到了谷歌、蘋果、OpenAI、微軟等大廠高管們的資金支持。

下面就讓我們一起來看看這家年輕有為的 Langbase 發(fā)布的這份圖文并茂的報(bào)告中究竟提到了哪些內(nèi)容。

問題 1:開發(fā)者在使用哪些基座大模型

在這場 AI 智能體的競賽中,OpenAI 的大模型服務(wù)占據(jù)了主導(dǎo)地位,但谷歌正迅速崛起,成為其強(qiáng)勁的競爭對手,Anthropic 緊隨其后。

其中,Meta 的 Llama、Mistral 和 Cohere 雖然影響力較小,但增長勢頭不容忽視,顯示出基座大模型市場的激烈競爭。

問題 2:不同大模型對應(yīng)的具體用途

OpenAI 在翻譯任務(wù)中被廣泛應(yīng)用,Anthropic 在技術(shù)任務(wù)中備受青睞,而谷歌的模型在健康和翻譯領(lǐng)域占據(jù)主導(dǎo)地位。

此外,Meta 在科技和科學(xué)應(yīng)用中得到了廣泛使用,Cohere 也在多個(gè)領(lǐng)域得到重視,包括科學(xué)和營銷。

問題 3:哪些因素阻礙了你對大模型技術(shù)的應(yīng)用

在模型的擴(kuò)展和部署中,數(shù)據(jù)隱私和安全合規(guī)性成為主要關(guān)注點(diǎn),「缺乏監(jiān)控工具」和「高基礎(chǔ)設(shè)施成本」這兩項(xiàng)因素也阻礙了技術(shù)的落地應(yīng)用。

對 AI 驅(qū)動(dòng)解決方案的抵制或懷疑反映了使用者們的長期顧慮,這表明,模型和技術(shù)的提供商們需要更加透明和用戶友好的 AI 平臺。

問題 4:哪些因素影響大模型的選擇

在選擇大型語言模型(LLM)時(shí),準(zhǔn)確性是最重要的因素,其次是安全性和可定制性,成本的影響相對較小。

問題 5:在部署大模型時(shí),你遇到的最大挑戰(zhàn)是什么

在生產(chǎn)環(huán)境中部署大模型和智能體面臨著種種關(guān)鍵挑戰(zhàn),包括定制困難、質(zhì)量保證評估方法有限,以及缺乏可重用的基礎(chǔ)設(shè)施。

此外,工具碎片化、集成問題和可擴(kuò)展性等方面的顧慮進(jìn)一步復(fù)雜化了這個(gè)過程。

問題 6:采用大模型技術(shù)時(shí),你的主要目標(biāo)是什么

「自動(dòng)化」和「簡化」是 AI 應(yīng)用的首要任務(wù),使公司在效率和流程簡化方面受益;此外,定制解決方案和提升合作流程等方面的目標(biāo),反映了大模型日益增長的靈活性,以及消費(fèi)者對系統(tǒng)共享訪問的興趣。

問題 7:您的公司如何使用大模型智能體

LLM 在軟件開發(fā)中得到廣泛應(yīng)用,尤其在市場營銷、IT 運(yùn)營和文本摘要等方面,客服、人力資源和法律領(lǐng)域的使用興趣也在日益增長。

問題 8:哪些平臺特征對你至關(guān)重要

大多數(shù)受訪者都需要多智能體檢索增強(qiáng)生成(RAG)功能以提高上下文信息處理,同時(shí),評估工具對于確保人工智能系統(tǒng)按預(yù)期工作也很重要。

問題 9,在編排 AI 流水線時(shí),開發(fā)者偏好哪種工具

大多數(shù)受訪者更喜歡能提供靈活、基礎(chǔ)原語的開發(fā)工具以設(shè)計(jì)定制 AI 流水線(pipeline)。預(yù)構(gòu)建的、針對特定問題的解決方案雖然可以直接解決具體問題,但它們的可定制性較低。

問題 10:什么因素影響大模型智能體開發(fā)工具的選擇

開發(fā)者將 AI 智能體的版本控制視為開發(fā)平臺最重要的功能。強(qiáng)大的 SDK 或庫生態(tài)系統(tǒng)以及本地開發(fā)環(huán)境也受到重視。

問題 11:大模型在公司中的應(yīng)用程度

大多數(shù)開發(fā)者將 AI 用于實(shí)驗(yàn)和生產(chǎn)。相比之下,實(shí)驗(yàn)用途的比例遠(yuǎn)遠(yuǎn)大于生產(chǎn)用途,但后者的比例仍在穩(wěn)步前進(jìn)的過程中。

隨著 AI 智能體基礎(chǔ)設(shè)施的成熟,越來越多的企業(yè)會(huì)嘗試開發(fā)智能體,而隨著多模態(tài)及大模型操作計(jì)算環(huán)境(例如 Claude 通過接口在線互動(dòng))的發(fā)展,智能體在 2025 年的應(yīng)用將更加廣泛,甚至不僅僅局限于報(bào)告中提到的軟件開發(fā)、市場營銷、IT 運(yùn)營和文本摘要等領(lǐng)域。

然而,該調(diào)查中揭示的開發(fā)者關(guān)注的問題,例如更看重準(zhǔn)確性、安全性和可定制性,而成本因素影響較小,以及偏好靈活、可定制的 AI 流水線開發(fā)工具,并重視 AI 智能體版本控制功能。

無論技術(shù)怎么進(jìn)步,這份調(diào)查結(jié)果都會(huì)對智能體平臺及開發(fā)者有參考價(jià)值。

參考資料:

  • https://langbase.com/state-of-ai-agents?genai

  • https://x.com/MrAhmadAwais/status/1866483416981786821

本文來自微信公眾號:新智元(ID:AI_era)

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,AI智能體

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知