百度集團副總裁吳甜：文心大模型 3.5 能力已經(jīng)超出 ChatGPT 3.5

2023/7/19 16:40:10 來源：網(wǎng)易科技作者：一橙責(zé)編：遠洋

評論：

7 月 19 日消息，“新版本文心一言的能力已經(jīng)超出 ChatGPT 3.5，這也是在我們國內(nèi)開展相關(guān)技術(shù)工作重要的里程碑?！卑俣燃瘓F副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜向網(wǎng)易科技等媒體表示。

她介紹，IDC 最新發(fā)布的《AI 大模型技術(shù)能力評估報告，2023》顯示，百度文心大模型 3.5 拿下 12 項指標的 7 個滿分，綜合評分第一，算法模型第一，行業(yè)覆蓋第一。

據(jù)悉，IDC 評估報告圍繞產(chǎn)品技術(shù)、服務(wù)生態(tài)以及行業(yè)應(yīng)用三大維度，考察大模型的 10 余項指標，國內(nèi)主流大模型包括百度、阿里、騰訊、華為、科大訊飛、360、商湯等 14 家廠商參與了本次評估。報告結(jié)果顯示，百度文心在模型能力、工具平臺、生態(tài)布局以及行業(yè)覆蓋上優(yōu)勢明顯，并已提前進入商業(yè)化落地探索階段。

吳甜介紹，百度自 2019 年開始深耕預(yù)訓(xùn)練模型研發(fā)，先后發(fā)布知識增強文心系列模型。前不久，百度正式發(fā)布文心大模型 3.5 版本，進一步在基礎(chǔ)模型、知識增強、檢索增強等多項核心技術(shù)上取得創(chuàng)新，新版本在各項能力上均有明顯提升。

具體而言，她表示文心大模型取得“第一”得益于百度“芯片-框架-模型-應(yīng)用”四層技術(shù)棧優(yōu)勢、知識增強的核心特色和繁榮的大模型生態(tài)三大優(yōu)勢。尤其是百度擁有自研的深度學(xué)習(xí)平臺飛槳有力支撐了大模型的高效訓(xùn)練和推理。飛槳與文心的協(xié)同優(yōu)化，讓文心大模型 3.5 最新版本的模型效果提升 50%，訓(xùn)練速度提升 2 倍，推理速度提升 30 倍。

在大模型生態(tài)方面，她介紹，百度文心已形成企業(yè)、教育、社區(qū)三位一體的生態(tài)體系。最新數(shù)據(jù)顯示，百度有超過 750 萬開發(fā)者基礎(chǔ)，20 萬企業(yè)生態(tài)基礎(chǔ)，多層次開展大模型人才培訓(xùn)、企業(yè)賦能、開發(fā)者運營。百度還設(shè)立了 10 億創(chuàng)投基金鼓勵大模型創(chuàng)意、繁榮大模型生態(tài)。

她直言，目前大模型產(chǎn)業(yè)化仍面臨著巨大的挑戰(zhàn)，總結(jié)起來有三方面：首先是大模型的體積確實很大，帶來的訓(xùn)練難度高、成本高；第二是對算力規(guī)模要求非常大，性能要求非常高；第三在于數(shù)據(jù)規(guī)模也很大，收集、挖掘、建設(shè)、篩選、清洗這些數(shù)據(jù)，本身也是非常大的大工程?！按竽Ｐ推脚_是價格昂貴的大算力系統(tǒng)，其實完全不需要存在大量的大模型，對于應(yīng)用者來說也不需要每個應(yīng)用都進行大模型的開發(fā)?！?/p>

至于“百模大戰(zhàn)”的終局是怎樣的？吳甜談到，“過去短短幾個月時間，大量新的大模型出現(xiàn)，但這是個階段現(xiàn)象，未來各個企業(yè)和機構(gòu)會逐漸找到自己的定位，下一步會走向自己細分的方向，終局只會集中在少量的幾個大模型，但依托幾個少量大模型，會有非常廣泛的應(yīng)用生態(tài)出現(xiàn)?！?/p>

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

百度集團副總裁吳甜：文心大模型 3.5 能力已經(jīng)超出 ChatGPT 3.5

相關(guān)文章