7 月 19 日消息,“新版本文心一言的能力已經(jīng)超出 ChatGPT 3.5,這也是在我們國內(nèi)開展相關(guān)技術(shù)工作重要的里程碑?!卑俣燃瘓F(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜向網(wǎng)易科技等媒體表示。
她介紹,IDC 最新發(fā)布的《AI 大模型技術(shù)能力評估報告,2023》顯示,百度文心大模型 3.5 拿下 12 項(xiàng)指標(biāo)的 7 個滿分,綜合評分第一,算法模型第一,行業(yè)覆蓋第一。
據(jù)悉,IDC 評估報告圍繞產(chǎn)品技術(shù)、服務(wù)生態(tài)以及行業(yè)應(yīng)用三大維度,考察大模型的 10 余項(xiàng)指標(biāo),國內(nèi)主流大模型包括百度、阿里、騰訊、華為、科大訊飛、360、商湯等 14 家廠商參與了本次評估。報告結(jié)果顯示,百度文心在模型能力、工具平臺、生態(tài)布局以及行業(yè)覆蓋上優(yōu)勢明顯,并已提前進(jìn)入商業(yè)化落地探索階段。
吳甜介紹,百度自 2019 年開始深耕預(yù)訓(xùn)練模型研發(fā),先后發(fā)布知識增強(qiáng)文心系列模型。前不久,百度正式發(fā)布文心大模型 3.5 版本,進(jìn)一步在基礎(chǔ)模型、知識增強(qiáng)、檢索增強(qiáng)等多項(xiàng)核心技術(shù)上取得創(chuàng)新,新版本在各項(xiàng)能力上均有明顯提升。
具體而言,她表示文心大模型取得“第一”得益于百度“芯片-框架-模型-應(yīng)用”四層技術(shù)棧優(yōu)勢、知識增強(qiáng)的核心特色和繁榮的大模型生態(tài)三大優(yōu)勢。尤其是百度擁有自研的深度學(xué)習(xí)平臺飛槳有力支撐了大模型的高效訓(xùn)練和推理。飛槳與文心的協(xié)同優(yōu)化,讓文心大模型 3.5 最新版本的模型效果提升 50%,訓(xùn)練速度提升 2 倍,推理速度提升 30 倍。
在大模型生態(tài)方面,她介紹,百度文心已形成企業(yè)、教育、社區(qū)三位一體的生態(tài)體系。最新數(shù)據(jù)顯示,百度有超過 750 萬開發(fā)者基礎(chǔ),20 萬企業(yè)生態(tài)基礎(chǔ),多層次開展大模型人才培訓(xùn)、企業(yè)賦能、開發(fā)者運(yùn)營。百度還設(shè)立了 10 億創(chuàng)投基金鼓勵大模型創(chuàng)意、繁榮大模型生態(tài)。
她直言,目前大模型產(chǎn)業(yè)化仍面臨著巨大的挑戰(zhàn),總結(jié)起來有三方面:首先是大模型的體積確實(shí)很大,帶來的訓(xùn)練難度高、成本高;第二是對算力規(guī)模要求非常大,性能要求非常高;第三在于數(shù)據(jù)規(guī)模也很大,收集、挖掘、建設(shè)、篩選、清洗這些數(shù)據(jù),本身也是非常大的大工程。“大模型平臺是價格昂貴的大算力系統(tǒng),其實(shí)完全不需要存在大量的大模型,對于應(yīng)用者來說也不需要每個應(yīng)用都進(jìn)行大模型的開發(fā)?!?/p>
至于“百模大戰(zhàn)”的終局是怎樣的?吳甜談到,“過去短短幾個月時間,大量新的大模型出現(xiàn),但這是個階段現(xiàn)象,未來各個企業(yè)和機(jī)構(gòu)會逐漸找到自己的定位,下一步會走向自己細(xì)分的方向,終局只會集中在少量的幾個大模型,但依托幾個少量大模型,會有非常廣泛的應(yīng)用生態(tài)出現(xiàn)?!?/p>
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。