IT之家 10 月 12 日消息,IT之家從中國(guó)移動(dòng)官方獲悉,在今天召開(kāi)的 2024 中國(guó)移動(dòng)全球合作伙伴大會(huì)期間,中國(guó)移動(dòng)聯(lián)合電子標(biāo)準(zhǔn)院及 16 家重點(diǎn)央企共同開(kāi)展大模型評(píng)測(cè)體系建設(shè)工作,并發(fā)布《通用大模型評(píng)測(cè)標(biāo)準(zhǔn)》。
據(jù)介紹,該標(biāo)準(zhǔn)是大模型評(píng)測(cè)體系建設(shè)的重要成果,為產(chǎn)業(yè)界遴選優(yōu)質(zhì)大模型提供重要參考依據(jù)。第一階段將圍繞通用領(lǐng)域和 4 個(gè)重點(diǎn)行業(yè)領(lǐng)域,從評(píng)測(cè)標(biāo)準(zhǔn)制定、評(píng)測(cè)基地建設(shè)、評(píng)測(cè)試點(diǎn)應(yīng)用等方面開(kāi)展工作。
通用大模型評(píng)測(cè)標(biāo)準(zhǔn)基于“2-4-6”框架如下:
“2”:兩類評(píng)測(cè)視角,以重點(diǎn)行業(yè)實(shí)際使用需求為導(dǎo)向,與國(guó)標(biāo)對(duì)模型能力要求拉齊,將評(píng)測(cè)任務(wù)劃分為理解和生成兩類視角。
“4”:四類評(píng)測(cè)要素,從評(píng)測(cè)全生命周期中提取出評(píng)測(cè)工具、評(píng)測(cè)數(shù)據(jù)、評(píng)測(cè)方式和評(píng)測(cè)指標(biāo)四類關(guān)鍵要素,確保評(píng)測(cè)工作可實(shí)施性。
“6”:六大評(píng)測(cè)維度,綜合考慮大模型應(yīng)用過(guò)程中的核心能力,設(shè)定功能性、準(zhǔn)確性、可靠性、安全性、交互性和應(yīng)用性六大維度。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。