世界數(shù)字技術(shù)院首次發(fā)布大模型安全國(guó)際標(biāo)準(zhǔn)，螞蟻集團(tuán)、OpenAI、科大訊飛等參編

2024/4/17 15:56:03 來(lái)源：IT之家作者：清源責(zé)編：清源

評(píng)論：

感謝IT之家網(wǎng)友華南吳彥祖、西窗舊事的線(xiàn)索投遞！

IT之家 4 月 17 日消息，4 月 15-19 日，第 27 屆聯(lián)合國(guó)科技大會(huì)在瑞士日內(nèi)瓦召開(kāi)。其間，世界數(shù)字技術(shù)院（WDTA）于 4 月 16 日發(fā)布了一系列突破性成果，包括《生成式人工智能應(yīng)用安全測(cè)試標(biāo)準(zhǔn)》和《大語(yǔ)言模型安全測(cè)試方法》兩項(xiàng)國(guó)際標(biāo)準(zhǔn)。

據(jù)中國(guó)經(jīng)濟(jì)網(wǎng)報(bào)道，這兩項(xiàng)國(guó)際標(biāo)準(zhǔn)為大模型及生成式 AI 應(yīng)用方面的安全測(cè)試標(biāo)準(zhǔn)，代表著全球人工智能安全評(píng)估和測(cè)試進(jìn)入新的基準(zhǔn)。

這兩項(xiàng)標(biāo)準(zhǔn)由 OpenAI、螞蟻集團(tuán)、科大訊飛、谷歌、微軟、英偉達(dá)、百度、騰訊等數(shù)十家單位的多名專(zhuān)家學(xué)者共同編制而成，其中《大語(yǔ)言模型安全測(cè)試方法》由螞蟻集團(tuán)牽頭編制。

《標(biāo)準(zhǔn)》為測(cè)試、驗(yàn)證生成式 AI 應(yīng)用（尤其是使用大語(yǔ)言模型構(gòu)建的應(yīng)用程序）的安全性提供框架，定義了 AI 應(yīng)用程序架構(gòu)每層測(cè)試驗(yàn)證范圍，包括不限于如下方面。

基礎(chǔ)模型選擇
嵌入和矢量數(shù)據(jù)庫(kù)
RAG 或檢索增強(qiáng)生成
AI 應(yīng)用運(yùn)行時(shí)的安全

《方法》則為大模型本身安全性評(píng)估提供了“全面、嚴(yán)謹(jǐn)且實(shí)操性強(qiáng)”的結(jié)構(gòu)性方案，提出了大語(yǔ)言模型的安全風(fēng)險(xiǎn)分類(lèi)、攻擊的分類(lèi)分級(jí)方法以及測(cè)試方法。據(jù)報(bào)道，《方法》可以解決大語(yǔ)言模型固有的復(fù)雜性，全面測(cè)試其抵御敵對(duì)攻擊的能力，使開(kāi)發(fā)人員和組織能夠識(shí)別和緩解潛在漏洞，并最終提高使用大語(yǔ)言模型構(gòu)建的人工智能系統(tǒng)的安全性和可靠性。

IT之家注：WDTA 系國(guó)際非政府組織，于日內(nèi)瓦注冊(cè)。該機(jī)構(gòu)遵從聯(lián)合國(guó)指導(dǎo)框架，致力于在全球范圍內(nèi)推進(jìn)數(shù)字技術(shù)，促進(jìn)國(guó)際合作。AI STR（安全、可信、負(fù)責(zé)任）計(jì)劃是 WDTA 的核心倡議，旨在確保人工智能系統(tǒng)的安全性、可信性和責(zé)任性。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

世界數(shù)字技術(shù)院首次發(fā)布大模型安全國(guó)際標(biāo)準(zhǔn)，螞蟻集團(tuán)、OpenAI、科大訊飛等參編

世界數(shù)字技術(shù)院首次發(fā)布大模型安全國(guó)際標(biāo)準(zhǔn)，螞蟻集團(tuán)、OpenAI、科大訊飛等參編