IT之家 2 月 2 日消息,微軟軟件工程部門(mén)經(jīng)理 Shane Jones 日前發(fā)現(xiàn) OpenAI 旗下 DALL-E 3 模型存在漏洞,據(jù)稱能夠生成一系列 NSFW 不當(dāng)內(nèi)容,在上報(bào)相關(guān)漏洞后,Shane Jones 卻被下達(dá)“封口令”,不過(guò)該員工最終還是選擇向外界披露相關(guān)漏洞。
IT之家注意到,Shane Jones 在去年 12 月通過(guò)獨(dú)立研究發(fā)現(xiàn) OpenAI 文字生成圖片的 DALL-E 3 模型存在一項(xiàng)漏洞,能繞過(guò) AI 護(hù)欄(AI Guardrail)生成一系列 NSFW 不當(dāng)內(nèi)容。
之后 Shane Jones 將漏洞曝光上報(bào)微軟及 OpenAI,并在領(lǐng)英上發(fā)布公開(kāi)信,聲稱相關(guān)漏洞會(huì)對(duì)大眾造成安全風(fēng)險(xiǎn),呼吁 OpenAI 在解決漏洞前應(yīng)暫時(shí)下架 DALL-E 3 模型。
隨后 Shane Jones 被微軟法務(wù)部及高管找上門(mén),并警告他立即刪除領(lǐng)英公開(kāi)信并停止對(duì)外披露任何內(nèi)容,但卻并未給予任何解釋說(shuō)明,此后 Shane Jones 屢次尋求公司內(nèi)部溝通,但均未得到公司回應(yīng),而漏洞也未修復(fù),之后 Shane Jones 便向媒體及有關(guān)部門(mén)披露了相關(guān)漏洞。
Shane Jones 提到,近日網(wǎng)絡(luò)上出現(xiàn) AI 生成的知名歌手 Taylor Swift(泰勒?斯威夫特)不雅照便與該漏洞有一定關(guān)聯(lián),這些不雅照據(jù)稱是使用微軟 Designer AI 功能生成,而 Designer 底層模型正是 DALL-E 3,因此微軟在本次事件中下達(dá)“封口令”存在重大過(guò)失。
此后微軟官方回應(yīng) Engadget 等媒體,聲稱將解決相關(guān)員工的疑慮,并修復(fù)相關(guān)漏洞,不過(guò)微軟同時(shí)聲稱 Shane Jones 披露的漏洞實(shí)際上成功率較低,“無(wú)法繞過(guò)微軟為模型設(shè)置的所有安全機(jī)制”、“目前還不清楚該漏洞與 Taylor Swift 不雅照事件是否有關(guān)聯(lián)性”。
相關(guān)閱讀:
《AI 虛假“不雅照”泛濫,X(推特)首次官方下場(chǎng)禁止搜索泰勒?斯威夫特》
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。