IT之家 11 月 9 日消息,據(jù)中國科學(xué)院官網(wǎng),近日,中國科學(xué)院軟件研究所智能軟件研究中心研究員武延軍、吳敬征課題組在基于深度神經(jīng)網(wǎng)絡(luò)的靜態(tài)代碼分析研究中取得進(jìn)展。
該課題組提出了基于多類型和多粒度的語義代碼表示學(xué)習(xí)模型 ——MultiCode,解決了工業(yè)場景中涉及多需求的開發(fā)任務(wù)時面臨的開發(fā)開銷大、模型集成困難、可擴(kuò)展性受限等問題。
該課題組的研究實現(xiàn)了在多需求工業(yè)場景下的高效開發(fā)和準(zhǔn)確預(yù)測,在漏洞檢測、代碼克隆檢測等任務(wù)中得到了具體實踐,并獲得實際應(yīng)用。
▲ MultiCode 基于多類型和多粒度的語義代碼表示學(xué)習(xí)模型框架
據(jù)介紹,MultiCode 模型能夠?qū)W習(xí)代碼中多種類型和粒度的語義信息,進(jìn)而支撐多種代碼分析任務(wù)。課題組提出使用抽象語法樹、控制流圖、程序依賴圖等結(jié)構(gòu),對代碼中不同類型和粒度的語義信息進(jìn)行建模,并利用樹神經(jīng)網(wǎng)絡(luò)和圖神經(jīng)網(wǎng)絡(luò)分別對不同的語義信息進(jìn)行處理。將該模型作為編碼器進(jìn)行神經(jīng)網(wǎng)絡(luò)構(gòu)建,能夠有效適配于不同的代碼分析任務(wù)。
在漏洞檢測和代碼克隆檢測任務(wù)上的評估結(jié)果表明,該模型能夠在不需要重新構(gòu)建編碼器的情況下,在不同任務(wù)中有效地識別并區(qū)分不同類別代碼的語義,進(jìn)而支撐多種任務(wù)上的預(yù)測。
IT之家了解到,相關(guān)研究成果發(fā)表在軟件可靠性工程國際會議(ISSRE 2021)的 Industry Track 上,并被評為最佳實踐論文。研究工作得到國家重點研發(fā)計劃、國家自然科學(xué)基金的支持。
▲ ISSRE 2021 最佳實踐論文獎
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。