百人聯(lián)名 AI 大模型綜述論文被指抄襲，智源研究院致歉：承認(rèn)存在問題，立即刪除修訂

量子位 2022/4/14 13:56:46 責(zé)編：遠(yuǎn)洋

評論：

一篇 19 家機(jī)構(gòu)、100 位學(xué)者聯(lián)名發(fā)表的 AI 大模型綜述論文，被指涉嫌大量段落抄襲。

此事已在國內(nèi)外學(xué)術(shù)圈引起廣泛關(guān)注。事件爆出當(dāng)日晚，論文第一單位智源研究院發(fā)表中英文致歉信。承認(rèn)文章中存在問題，已啟動第三方獨(dú)立審查，后續(xù)將進(jìn)行追責(zé)。

百人聯(lián)名 AI 大模型綜述論文被指抄襲，智源研究院致歉：承認(rèn)存在問題，立即刪除修訂

根據(jù)智源研究院聲明，這篇綜述報告由智源牽頭，邀請國內(nèi)外 100 位科研人員分別撰寫了 16 篇獨(dú)立的專題文章，并單獨(dú)署名。

按初步調(diào)查結(jié)果，智源決定立即從文章中刪除已確認(rèn)的抄襲內(nèi)容，并通知所有作者對所有內(nèi)容進(jìn)行全面審查。目前論文修訂版已提交 arXiv 進(jìn)行更新。

事件經(jīng)過

問題最早由谷歌大腦研究員 Nicholas Carlini 指出。他在一篇博客文章中列舉了 10 個涉嫌抄襲的段落，文字一致的部分用綠色標(biāo)出。

百人聯(lián)名 AI 大模型綜述論文被指抄襲，智源研究院致歉：承認(rèn)存在問題，立即刪除修訂

同時通過收集數(shù)據(jù)初步核查，Carlini 發(fā)現(xiàn)這篇論文還涉嫌抄襲十余篇來自其他作者的論文。此事在社交媒體上不斷發(fā)酵，引發(fā)大量關(guān)注。

百人聯(lián)名 AI 大模型綜述論文被指抄襲，智源研究院致歉：承認(rèn)存在問題，立即刪除修訂

隨后 Carlini 更新了一段話，呼吁大家理性看待，不要演變成獵巫行動。在不清楚 100 個作者中的具體責(zé)任人之前不要一棍子打死。

百人聯(lián)名 AI 大模型綜述論文被指抄襲，智源研究院致歉：承認(rèn)存在問題，立即刪除修訂

不過，ViT 作者之一 Lucas Beyer 認(rèn)為，在論文中署名就意味著要參與從創(chuàng)意腦暴、試驗(yàn)、撰寫、校對的過程，承擔(dān)相應(yīng)責(zé)任。

百人聯(lián)名 AI 大模型綜述論文被指抄襲，智源研究院致歉：承認(rèn)存在問題，立即刪除修訂

被抄襲的作者之一、谷歌大腦研究員 Katherine Lee 給出建議：如果需要復(fù)用文本，請使用引號明確你的意圖，并注明來源。

百人聯(lián)名 AI 大模型綜述論文被指抄襲，智源研究院致歉：承認(rèn)存在問題，立即刪除修訂

對于復(fù)用文本，Carlini 認(rèn)為這是一篇綜述文章，并不算把別人成果說成自己的那種最惡劣的抄襲。但綜述文章的意義在于對一個研究領(lǐng)域的重新構(gòu)建，直接復(fù)制之前的論文并不能帶來新的價值。

最后，附上智源研究院致歉信中文版全文。

百人聯(lián)名 AI 大模型綜述論文被指抄襲，智源研究院致歉：承認(rèn)存在問題，立即刪除修訂

智源研究院致歉信：

https://www.baai.ac.cn/portal/article/index/cid/4/id/404.html

Nicholas Carlini 博客文章：

https://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。