一篇 19 家機(jī)構(gòu)、100 位學(xué)者聯(lián)名發(fā)表的 AI 大模型綜述論文,被指涉嫌大量段落抄襲。
此事已在國內(nèi)外學(xué)術(shù)圈引起廣泛關(guān)注。事件爆出當(dāng)日晚,論文第一單位智源研究院發(fā)表中英文致歉信。承認(rèn)文章中存在問題,已啟動第三方獨(dú)立審查,后續(xù)將進(jìn)行追責(zé)。
根據(jù)智源研究院聲明,這篇綜述報告由智源牽頭,邀請國內(nèi)外 100 位科研人員分別撰寫了 16 篇獨(dú)立的專題文章,并單獨(dú)署名。
按初步調(diào)查結(jié)果,智源決定立即從文章中刪除已確認(rèn)的抄襲內(nèi)容,并通知所有作者對所有內(nèi)容進(jìn)行全面審查。目前論文修訂版已提交 arXiv 進(jìn)行更新。
事件經(jīng)過
問題最早由谷歌大腦研究員 Nicholas Carlini 指出。他在一篇博客文章中列舉了 10 個涉嫌抄襲的段落,文字一致的部分用綠色標(biāo)出。
同時通過收集數(shù)據(jù)初步核查,Carlini 發(fā)現(xiàn)這篇論文還涉嫌抄襲十余篇來自其他作者的論文。此事在社交媒體上不斷發(fā)酵,引發(fā)大量關(guān)注。
隨后 Carlini 更新了一段話,呼吁大家理性看待,不要演變成獵巫行動。在不清楚 100 個作者中的具體責(zé)任人之前不要一棍子打死。
不過,ViT 作者之一 Lucas Beyer 認(rèn)為,在論文中署名就意味著要參與從創(chuàng)意腦暴、試驗(yàn)、撰寫、校對的過程,承擔(dān)相應(yīng)責(zé)任。
被抄襲的作者之一、谷歌大腦研究員 Katherine Lee 給出建議:如果需要復(fù)用文本,請使用引號明確你的意圖,并注明來源。
對于復(fù)用文本,Carlini 認(rèn)為這是一篇綜述文章,并不算把別人成果說成自己的那種最惡劣的抄襲。但綜述文章的意義在于對一個研究領(lǐng)域的重新構(gòu)建,直接復(fù)制之前的論文并不能帶來新的價值。
最后,附上智源研究院致歉信中文版全文。
智源研究院致歉信:
https://www.baai.ac.cn/portal/article/index/cid/4/id/404.html
Nicholas Carlini 博客文章:
https://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。