今年 CVPR,著實(shí)有點(diǎn)魔幻了!
先是韓國(guó)首爾大學(xué) AI 團(tuán)隊(duì)的 Oral,即前 4% 的優(yōu)秀論文,被曝出涉嫌抄襲 10 篇論文。有的地方,連一個(gè)單詞都沒有變。事發(fā)當(dāng)日即登上韓國(guó)頭條,國(guó)內(nèi)外網(wǎng)友震驚:搞到 CVPR 上也太行了吧。
更多人爆料,這個(gè)團(tuán)隊(duì)抄襲已經(jīng)不止一次,基本操作了屬于是。
結(jié)果這一波還未結(jié)束,另一波又開始了。IBM 發(fā)表在 CVPR 上的論文 TableFormer 被指抄襲國(guó)內(nèi) 2021 年發(fā)表的一篇文章。
爆料指出,IBM 論文剽竊了他們的方法,包括預(yù)處理、可視化、推理、系統(tǒng)解決方案等,但并沒有引用他們的論文。
……
抄襲事件頻出,于是乎不少網(wǎng)友感嘆:這屆 CVPR 太魔幻了。
甚至還有人直接在知乎上列出了這么一個(gè)問題:
大家一起來揭發(fā)吧。CVPR 2022 都有哪些論文是抄襲的?
韓國(guó)團(tuán)隊(duì)被曝不止一次抄襲
先來看引發(fā)眾人關(guān)注的韓國(guó)團(tuán)隊(duì)抄襲事件。
在通訊作者尹盛老和一作金某的最新公開回應(yīng)中,都表示這次抄襲屬于一作的個(gè)人行為,和團(tuán)隊(duì)其他人無(wú)關(guān)。
尹盛老解釋說:
團(tuán)隊(duì)其他合著者把各自的部分發(fā)給了一作,但是他最后卻沒有使用,而是抄襲了別的論文。
他還補(bǔ)充道,現(xiàn)在一作本人其他兩篇正在審閱的論文也都被撤回了。
不過,網(wǎng)友們順藤摸瓜后發(fā)現(xiàn),該團(tuán)隊(duì)似乎不止這一篇論文存在抄襲嫌疑。
比如這篇:《Towards Fast and Accurate Object Detection in Bio-Inspired Spiking Neural Networks Through Bayesian Optimization》。
檢測(cè)軟件顯示,它有 40% 的抄襲嫌疑,文中有 27 處表達(dá)與之前研究高度相似。
還有另外一篇《Energy-aware Placement for SRAM-NVM Hybrid FPGAs》,也被發(fā)現(xiàn)存在類似問題。通訊作者都是尹盛老。
與此同時(shí),還有人指出尹教授的實(shí)驗(yàn)室規(guī)模很大。博士生就有 37 位,加上碩士和博士后,實(shí)驗(yàn)室共有 51 位學(xué)生由尹盛老指導(dǎo)。
這也讓有人擔(dān)憂,一位教授是否能同時(shí)指導(dǎo)好這么多學(xué)生,他們的實(shí)驗(yàn)和論文質(zhì)量是否會(huì)受到影響。
而從事件爆發(fā)的起點(diǎn) —— 油管曝光視頻的內(nèi)容來看,這次涉嫌抄襲的論文中,很多地方都是原封不動(dòng)地搬運(yùn)此前研究的表述。涉及到的部分有 Introduction、Preliminaries、Method 等。
甚至有的地方是一字不落的 copy。
全文出現(xiàn)的抄襲段落多達(dá) 25 處,曝光視頻展示問題就花了 7 分多鐘。被抄襲的論文很多被 NeureIPS、AAAI 等頂會(huì)接收,其中還有幾位一作是韓國(guó)人。
這也難怪上傳曝光視頻的人,會(huì)給視頻起一個(gè)如此“刺眼”的標(biāo)題:
E2V-SDE or: How I Learned to Stop Worrying and Love Plagiarism。
E2V-SDE 又名:我是如何毫不擔(dān)憂并愛上抄襲的。
這里的 E2V-SDE,就來自尹盛老團(tuán)隊(duì)此次被 CVPR 2022 接收的論文標(biāo)題。
現(xiàn)在,隨著事件的不斷發(fā)酵,尹盛老團(tuán)隊(duì)還引發(fā)了韓國(guó)網(wǎng)友的群憤。
要知道,尹盛老是韓國(guó)人工智能領(lǐng)域的權(quán)威專家,來自首爾大學(xué)人工智能研究所。今年 6 月,他才剛剛被韓國(guó)科學(xué)技術(shù)部評(píng)選為“首席研究員”,每年享有大約 8 億韓元(折合人民幣約 416 萬(wàn))的科研經(jīng)費(fèi)。
但如今,他的團(tuán)隊(duì)卻深陷抄襲丑聞。
有人留言表示,希望相關(guān)單位能夠嚴(yán)肅處理這件事情,讓相關(guān)研究人員退出學(xué)術(shù)界。
過去 30 年里,很多人不分晝夜地努力研究,才讓韓國(guó)能在 CV 頂會(huì)里發(fā)表更多論文,而他們的行為卻如此過分!
實(shí)際上,韓國(guó)在 CVPR 2022 中的成績(jī)確實(shí)值得關(guān)注,僅首爾大學(xué)就有 25 篇論文入選。有人直接說,這件事太給韓國(guó)丟臉了。
而更為深層的原因還包括,韓國(guó)有聲音擔(dān)心,這次事件會(huì)是“黃禹錫事件”的二度上演。
2005 年,曾任首爾大學(xué)獸醫(yī)學(xué)院首席教授、一度被視為韓國(guó)民族英雄的黃禹錫,被揭發(fā)偽造多項(xiàng)研究成果。其在《Science》上發(fā)表的干細(xì)胞研究均屬子虛烏有。2009 年,黃禹錫被判處 2 年徒刑,緩刑 3 年。
IBM 被指抄襲
就在韓國(guó)抄襲事件這邊還在發(fā)酵,IBM 也被曝出其入選的 CVPR 論文涉嫌抄襲。
來自平安科技的研究員,列出了九大證據(jù),涉及方法論、預(yù)處理、后期處理、推理、文字行檢測(cè)與識(shí)別等內(nèi)容,目前已寫成郵件發(fā)給了 CVPR 2022 program chairs。
首先從核心方法論來看,兩者都是表格內(nèi)容識(shí)別任務(wù),取名也類似,一個(gè)是 TableMASTER,一個(gè)是 TableFormer。
其中,兩者的圖像輸入均為 448*448。前者(TableMASTER)訓(xùn)練長(zhǎng)度為 500,而后者(TableFormer)則改成了 512。
爆料者表示,里面很多痕跡都可以看出,IBM 是在他們開源的預(yù)訓(xùn)練模型上跑的,只是改了些細(xì)節(jié)。而最隱晦的也是直呼“最無(wú)恥”的,還要屬文本單行檢測(cè)這塊,爆料者稱:他們只改變了顏色。
一般而言,官方提供的數(shù)據(jù)中每個(gè)表格都是多行的,不利于之后的訓(xùn)練。
于是,研究團(tuán)隊(duì)對(duì) 3000 張圖像進(jìn)行了重標(biāo)注,將連在一起的多行拆分成單行。
而 IBM 的 PDF Cells 則是直接拿他們?cè)?GitHub 上訓(xùn)練好的模型進(jìn)行預(yù)測(cè)。
除此之外,根據(jù)爆料者描述,IBM 還將他們的 3 條規(guī)則根據(jù)開源的代碼,強(qiáng)行拆成 9 條規(guī)則。
目前,IBM 方也還沒有任何回應(yīng)。網(wǎng)友也持有各種意見。有人認(rèn)為,這看起來像個(gè)人意見,作者有點(diǎn)情緒化。
還有網(wǎng)友則看完整個(gè)證據(jù),很難相信 IBM 是原創(chuàng)文章,建議直接向 CVPR 項(xiàng)目委員會(huì)投訴。
One More Thing
最后,再來簡(jiǎn)單回顧一下今年有點(diǎn)魔幻的 CVPR。
CVPR 2022 投稿量高達(dá) 8161 篇,相比于去年 7093 分提交增長(zhǎng)了 15%,其中 44.59% 的作者來自中國(guó)。
其中,共有 2064 篇論文被接收,接收率為 25.28%。在被接收的論文中,有 342 份被選為 Oral。
最佳論文頒向了 ETH Zurich、華盛頓大學(xué)、佐治亞理工學(xué)院、捷克理工大學(xué)等機(jī)構(gòu)的研究者。而最佳學(xué)生論文獎(jiǎng),則是頒給了達(dá)摩院的實(shí)習(xí)生。李飛飛教授獲得了本次大會(huì)的 Thomas S. Huang 紀(jì)念獎(jiǎng)。
除此之外不得不承認(rèn),今年 CVPR 確實(shí)熱鬧,畢竟有近 6000 人來到線下參會(huì)。于是乎,另一個(gè)魔幻的事情發(fā)生了 —— 不少人因此染上新冠。
網(wǎng)友還提問:到底是 CVPR 接收率高還是感染新冠率高?
參考文獻(xiàn):
[1]https://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/
[2]https://twitter.com/e2v_sde_parody/status/1540087877308239874
[3]https://arxiv.org/pdf/2105.01848.pdf
[4]https://arxiv.org/pdf/2203.01017.pdf
[5]https://www.youtube.com/watch?v=UCmkpLduptU&t=95s
[6]https://www.fmkorea.com/4760102853
[7]https://www.zhihu.com/question/539432448/answer/2543861341
[8]https://www.hankyung.com/society/article/2022062674031
[9]https://www.reddit.com/r/MachineLearning/comments/vjkssf/d_how_to_copy_text_from_more_than_10_previously/
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。