論文圖片誤用？AI：這條路已被我堵死了

量子位 2021/12/22 14:57:17 責(zé)編：遠(yuǎn)洋

評(píng)論：

現(xiàn)在的 AI 已經(jīng)開(kāi)始參與論文打假了！就像是這樣，經(jīng)過(guò)旋轉(zhuǎn)、拉伸和縮放之后的圖片，人眼或許無(wú)法辨認(rèn)，但 AI 能看到數(shù)百個(gè)相似的特征：

AI 打假

△藍(lán)色線條表示相似特征

即使通過(guò)高超的“圖像處理手段”把一張完整圖像中的局部畫(huà)面挪到自己的圖像里，也能一眼分辨：

AI 打假

對(duì)于 AI 來(lái)說(shuō)，這可能是秒認(rèn)的活兒，甚至就算是一篇圖像繁雜的完整論文，也不過(guò)花費(fèi)一兩分鐘。但對(duì)于人眼可就沒(méi)那么簡(jiǎn)單了，比如知名學(xué)術(shù)打假人 Elisabeth Bik 為了尋找不同論文中使用相同圖片展示各自不同的實(shí)驗(yàn)結(jié)果的例子，曾花費(fèi)了整整 2 年時(shí)間。

而對(duì)于出版商們來(lái)說(shuō)，刊登又撤稿中間的損失就更大了……

因此，最近幾年，AI 打假員愈發(fā)頻繁地被引入了論文審查，尤其是圖像問(wèn)題中。比如，自今年 1 月份開(kāi)始，世界上最大、最古老的癌癥研究專(zhuān)業(yè)協(xié)會(huì)，美國(guó)癌癥協(xié)會(huì)（AACR）就已經(jīng)開(kāi)始使用 AI 軟件來(lái)評(píng)審旗下期刊文章里的圖片造假或重復(fù)問(wèn)題了。

官方網(wǎng)站上也已經(jīng)寫(xiě)明：提交手稿中的所有圖像都需要通過(guò) AI 軟件進(jìn)行篩選。

AI 打假

不僅是 AACR，世界第五大出版商 SAGE、老牌經(jīng)典醫(yī)學(xué)期刊 JCI、 JCI Insight 都已經(jīng)用上了這種方法。

自動(dòng)圖像校對(duì)

這些期刊和出版商們所使用的是一個(gè)由以色列公司 Proofig 開(kāi)發(fā)的同名軟件。

Proofig 軟件基于 AI 技術(shù)和圖像處理技術(shù)，面向各種科學(xué)文稿中的圖像，包括所有類(lèi)型的顯微鏡照片（光學(xué)、電學(xué)、共聚焦）、載玻片、蛋白免疫印跡（Western blot）、生物體內(nèi)和體外圖像、植物圖像等等。

AI 打假

軟件會(huì)從論文中識(shí)別圖像，然后提取它們共同的特征進(jìn)行比較。這些“共同的特征”包括對(duì)圖像整體的縮放或旋轉(zhuǎn)、部分重復(fù)或重疊、還有一些方位上的不同。

除此之外，軟件也能額外檢測(cè)到一些問(wèn)題，比如高分辨率的原始數(shù)據(jù)被壓縮到更小的文件中時(shí)，可能出現(xiàn)的壓縮失真或壓縮偽影（Compression artifact）情況。

AI 打假

一篇普通的論文通常在 2 分鐘以?xún)?nèi)可以檢查完畢，最多不超過(guò) 10 分鐘。

對(duì)于很多出版商來(lái)說(shuō)，一篇已刊登的科學(xué)文稿里如果出現(xiàn)圖像剽竊這種學(xué)術(shù)不端的現(xiàn)象，那么從調(diào)查、撤稿到后續(xù)的法律費(fèi)用，平均每篇文章可能要損失百萬(wàn)美元。因此，很多出版商都樂(lè)意引入性?xún)r(jià)比較高的 AI 來(lái)和人工審查組一起工作。

AACR 的一位期刊運(yùn)營(yíng)總監(jiān)就表示：很多作者也很高興能在出版前注意到一些“無(wú)意中的”圖像復(fù)制錯(cuò)誤。而對(duì)于我們來(lái)說(shuō)，嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)是我們期刊的一個(gè)顯著的標(biāo)志，因此，這（Proofig）絕對(duì)是值得投入的時(shí)間和金錢(qián)。

出版商們聯(lián)合起來(lái)

其實(shí)，科學(xué)文稿中的圖像重復(fù)或剽竊的現(xiàn)象已經(jīng)是屢見(jiàn)不鮮了。

2016 年，Nature 上就有一篇文章對(duì)約 2 萬(wàn)篇生物醫(yī)學(xué)論文進(jìn)行人工分析后發(fā)現(xiàn)，其中 4% 的論文都可能包含上述問(wèn)題。

AI 打假

而通常每年只有 1% 的文稿得到更正，因此撤回的文章就更少了。

因此，去年 5 月份，一些出版商聯(lián)合起來(lái)成立了一個(gè)為解決論文中圖像問(wèn)題的小組，其中包括荷蘭出版業(yè)巨頭愛(ài)思唯爾（Elsevier）、Wiley、Springer Nature 和 Taylor & Francis。

愛(ài)思唯爾表示，小組最終的目標(biāo)是“創(chuàng)造一個(gè)能夠幫助我們自動(dòng)識(shí)別圖像變化的環(huán)境?！?/p>

AI 打假

還有很多出版商試圖自己解決問(wèn)題，比如瑞士出版商 Frontiers 開(kāi)發(fā)了自己的論文圖像檢查軟件，作為自動(dòng)檢查系統(tǒng) AIRA 的一部分。

Frontiers 內(nèi)部的一位發(fā)言人表示，軟件自 2020 年 8 月投入使用，標(biāo)記的大多數(shù)論文都沒(méi)有問(wèn)題，只有大約 10% 的論文需要人工檢查小組的跟蹤處理。

而有些尚未引入 AI 手段的出版商也展現(xiàn)出了對(duì)這種方法的懷疑：在可靠性上，AI 檢查還沒(méi)有大規(guī)模地投入使用。比如愛(ài)思唯爾的軟件目前的進(jìn)度還是“正在測(cè)試中“，只對(duì)部分期刊開(kāi)放使用。在成本上，AI 軟件偶爾的“誤殺”依舊需要人工參與，甚至?xí)鹌渌募m紛。

不過(guò)有人從另一個(gè)角度提出了問(wèn)題：如果所有的論文都是開(kāi)放存取的，那么圖像誤用 / 重復(fù)問(wèn)題將更容易得到審查，訓(xùn)練 AI 也會(huì)更有效率。

AI 打假

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

論文圖片誤用？AI：這條路已被我堵死了

自動(dòng)圖像校對(duì)

出版商們聯(lián)合起來(lái)

相關(guān)文章

論文圖片誤用？AI：這條路已被我堵死了