《自然》：解放編輯雙手，AI 審查圖像造假、學(xué)術(shù)不端

智東西 2021/12/24 7:01:42 責(zé)編：長河

評論：

《自然》：解放編輯雙手，AI審查圖像造假、學(xué)術(shù)不端

本周二，國際權(quán)威期刊《自然》刊登了一項(xiàng) AI（人工智能）新成果，是一款用于論文審核的 AI 圖像檢測軟件，它能幫助編輯人員審核生物學(xué)等論文中的造假圖象、錯(cuò)放誤放圖片等。

在科技論文中，實(shí)驗(yàn)結(jié)果的準(zhǔn)確性往往需要實(shí)驗(yàn)數(shù)據(jù)來證明。一些研究人員為了快速完成論文或驗(yàn)證自己的實(shí)驗(yàn)結(jié)果，可能會利用電腦生成虛假圖片、捏造數(shù)據(jù)，或者使用舊數(shù)據(jù)來重復(fù)配圖。如何更快更準(zhǔn)確地發(fā)現(xiàn)論文中被修改和復(fù)制的圖像一直是學(xué)術(shù)期刊編輯們的頭等大事。

此前，在美國癌癥研究協(xié)會（AACR）出版的十種期刊中，論文在發(fā)表之前都要經(jīng)過一次不尋常的額外檢查 —— 審查文章中出現(xiàn)的圖像。

自 2021 年 1 月起，AACR 開始使用人工智能軟件來重新審查其他同行評審后的手稿，除重復(fù)圖片外，該軟件還可以發(fā)現(xiàn)那些已被旋轉(zhuǎn)、拉伸或利用電腦生成、修改的虛假圖像。

《自然》：解放編輯雙手，AI審查圖像造假、學(xué)術(shù)不端

▲ Proofig 中對病毒粒子圖片進(jìn)行數(shù)字彩色透射電子顯微鏡（TEM）操作的示例，藍(lán)線表示人工智能用以比較的數(shù)百個(gè)相同特征

一、成本低、效果好，仍需人工把關(guān)

人工智能審查軟件將是未來的發(fā)展趨勢，AACR 就是這項(xiàng)技術(shù)的早期采用者。無論是因?yàn)楣室膺€是無意，為了避免在論文中發(fā)表被篡改過的圖像，許多期刊聘請了人員手動掃描手稿中是否存在問題，然后使用審查軟件來幫助檢查他們發(fā)現(xiàn)的內(nèi)容。

但《自然》雜志了解到，在過去的一年里，多家出版商開始自動化審查過程，依靠人工智能軟件在稿件發(fā)表之前發(fā)現(xiàn)經(jīng)復(fù)制和修改的圖像。

《自然》：解放編輯雙手，AI審查圖像造假、學(xué)術(shù)不端

▲ 論文中的流式細(xì)胞圖，存在完全一致的細(xì)胞最終落點(diǎn)。（圖片來源為中國青年網(wǎng)）

賓夕法尼亞州費(fèi)城協(xié)會期刊運(yùn)營主管丹尼爾?埃萬科（Daniel Evanko）稱，AACR 嘗試了多種軟件產(chǎn)品，然后才最終選擇了以色列雷霍沃特（Rehovot）公司的人工智能檢測軟件 Proofig 的服務(wù)。“我們對此非常滿意?！彼a(bǔ)充道，他希望人工智能能夠幫助研究人員審查，以減少發(fā)表后出現(xiàn)的問題。

值得注意的是，當(dāng)人工智能軟件標(biāo)記圖像時(shí)，仍然需要專業(yè)的編輯來決定要做什么。例如，如果同一個(gè)數(shù)據(jù)集在文中出現(xiàn)兩次，但表示了不同的意義，那么重復(fù)的圖像都需要保留。其次，由于手稿組裝過程中的簡單復(fù)制和粘貼錯(cuò)誤，也會出現(xiàn)圖像重復(fù)問題，但這是無意識發(fā)生的，并不是故意欺詐讀者。在這之前，這些問題都只能通過編輯和作者之間的討論來解決。

另外，現(xiàn)在人工智能變得足夠有效且成本低廉，專家表示，自動圖像檢查助手可能會在未來幾年席卷科學(xué)出版行業(yè)，就像使用軟件檢查抄襲在十年內(nèi)成為常規(guī)一樣。出版業(yè)團(tuán)體還表示，他們正在探索比較不同期刊手稿中圖像的方法。

其他檢測圖像完整性專家也認(rèn)可這一發(fā)展趨勢，不過他們認(rèn)為，目前尚未對各種軟件產(chǎn)品進(jìn)行公開比較，并且自動檢查可能會產(chǎn)生過多誤報(bào)或遺漏某些圖片的問題。

從長遠(yuǎn)來看，對軟件篩選的依賴也可能會促使欺詐者使用人工智能來欺騙軟件，就像一些人通過調(diào)整文本來逃避抄襲篩選一樣。德國海德堡 EMBO Reports 期刊的主編伯納德?普爾韋爾（Bernd Pulverer）說：“我擔(dān)心我們正在與基于人工智能的技術(shù)進(jìn)行軍備競賽，這可能導(dǎo)致深度偽造圖像出現(xiàn)?！?/p>

二、不光用于重復(fù)檢測，還能改善圖片質(zhì)量

研究人員多年來一直在開發(fā)用于圖像檢查的人工智能軟件，因?yàn)樗麄儞?dān)心論文中的學(xué)術(shù)不端行為可能對科學(xué)文獻(xiàn)造成破壞，而這將遠(yuǎn)遠(yuǎn)超過文章中出現(xiàn)問題后，撤回文章或更正聲明所造成的破壞程度。

此前，荷蘭微生物學(xué)家伊麗莎白?比克（Elisabeth Bik）獨(dú)立或合作發(fā)表了大約 20000 篇生物醫(yī)學(xué)論文，2016 年研究人員對這些論文中的圖片進(jìn)行人工分析后，結(jié)果顯示有超 4% 的論文可能包含有問題的圖片。然而，通常每年只有大約 1% 的論文得到更正，被撤回的則更少。

《自然》：解放編輯雙手，AI審查圖像造假、學(xué)術(shù)不端

▲ 荷蘭微生物學(xué)家伊麗莎白?比克（Elisabeth Bik）

“我知道全球大約有 20 家公司在開發(fā)圖像檢查軟件?！奔又萆镝t(yī)學(xué)研究圖像處理咨詢公司 Image Data Integrity 總裁邁克?羅斯納（Mike Rossner）說。

去年，全球部分科學(xué)出版商聯(lián)合成立了一個(gè)工作組，為篩選圖片問題的軟件制定標(biāo)準(zhǔn)；該小組今年發(fā)布了關(guān)于編輯應(yīng)該如何處理篡改圖像的指導(dǎo)方針，但尚未制定軟件的指導(dǎo)方針。

一些學(xué)術(shù)團(tuán)體和公司告訴《自然》雜志，期刊和政府機(jī)構(gòu)正在試用他們的人工智能軟件，但 Proofig 是第一個(gè)公開客戶信息的公司。除了 AACR，美國臨床調(diào)查學(xué)會在 7 月份開始使用 Proofig 的軟件在《臨床調(diào)查》雜志（JCI）上審查手稿，美國臨床調(diào)查學(xué)會期刊的執(zhí)行編輯莎拉?杰克遜（Sarah Jackson）說。倫敦獨(dú)立學(xué)術(shù)出版公司 SAGE 的轉(zhuǎn)型負(fù)責(zé)人海倫?金（Helen King）稱，今年 10 月 SAGE Publishing 雜志在其五份生命科學(xué)期刊中采用了該軟件。

Proofig 的軟件從論文中提取圖像，并將它們成對地進(jìn)行比較，以找出共同特征。一般而言，論文的檢查時(shí)間大概在一兩分鐘內(nèi)，Proofig 的創(chuàng)始人德羅?科洛德金?加爾（Dror Kolodkin-Gal）說，該軟件還可以糾正棘手的問題，例如將高分辨率原始數(shù)據(jù)壓縮成較小文件時(shí)可能出現(xiàn)的壓縮偽影?！坝?jì)算機(jī)比人類視覺更有優(yōu)勢?！彼f，“計(jì)算機(jī)不僅不會感到疲倦，運(yùn)行速度也會更快，而且它也不會受到大小、位置、方向、重疊、部分復(fù)制和這些因素組合的影響?！?/p>

關(guān)于圖片檢查的成本，加爾拒絕詳細(xì)討論定價(jià)問題，但他表示與出版商簽訂的合同往往根據(jù)論文中的圖像數(shù)量收費(fèi)，同時(shí)也取決于手稿的數(shù)量。他說，這相當(dāng)于每張紙的收費(fèi)“接近幾十美元而不是幾百美元”。

杰克遜說，在《臨床調(diào)查》雜志中，該軟件發(fā)現(xiàn)的問題比以前工作人員手動審查的問題要多。雖然工作人員仍然需要檢查 Proofig 的輸出結(jié)果，但重要的是該期刊已經(jīng)擁有處理各種圖像問題的人工智能系統(tǒng)?！拔覀冋娴挠X得嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)是我們期刊的絕對標(biāo)志。我們認(rèn)為這值得花時(shí)間和金錢?！苯芸诉d說。同時(shí)，在美國癌癥研究協(xié)會的期刊中，埃萬科說許多作者很高興在發(fā)表之前就發(fā)現(xiàn)了他們的圖片重復(fù)錯(cuò)誤。

三、AI + 人工，多個(gè)出版商自研軟件

與此同時(shí)，位于瑞士洛桑的出版商 Frontiers 開發(fā)了自己的圖像檢查軟件 AIRA（人工智能審查助手），作為自動檢查系統(tǒng)的一部分。一位發(fā)言人說，自 2020 年 8 月以來，一個(gè)研究圖像完整性的團(tuán)隊(duì)一直在內(nèi)部使用 AIRA，用來對所有提交的手稿進(jìn)行圖像檢查。但該軟件標(biāo)記的大多數(shù)論文實(shí)際上沒有出現(xiàn)問題，僅有大約 10% 需要編輯團(tuán)隊(duì)跟進(jìn)。Frontiers 拒絕透露 AIRA 標(biāo)記的論文數(shù)量。

包括比克和羅斯納在內(nèi)的圖像完整性專家表示，他們自己還沒有嘗試過 AIRA 或 Proofig，很難評估尚未使用標(biāo)準(zhǔn)化測試進(jìn)行公開比較的軟件產(chǎn)品。羅斯納補(bǔ)充說，除了重復(fù)之外，檢測是否通過 PS 刪除或裁剪部分圖像也很重要?！叭斯ぶ悄苘浖赡苁且曈X篩選的有用補(bǔ)充，但它可能無法替代當(dāng)前形式?！?/p>

“不過，我相信這最終將成為稿件篩選的標(biāo)準(zhǔn)?！北瓤搜a(bǔ)充道。

尚未采用人工智能軟件圖像篩選的出版商提到了成本和可靠性問題。美國科學(xué)公共圖書館 PLOS 的一位發(fā)言人談道，他正在“熱切地”監(jiān)控這項(xiàng)研究的進(jìn)展情況，這些工具可以“可靠地識別常見的圖像完整性問題并且可以大規(guī)模應(yīng)用”。荷蘭出版集團(tuán)愛思唯爾（Elsevier）稱，它們“仍在測試”軟件，但它的一些期刊會在發(fā)表前篩選所有論文，并“使用軟件工具和手動分析的組合”檢查圖像。

一位發(fā)言人說，2020 年 4 月，學(xué)術(shù)出版商 Wiley 為臨時(shí)接受的手稿推出了圖像篩選服務(wù)，目前有 120 多家期刊使用，但目前這是由軟件輔助的手動篩選?！蹲匀弧冯s志的出版商 Springer Nature 稱，它正在評估一些外部工具，同時(shí)整理數(shù)據(jù)以訓(xùn)練自己的軟件，該軟件將“結(jié)合互補(bǔ)的人工智能和人工來識別有問題的圖像”。

四、蛋白質(zhì)印跡都能偽造，推進(jìn)跨出版商檢測

普爾韋爾說：“EMBO Press 雜志仍然主要使用手動篩選，我不太相信商業(yè)產(chǎn)品的成本效益比?！倍移諣栱f爾是定義軟件標(biāo)準(zhǔn)的跨出版商工作組的成員，“我毫不懷疑，我們很快就會擁有高級工具?！?/p>

普爾韋爾擔(dān)心欺詐者可能會了解該軟件的工作原理，并使用人工智能軟件生成人們和軟件都無法檢測到的虛假圖像。盡管還沒有人表明此類圖像已經(jīng)出現(xiàn)在研究論文中，但去年發(fā)布在提供分發(fā)服務(wù)的網(wǎng)站 BioRxiv 上的一份預(yù)印本表明，論文中有可能出現(xiàn)與真實(shí)數(shù)據(jù)無法區(qū)分的生物圖像的偽造版本，例如蛋白質(zhì)印跡。

《自然》：解放編輯雙手，AI審查圖像造假、學(xué)術(shù)不端

▲ 《細(xì)胞生物化學(xué)》雜志中論文內(nèi)蛋白質(zhì)印跡圖片（圖片來源為中國青年網(wǎng)）

但研究人員正在解決這個(gè)問題，印第安納州西拉斐特普渡大學(xué)的計(jì)算機(jī)科學(xué)家愛德華?德爾普（Edward Delp）在美國國防高級研究計(jì)劃局資助的一個(gè)項(xiàng)目中領(lǐng)導(dǎo)了一個(gè)團(tuán)隊(duì)，該團(tuán)隊(duì)正在研究檢測人工智能偽造圖像的軟件，并專注于偽造的生物圖像，例如顯微鏡圖像和 X 射線，一篇描述該系統(tǒng)的論文正在審查中。

《自然》：解放編輯雙手，AI審查圖像造假、學(xué)術(shù)不端

▲ 光學(xué)顯微鏡捕捉細(xì)胞和組織的顯微照片

目前，人工智能圖像檢查通常在手稿中完成，而不是在論文中完成，這將使其計(jì)算量越來越大。但商業(yè)和學(xué)術(shù)軟件開發(fā)商表示，這在技術(shù)上是可行的。紐約雪城大學(xué)的計(jì)算機(jī)科學(xué)家丹尼爾?阿庫尼亞（Daniel Acu?a）去年在數(shù)千份新冠疫情相關(guān)的預(yù)印本上成功運(yùn)行了人工智能檢測軟件，以查找重復(fù)項(xiàng)。

Crossref 是一家由 15000 多個(gè)組織組成的美國非營利性合作組織，該組織負(fù)責(zé)組織跨論文的抄襲檢查等。Crossref 的倫敦產(chǎn)品總監(jiān)布萊恩?維克里（Bryan Vickery）稱，他們目前正在開展一項(xiàng)調(diào)查，詢問其成員對篡改圖像的擔(dān)憂、他們使用的軟件以及可以共享圖像的“跨出版商服務(wù)”是否可行。

今年 12 月，英國牛津?qū)W術(shù)出版商行業(yè)組織 STM 的子公司 STM Solutions，宣布它正在開發(fā)一個(gè)云平臺，以幫助出版商合作“檢查提交的文章是否存在研究誠信問題”，同時(shí)保持隱私和保密。STM 發(fā)言人馬特?麥凱（Matt McKay）表示，檢測跨期刊的圖像篡改、重復(fù)和抄襲“在我們的路線圖中占據(jù)重要位置”。

結(jié)論：圖像檢測要集成人工智能軟件、云數(shù)據(jù)平臺

論文中的學(xué)術(shù)不端將會對期刊、作者等都造成較大的影響。此前，學(xué)術(shù)期刊都依靠編輯人工篩選，來發(fā)現(xiàn)論文中的圖像錯(cuò)誤問題，但由于人工審查的局限性，總會出現(xiàn)“漏網(wǎng)之魚”。因此，隨著人工智能技術(shù)的不斷發(fā)展和完善，人工智能檢測技術(shù)將成為論文圖像檢測的主要手段。

但由于人工智能技術(shù)無法依據(jù)情境對圖像進(jìn)行判斷，最終還是需要人工編輯審核，但這仍大大降低了編輯的工作量。杰克遜說，在臨床調(diào)查雜志中，人工智能軟件發(fā)現(xiàn)的問題比以前工作人員手動審查的問題要多。

此外，在圖像檢測領(lǐng)域建立人工智能軟件審查的云數(shù)據(jù)平臺也至關(guān)重要，實(shí)現(xiàn)跨出版商檢測，能夠有效避免因地區(qū)、學(xué)科不同而出現(xiàn)的學(xué)術(shù)不端行為。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

《自然》：解放編輯雙手，AI 審查圖像造假、學(xué)術(shù)不端

一、成本低、效果好，仍需人工把關(guān)

二、不光用于重復(fù)檢測，還能改善圖片質(zhì)量

三、AI + 人工，多個(gè)出版商自研軟件

四、蛋白質(zhì)印跡都能偽造，推進(jìn)跨出版商檢測

結(jié)論：圖像檢測要集成人工智能軟件、云數(shù)據(jù)平臺

相關(guān)文章

《自然》：解放編輯雙手，AI 審查圖像造假、學(xué)術(shù)不端

一、成本低、效果好，仍需人工把關(guān)

二、不光用于重復(fù)檢測，還能改善圖片質(zhì)量

三、AI + 人工，多個(gè)出版商自研軟件

四、蛋白質(zhì)印跡都能偽造，推進(jìn)跨出版商檢測

結(jié)論：圖像檢測要集成人工智能軟件、云數(shù)據(jù)平臺