本周二,國際權(quán)威期刊《自然》刊登了一項(xiàng) AI(人工智能)新成果,是一款用于論文審核的 AI 圖像檢測軟件,它能幫助編輯人員審核生物學(xué)等論文中的造假圖象、錯(cuò)放誤放圖片等。
在科技論文中,實(shí)驗(yàn)結(jié)果的準(zhǔn)確性往往需要實(shí)驗(yàn)數(shù)據(jù)來證明。一些研究人員為了快速完成論文或驗(yàn)證自己的實(shí)驗(yàn)結(jié)果,可能會利用電腦生成虛假圖片、捏造數(shù)據(jù),或者使用舊數(shù)據(jù)來重復(fù)配圖。如何更快更準(zhǔn)確地發(fā)現(xiàn)論文中被修改和復(fù)制的圖像一直是學(xué)術(shù)期刊編輯們的頭等大事。
此前,在美國癌癥研究協(xié)會(AACR)出版的十種期刊中,論文在發(fā)表之前都要經(jīng)過一次不尋常的額外檢查 —— 審查文章中出現(xiàn)的圖像。
自 2021 年 1 月起,AACR 開始使用人工智能軟件來重新審查其他同行評審后的手稿,除重復(fù)圖片外,該軟件還可以發(fā)現(xiàn)那些已被旋轉(zhuǎn)、拉伸或利用電腦生成、修改的虛假圖像。
▲ Proofig 中對病毒粒子圖片進(jìn)行數(shù)字彩色透射電子顯微鏡(TEM)操作的示例,藍(lán)線表示人工智能用以比較的數(shù)百個(gè)相同特征
一、成本低、效果好,仍需人工把關(guān)
人工智能審查軟件將是未來的發(fā)展趨勢,AACR 就是這項(xiàng)技術(shù)的早期采用者。無論是因?yàn)楣室膺€是無意,為了避免在論文中發(fā)表被篡改過的圖像,許多期刊聘請了人員手動掃描手稿中是否存在問題,然后使用審查軟件來幫助檢查他們發(fā)現(xiàn)的內(nèi)容。
但《自然》雜志了解到,在過去的一年里,多家出版商開始自動化審查過程,依靠人工智能軟件在稿件發(fā)表之前發(fā)現(xiàn)經(jīng)復(fù)制和修改的圖像。
▲ 論文中的流式細(xì)胞圖,存在完全一致的細(xì)胞最終落點(diǎn)。(圖片來源為中國青年網(wǎng))
賓夕法尼亞州費(fèi)城協(xié)會期刊運(yùn)營主管丹尼爾?埃萬科(Daniel Evanko)稱,AACR 嘗試了多種軟件產(chǎn)品,然后才最終選擇了以色列雷霍沃特(Rehovot)公司的人工智能檢測軟件 Proofig 的服務(wù)。“我們對此非常滿意?!彼a(bǔ)充道,他希望人工智能能夠幫助研究人員審查,以減少發(fā)表后出現(xiàn)的問題。
值得注意的是,當(dāng)人工智能軟件標(biāo)記圖像時(shí),仍然需要專業(yè)的編輯來決定要做什么。例如,如果同一個(gè)數(shù)據(jù)集在文中出現(xiàn)兩次,但表示了不同的意義,那么重復(fù)的圖像都需要保留。其次,由于手稿組裝過程中的簡單復(fù)制和粘貼錯(cuò)誤,也會出現(xiàn)圖像重復(fù)問題,但這是無意識發(fā)生的,并不是故意欺詐讀者。在這之前,這些問題都只能通過編輯和作者之間的討論來解決。
另外,現(xiàn)在人工智能變得足夠有效且成本低廉,專家表示,自動圖像檢查助手可能會在未來幾年席卷科學(xué)出版行業(yè),就像使用軟件檢查抄襲在十年內(nèi)成為常規(guī)一樣。出版業(yè)團(tuán)體還表示,他們正在探索比較不同期刊手稿中圖像的方法。
其他檢測圖像完整性專家也認(rèn)可這一發(fā)展趨勢,不過他們認(rèn)為,目前尚未對各種軟件產(chǎn)品進(jìn)行公開比較,并且自動檢查可能會產(chǎn)生過多誤報(bào)或遺漏某些圖片的問題。
從長遠(yuǎn)來看,對軟件篩選的依賴也可能會促使欺詐者使用人工智能來欺騙軟件,就像一些人通過調(diào)整文本來逃避抄襲篩選一樣。德國海德堡 EMBO Reports 期刊的主編伯納德?普爾韋爾(Bernd Pulverer)說:“我擔(dān)心我們正在與基于人工智能的技術(shù)進(jìn)行軍備競賽,這可能導(dǎo)致深度偽造圖像出現(xiàn)?!?/p>
二、不光用于重復(fù)檢測,還能改善圖片質(zhì)量
研究人員多年來一直在開發(fā)用于圖像檢查的人工智能軟件,因?yàn)樗麄儞?dān)心論文中的學(xué)術(shù)不端行為可能對科學(xué)文獻(xiàn)造成破壞,而這將遠(yuǎn)遠(yuǎn)超過文章中出現(xiàn)問題后,撤回文章或更正聲明所造成的破壞程度。
此前,荷蘭微生物學(xué)家伊麗莎白?比克(Elisabeth Bik)獨(dú)立或合作發(fā)表了大約 20000 篇生物醫(yī)學(xué)論文,2016 年研究人員對這些論文中的圖片進(jìn)行人工分析后,結(jié)果顯示有超 4% 的論文可能包含有問題的圖片。然而,通常每年只有大約 1% 的論文得到更正,被撤回的則更少。
▲ 荷蘭微生物學(xué)家伊麗莎白?比克(Elisabeth Bik)
“我知道全球大約有 20 家公司在開發(fā)圖像檢查軟件?!奔又萆镝t(yī)學(xué)研究圖像處理咨詢公司 Image Data Integrity 總裁邁克?羅斯納(Mike Rossner)說。
去年,全球部分科學(xué)出版商聯(lián)合成立了一個(gè)工作組,為篩選圖片問題的軟件制定標(biāo)準(zhǔn);該小組今年發(fā)布了關(guān)于編輯應(yīng)該如何處理篡改圖像的指導(dǎo)方針,但尚未制定軟件的指導(dǎo)方針。
一些學(xué)術(shù)團(tuán)體和公司告訴《自然》雜志,期刊和政府機(jī)構(gòu)正在試用他們的人工智能軟件,但 Proofig 是第一個(gè)公開客戶信息的公司。除了 AACR,美國臨床調(diào)查學(xué)會在 7 月份開始使用 Proofig 的軟件在《臨床調(diào)查》雜志(JCI)上審查手稿,美國臨床調(diào)查學(xué)會期刊的執(zhí)行編輯莎拉?杰克遜(Sarah Jackson)說。倫敦獨(dú)立學(xué)術(shù)出版公司 SAGE 的轉(zhuǎn)型負(fù)責(zé)人海倫?金(Helen King)稱,今年 10 月 SAGE Publishing 雜志在其五份生命科學(xué)期刊中采用了該軟件。
Proofig 的軟件從論文中提取圖像,并將它們成對地進(jìn)行比較,以找出共同特征。一般而言,論文的檢查時(shí)間大概在一兩分鐘內(nèi),Proofig 的創(chuàng)始人德羅?科洛德金?加爾(Dror Kolodkin-Gal)說,該軟件還可以糾正棘手的問題,例如將高分辨率原始數(shù)據(jù)壓縮成較小文件時(shí)可能出現(xiàn)的壓縮偽影?!坝?jì)算機(jī)比人類視覺更有優(yōu)勢?!彼f,“計(jì)算機(jī)不僅不會感到疲倦,運(yùn)行速度也會更快,而且它也不會受到大小、位置、方向、重疊、部分復(fù)制和這些因素組合的影響?!?/p>
關(guān)于圖片檢查的成本,加爾拒絕詳細(xì)討論定價(jià)問題,但他表示與出版商簽訂的合同往往根據(jù)論文中的圖像數(shù)量收費(fèi),同時(shí)也取決于手稿的數(shù)量。他說,這相當(dāng)于每張紙的收費(fèi)“接近幾十美元而不是幾百美元”。
杰克遜說,在《臨床調(diào)查》雜志中,該軟件發(fā)現(xiàn)的問題比以前工作人員手動審查的問題要多。雖然工作人員仍然需要檢查 Proofig 的輸出結(jié)果,但重要的是該期刊已經(jīng)擁有處理各種圖像問題的人工智能系統(tǒng)?!拔覀冋娴挠X得嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)是我們期刊的絕對標(biāo)志。我們認(rèn)為這值得花時(shí)間和金錢?!苯芸诉d說。同時(shí),在美國癌癥研究協(xié)會的期刊中,埃萬科說許多作者很高興在發(fā)表之前就發(fā)現(xiàn)了他們的圖片重復(fù)錯(cuò)誤。
三、AI + 人工,多個(gè)出版商自研軟件
與此同時(shí),位于瑞士洛桑的出版商 Frontiers 開發(fā)了自己的圖像檢查軟件 AIRA(人工智能審查助手),作為自動檢查系統(tǒng)的一部分。一位發(fā)言人說,自 2020 年 8 月以來,一個(gè)研究圖像完整性的團(tuán)隊(duì)一直在內(nèi)部使用 AIRA,用來對所有提交的手稿進(jìn)行圖像檢查。但該軟件標(biāo)記的大多數(shù)論文實(shí)際上沒有出現(xiàn)問題,僅有大約 10% 需要編輯團(tuán)隊(duì)跟進(jìn)。Frontiers 拒絕透露 AIRA 標(biāo)記的論文數(shù)量。
包括比克和羅斯納在內(nèi)的圖像完整性專家表示,他們自己還沒有嘗試過 AIRA 或 Proofig,很難評估尚未使用標(biāo)準(zhǔn)化測試進(jìn)行公開比較的軟件產(chǎn)品。羅斯納補(bǔ)充說,除了重復(fù)之外,檢測是否通過 PS 刪除或裁剪部分圖像也很重要?!叭斯ぶ悄苘浖赡苁且曈X篩選的有用補(bǔ)充,但它可能無法替代當(dāng)前形式?!?/p>
“不過,我相信這最終將成為稿件篩選的標(biāo)準(zhǔn)?!北瓤搜a(bǔ)充道。
尚未采用人工智能軟件圖像篩選的出版商提到了成本和可靠性問題。美國科學(xué)公共圖書館 PLOS 的一位發(fā)言人談道,他正在“熱切地”監(jiān)控這項(xiàng)研究的進(jìn)展情況,這些工具可以“可靠地識別常見的圖像完整性問題并且可以大規(guī)模應(yīng)用”。荷蘭出版集團(tuán)愛思唯爾(Elsevier)稱,它們“仍在測試”軟件,但它的一些期刊會在發(fā)表前篩選所有論文,并“使用軟件工具和手動分析的組合”檢查圖像。
一位發(fā)言人說,2020 年 4 月,學(xué)術(shù)出版商 Wiley 為臨時(shí)接受的手稿推出了圖像篩選服務(wù),目前有 120 多家期刊使用,但目前這是由軟件輔助的手動篩選?!蹲匀弧冯s志的出版商 Springer Nature 稱,它正在評估一些外部工具,同時(shí)整理數(shù)據(jù)以訓(xùn)練自己的軟件,該軟件將“結(jié)合互補(bǔ)的人工智能和人工來識別有問題的圖像”。
四、蛋白質(zhì)印跡都能偽造,推進(jìn)跨出版商檢測
普爾韋爾說:“EMBO Press 雜志仍然主要使用手動篩選,我不太相信商業(yè)產(chǎn)品的成本效益比?!倍移諣栱f爾是定義軟件標(biāo)準(zhǔn)的跨出版商工作組的成員,“我毫不懷疑,我們很快就會擁有高級工具?!?/p>
普爾韋爾擔(dān)心欺詐者可能會了解該軟件的工作原理,并使用人工智能軟件生成人們和軟件都無法檢測到的虛假圖像。盡管還沒有人表明此類圖像已經(jīng)出現(xiàn)在研究論文中,但去年發(fā)布在提供分發(fā)服務(wù)的網(wǎng)站 BioRxiv 上的一份預(yù)印本表明,論文中有可能出現(xiàn)與真實(shí)數(shù)據(jù)無法區(qū)分的生物圖像的偽造版本,例如蛋白質(zhì)印跡。
▲ 《細(xì)胞生物化學(xué)》雜志中論文內(nèi)蛋白質(zhì)印跡圖片(圖片來源為中國青年網(wǎng))
但研究人員正在解決這個(gè)問題,印第安納州西拉斐特普渡大學(xué)的計(jì)算機(jī)科學(xué)家愛德華?德爾普(Edward Delp)在美國國防高級研究計(jì)劃局資助的一個(gè)項(xiàng)目中領(lǐng)導(dǎo)了一個(gè)團(tuán)隊(duì),該團(tuán)隊(duì)正在研究檢測人工智能偽造圖像的軟件,并專注于偽造的生物圖像,例如顯微鏡圖像和 X 射線,一篇描述該系統(tǒng)的論文正在審查中。
▲ 光學(xué)顯微鏡捕捉細(xì)胞和組織的顯微照片
目前,人工智能圖像檢查通常在手稿中完成,而不是在論文中完成,這將使其計(jì)算量越來越大。但商業(yè)和學(xué)術(shù)軟件開發(fā)商表示,這在技術(shù)上是可行的。紐約雪城大學(xué)的計(jì)算機(jī)科學(xué)家丹尼爾?阿庫尼亞(Daniel Acu?a)去年在數(shù)千份新冠疫情相關(guān)的預(yù)印本上成功運(yùn)行了人工智能檢測軟件,以查找重復(fù)項(xiàng)。
Crossref 是一家由 15000 多個(gè)組織組成的美國非營利性合作組織,該組織負(fù)責(zé)組織跨論文的抄襲檢查等。Crossref 的倫敦產(chǎn)品總監(jiān)布萊恩?維克里(Bryan Vickery)稱,他們目前正在開展一項(xiàng)調(diào)查,詢問其成員對篡改圖像的擔(dān)憂、他們使用的軟件以及可以共享圖像的“跨出版商服務(wù)”是否可行。
今年 12 月,英國牛津?qū)W術(shù)出版商行業(yè)組織 STM 的子公司 STM Solutions,宣布它正在開發(fā)一個(gè)云平臺,以幫助出版商合作“檢查提交的文章是否存在研究誠信問題”,同時(shí)保持隱私和保密。STM 發(fā)言人馬特?麥凱(Matt McKay)表示,檢測跨期刊的圖像篡改、重復(fù)和抄襲“在我們的路線圖中占據(jù)重要位置”。
結(jié)論:圖像檢測要集成人工智能軟件、云數(shù)據(jù)平臺
論文中的學(xué)術(shù)不端將會對期刊、作者等都造成較大的影響。此前,學(xué)術(shù)期刊都依靠編輯人工篩選,來發(fā)現(xiàn)論文中的圖像錯(cuò)誤問題,但由于人工審查的局限性,總會出現(xiàn)“漏網(wǎng)之魚”。因此,隨著人工智能技術(shù)的不斷發(fā)展和完善,人工智能檢測技術(shù)將成為論文圖像檢測的主要手段。
但由于人工智能技術(shù)無法依據(jù)情境對圖像進(jìn)行判斷,最終還是需要人工編輯審核,但這仍大大降低了編輯的工作量。杰克遜說,在臨床調(diào)查雜志中,人工智能軟件發(fā)現(xiàn)的問題比以前工作人員手動審查的問題要多。
此外,在圖像檢測領(lǐng)域建立人工智能軟件審查的云數(shù)據(jù)平臺也至關(guān)重要,實(shí)現(xiàn)跨出版商檢測,能夠有效避免因地區(qū)、學(xué)科不同而出現(xiàn)的學(xué)術(shù)不端行為。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。