改論文,有時(shí)候比寫論文痛苦。
無(wú)論是導(dǎo)師“刷屏”的一個(gè)個(gè)建議,還是期刊給回來(lái)的審稿意見,都能折磨得人頭發(fā)狂掉。
好消息是,現(xiàn)在 AI 終于可以幫你改論文了。
像是給論文引用的某個(gè)算法 / 觀點(diǎn)加上原始參考文獻(xiàn):
又或是修改文中的一些事實(shí)性錯(cuò)誤:
都只需要描述一句話(直接粘貼導(dǎo)師的修改意見),AI 就能準(zhǔn)確領(lǐng)會(huì)你的意圖,并上手改動(dòng)論文。
最關(guān)鍵的是,改動(dòng)的地方 AI 還會(huì)給出解釋,讓你流利應(yīng)對(duì)導(dǎo)師的“突擊檢查”:
這是 Meta AI 搞出來(lái)的最新協(xié)同語(yǔ)言模型 PEER,要解決的就是 AI 會(huì)生成文章、卻不會(huì)改文章的問(wèn)題。
▲ 人均撲克高手(doge)
看到這里,一名在讀博士生狂喜:“沒(méi)寫完的博士論文有著落了!”
還有網(wǎng)友表示:
很棒的工作,如果 LLM 沒(méi)有交互性,那終將成為一個(gè)死胡同?!躲y河系漫游指南》的作者一定會(huì)喜歡它的。
那么,這只 AI 究竟是怎么學(xué)會(huì)“改文章”的?
用 AI 幫 AI 一步步“捋順?biāo)悸贰?/h2>
此前 AI 會(huì)寫卻不會(huì)改論文,主要有三點(diǎn)原因:
①無(wú)法控制文章細(xì)節(jié),搞不懂自己要改啥;
②無(wú)法聽懂人類的命令;
③解釋不了自己生成了什么。
為此,Meta AI 的研究人員用 4 個(gè)編解碼器組成 PEER,每個(gè)編解碼器干不同的活。
它們被分別命名為 PEER-Edit(整體規(guī)劃 & 編輯)、PEER-Undo(還原編輯步驟)、PEER-Explain(解釋編輯目的)、PEER-Document(搜集素材)。
這幾個(gè)編解碼器并非獨(dú)立工作,它們的作用是相輔相成的。例如,PEER-Undo 的出現(xiàn),實(shí)際上就是為了加強(qiáng) PEER-Edit 的編輯能力。
PEER-Edit 是 4 個(gè)編解碼器中的核心骨干,它會(huì)在輸入一段待修改文本和參考素材后,決定如何對(duì)文本進(jìn)行編輯,并給出編輯結(jié)果。
但如果直接用待修改文本和參考素材訓(xùn)練 PEER-Edit,會(huì)發(fā)現(xiàn)它的編輯能力不穩(wěn)定。
因此,需要用 PEER-Undo 來(lái)根據(jù) PEER-Edit 的輸出和素材,盡可能還原 PEER-Edit 編輯過(guò)的每個(gè)步驟,有點(diǎn)像是“幫對(duì)方捋順編輯思路”。
這樣一來(lái),PEER-Edit 就會(huì)意識(shí)到“原來(lái)我打算這樣編輯”,并借助 PEER-Undo 生成的結(jié)果,有意識(shí)加強(qiáng)訓(xùn)練效果。
在 PEER-Edit 和 PEER-Undo 之外,PEER-Explain 和 PEER-Document 的作用就相對(duì)好理解了。
其中,PEER-Explain 負(fù)責(zé)將最終編輯的結(jié)果“變成人話”;PEER-Document 則負(fù)責(zé)到網(wǎng)上收集修改用的素材(包括但不限于維基百科),給 PEER-Edit“打零工”。
4 個(gè)編解碼器加在一起,就組成了一個(gè)既能與人溝通、了解修改意圖,也能上手查找資料、編輯論文的協(xié)同語(yǔ)言模型 PEER。
團(tuán)隊(duì)將它與其他模型的能力進(jìn)行了比較。
110 億參數(shù)實(shí)現(xiàn) SOTA
具體來(lái)說(shuō),比較的模型包括一些基于 T5(Text-to-Text Transfer Transformer)的模型和一些 1750 億參數(shù)的解碼器模型(GPT-3)等。
從圖中可見,PEER 系列的模型參數(shù)最高也就 110 億左右,但在一些相關(guān)評(píng)估上都刷新了 SOTA。
從可以實(shí)現(xiàn)的效果來(lái)看,基本上能直接通過(guò)交互,讓 AI 寫出一段論文并修改:
例如“刪掉沒(méi)信源的表述”、以及“把步驟列出來(lái)”,這只 AI 都能準(zhǔn)確理解并實(shí)現(xiàn):
不過(guò)對(duì)于這個(gè)模型,也有網(wǎng)友提出了一個(gè)設(shè)想:
如果讓 PEER 去審查 PEER 自己的文章,會(huì)怎樣呢?(手動(dòng)狗頭)
論文地址:
https://arxiv.org/abs/2208.11663
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。