IT之家 4 月 13 日消息,據(jù)澎湃新聞報道,北京智源人工智能研究院回復(fù)谷歌大腦的著名科學(xué)家 Nicholas Carlini 對一項中外合作大型學(xué)術(shù)論文涉嫌剽竊的指控稱:“我們已經(jīng)注意到對《A Roadmap for Big Model(關(guān)于“大模型”的路線圖)》一文的質(zhì)疑,正在對相關(guān)情況進行核實,智源研究院鼓勵學(xué)術(shù)創(chuàng)新和學(xué)術(shù)交流,對學(xué)術(shù)不端零容忍,有關(guān)進展將盡快通報?!?/p>
此前 4 月 8 日,這篇數(shù)十位國內(nèi) AI 大牛參與論文被指嚴(yán)重抄襲,Nicholas Carlini 公開撰文,指控一篇于今年 3 月 26 日刊登在論文預(yù)印網(wǎng)站 Arxiv 的論文《關(guān)于“大模型”的路線圖》(A Roadmap for Big Model)一文涉嫌嚴(yán)重抄襲。
該文是前不久國內(nèi)外多家高校和企業(yè)共同完成的長達 200 頁的學(xué)術(shù)綜述論文,有多達 100 名作者,分別來自于清華大學(xué)、北京大學(xué)等國內(nèi)高校,哥倫比亞大學(xué)、蒙特利爾大學(xué)等國外高校,字節(jié)跳動、華為、京東、騰訊等企業(yè)以及中科院和北京智源等機構(gòu)。
Nicholas Carlini 在文章《機器學(xué)習(xí)研究中的一個抄襲案例》(“A Case of Plagarism in Machine Learning Research”)中則詳細列舉了該論文存在大段抄襲其他論文的嫌疑,證據(jù)是大規(guī)模的文本重疊,疑似被剽竊的論文也包括他自己的論文“Deduplicating Training Data Makes Language Models Better”。
此前 3 月 31 日,北京智源社區(qū)撰文以《如何煉大模型?200 頁 pdf100 + 位作者 19 家單位!北京智源清華唐杰等發(fā)布》介紹該篇論文:“隨著以深度學(xué)習(xí)為代表的 AI 技術(shù)的快速發(fā)展,智能模型的訓(xùn)練應(yīng)用模式逐漸由‘大煉模型’向‘煉大模型’轉(zhuǎn)變。大模型研究在近年來發(fā)展迅速,模型的參數(shù)量以驚人的速度擴展。北京智源人工智能研究院最近發(fā)布的《A Roadmap for Big Model》由悟道大模型研究項目負責(zé)人,智源學(xué)術(shù)副院長,清華大學(xué)計算機系教授唐杰牽頭,從大模型基礎(chǔ)資源、大模型構(gòu)建、大模型關(guān)鍵技術(shù)與大模型應(yīng)用探索 4 個層面出發(fā),對 15 個具體領(lǐng)域的 16 個相關(guān)主題進行全面介紹和探討。非常值得關(guān)注?!?/p>
IT之家了解到,Nicholas Carlini 也在其博客中表示:“很可能只有少數(shù)作者參與了這種抄襲,一小部分作者的不當(dāng)行為不應(yīng)該被用來指責(zé)大多數(shù)行為良好的作者?!?/span>
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。