首頁 > 科學(xué)探索>科技前沿

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

量子位 2022/12/14 12:25:13 責(zé)編：遠(yuǎn)生

評論：

ChatGPT 的出現(xiàn)，讓不少人看到了交期末大作業(yè)的曙光（手動狗頭）。

無論是英語論文、還是閱讀筆記，只要在 ChatGPT 的知識范圍內(nèi)，都可以拜托它幫忙完成，寫出來的內(nèi)容也有理有據(jù)。

不過，有沒有想過你的老師也準(zhǔn)備用“AI 文本檢測器”一類的東西來防止你作弊？

像這樣輸入一段看起來沒毛病的筆記，經(jīng)過它一番檢測，認(rèn)為這段文字“由 AI 編寫”（Fake）的可能性為 99.98%！

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

△ 文本由 ChatGPT 生成

換個數(shù)學(xué)論文試試？ChatGPT 的輸出看起來沒啥問題，卻仍然被它準(zhǔn)確識破了：

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

△ 文本由 ChatGPT 生成

這可不是靠瞎蒙或猜測，畢竟對方同樣是個 AI，還是個訓(xùn)練有素的 AI。

看到這有網(wǎng)友調(diào)侃：用魔法打敗魔法？

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

用 AI 寫的東西來訓(xùn)練新 AI

這個 AI 檢測器名叫 GPT-2 Output Detector，是 OpenAI 聯(lián)合哈佛大學(xué)等高校和機(jī)構(gòu)一起打造的。（沒錯，OpenAI 自家做的）

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

輸入 50 個以上字符（tokens）就能較準(zhǔn)確地識別 AI 生成的文本。

但即便是專門檢測 GPT-2 的模型，用來檢測其他 AI 生成文本效果也同樣不錯。

作者們先是發(fā)布了一個“GPT-2 生成內(nèi)容”和 WebText（專門從國外貼吧 Reddit 上扒下來的）數(shù)據(jù)集，讓 AI 理解“AI 語言”和“人話”之間的差異。

隨后，用這個數(shù)據(jù)集對 RoBERTa 模型進(jìn)行微調(diào)，就得到了這個 AI 檢測器。

RoBERTa（Robustly Optimized BERT approach）是 BERT 的改進(jìn)版。原始的 BERT 使用了 13GB 大小的數(shù)據(jù)集，但 RoBERTa 使用了包含 6300 萬條英文新聞的 160GB 數(shù)據(jù)集。

其中，人話一律被識別為 True，AI 生成的內(nèi)容則一律被識別為 Fake。

例如這是一段從 Medium 英文博客上復(fù)制的內(nèi)容。從識別結(jié)果來看，很顯然作者是親自寫的（手動狗頭）：

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

△ 文字來源 Medium@Megan Ng

當(dāng)然，這個檢測器也并非 100% 準(zhǔn)確。

AI 模型參數(shù)量越大，生成的內(nèi)容越不容易被識別，例如 1.24 億參數(shù)量的模型“被抓包”的概率就比 15 億參數(shù)更高。

同時，模型生成結(jié)果隨機(jī)性越高，AI 生成內(nèi)容被檢測出來的概率也會更低。

但即便將模型調(diào)整到生成隨機(jī)性最高（Temperature=1，越接近 0 生成隨機(jī)性越低），1.24 億參數(shù)模型被檢測出的概率仍然是 88%，15 億參數(shù)模型被檢測出的概率仍然有 74%。

這是 OpenAI 兩年前發(fā)布的模型，當(dāng)時對 GPT-2 生成的內(nèi)容就“一打一個準(zhǔn)”。

現(xiàn)在面對升級版的 ChatGPT，檢測英文生成內(nèi)容的效果依舊能打。

但面對 ChatGPT 生成的中文，它的識別能力就不那么好了。例如讓 ChatGPT 來一段作文：

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

AI 檢測器給出是人寫的概率為 99.96%……

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

當(dāng)然話說回來，ChatGPT 也能檢測自己生成的文本。

所以，不排除老師將你的作業(yè)直接交給 ChatGPT 來識別：

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

One More Thing

值得一提的是，ChatGPT 表示自己并不能訪問互聯(lián)網(wǎng)來搜索信息。

顯然，它還意識不到 GPT-2 Output Detector 這個 AI 檢測器的存在：

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

所以能不能像網(wǎng)友所說，讓 ChatGPT 生成一段“不被 AI 檢測器測出來的”內(nèi)容呢？

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

很遺憾不能：

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

所以大作業(yè)還是自己寫吧……

參考鏈接：

[1]https://weibo.com/1402400261/Mj7QtwRoH
[2]https://github.com/openai/gpt-2-output-dataset/tree/master/detector
[3]https://chat.openai.com/
[4]https://medium.com/user-experience-design-1/how-chatgpt-is-blowing-google-out-of-the-water-a-ux-breakdown-784340c25d57

本文來自微信公眾號：量子位（ID：QbitAI），作者：蕭簫

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出

用 AI 寫的東西來訓(xùn)練新 AI

One More Thing

相關(guān)文章

ChatGPT“克星”：用 AI 識別 AI 生成的文本，英語論文閱讀筆記都能測出