首頁 > 科學探索>科技前沿

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

量子位 2023/1/10 11:45:11 責編：夢澤

評論：

原文標題：《ChatGPT「克星」來了！文章作者是人是 AI 幾秒檢出，華人小哥元旦假期搞定，服務(wù)器已擠爆》

你說 ChatGPT，它寫的東西逼真到傻傻分不清？

沒關(guān)系！

現(xiàn)在，它的“克星”來了 ——

一位華人小哥專門搞了這么一個網(wǎng)站，專門鑒別文字到底是出自于 AI 還是人類。

你只需要把相應(yīng)的內(nèi)容粘進去，幾秒內(nèi)就能分析出結(jié)果。

比如這段：

它：“妥妥的人類～”

至于這段：

它：“就知道是 AI?！?/p>

如此神器一出，可謂迅速俘獲大家的芳心。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

這不，直接把服務(wù)器都給擠崩嘍（好在還有個備用的）。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

這下，那些用 ChatGPT 寫作業(yè)的“熊孩子”也要慘啦？

是人還是 ChatGPT？GPTZero：看我的

這個網(wǎng)站名叫 GPTZero。

它主要靠“perplexity”，即文本的“困惑度”作為指標來判斷所給內(nèi)容到底是誰寫的。

NLP 領(lǐng)域的朋友們都知道，這個指標就是用來評價一個語言模型的好壞的。

在這里，每當你喂給 GPTZero 一段測試內(nèi)容，它就會分別計算出：

1、文字總困惑度

這個值越高，就越可能出自人類之手。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

2、所有句子的平均困惑度

句子越長，這個值通常就越低。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

3、每個句子的困惑度

通過條形圖的方式呈現(xiàn)，鼠標懸浮到各個方塊就可以查看相應(yīng)的句子是什么（這里就兩塊，因為我此時輸入的測試內(nèi)容就倆句子）。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

之所以要繪制這樣的條形圖，作者也作出了解釋：

根據(jù)最新的一些研究：人類書寫的一些句子可能具有較低的困惑度（前面說過，人類的困惑度是比較高的），但隨著繼續(xù)寫，困惑度勢必會出現(xiàn)峰值。
相反，用機器生成的文本，其困惑度是均勻分布的，并且總是很低。

除此之外，GPTZero 還會挑出困惑度最高的那個句子（也就是最像人寫的）：

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

規(guī)則就是這些，接下來實際測一測。

測試 1：成功

首先來一段最新的英文新聞（目前還不支持測中文）：

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

將它粘貼進測試框（需注意每句至少 5 個單詞，建議每段能有 10 個句子，結(jié)果會更準一些）。

很快，GPTZero 計算出這段文字的總文字困惑度為 27，句子平均困惑度為 171.2，每條句子的困惑度圖長這樣：

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

以及困惑度最高的句子的值為 476。

看這個結(jié)果，估計你也猜出了 GPTZero 的答案：

是人類寫的。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

答對了。

測試 2：失敗

來一段 ChatGPT 的。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

將內(nèi)容粘貼進測試框，得出這段文字的總文字困惑度為 31，句子平均困惑度為 76.67，每條句子的困惑度圖長這樣：

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

以及困惑度最高的句子的值為 99。

看起來，每項困惑度值都和上面那段差距都挺大的，應(yīng)該能猜出來是 AI 寫的吧。

不過遺憾的是，GPTZero 無法給出答案，還希望我們再多加一點文字試試。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

顯然，這段話字數(shù)夠多，但句子不夠多，無法讓 GPTZero 一眼識破 ChatGPT 的“偽裝”。

測試 3：成功

那我們再來一段 ChatGPT 的試試。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

這回內(nèi)容夠長，句子也夠多。

果然沒問題了，GPTZero 直接答對：

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

好像確實摸出來一點門道：

那就是字多的同時，句子數(shù)量也一定要多，至少 5 句，好讓 GPTZero 通過直方圖的分布加碼識別，最后的準確率就可以提高一些。

另外還需要提的是，我們發(fā)現(xiàn)在挑戰(zhàn)失敗的情況中，除了上面這種識別不出來的時候，也有直接識別錯誤的 ——

比如把 AI 寫的判斷成人寫的：

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

把人寫的新聞判斷成 AI 的：

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

這種情況按照上面所說的竅門，再多加點內(nèi)容可能就能將結(jié)果扳回來。

（注意是可能哈，就上面這段新聞，我們把所有內(nèi)容都粘進去了，它也說不行，還說要再多來點。）

普林斯頓華人小哥出品

創(chuàng)建該網(wǎng)站的，是一個 22 歲的華人小哥 Edward Tian，來自加拿大多倫多。

目前是美國普林斯頓 CS 專業(yè)大四學生，輔修認知科學和新聞學，對軟件工程、機器學習等有濃厚的興趣。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出

他現(xiàn)在微軟實習，曾在 BBC、貝靈貓等公司撰寫過科技稿件，還曾加入到地圖工具 Representable 的創(chuàng)始團隊。

學習期間，他曾來到清華大學參加為期四周的城市研究研討會。

據(jù)他表示，這個應(yīng)用程序是新年假期在咖啡店完成的。

之所以想要開發(fā)這款應(yīng)用程序，簡而言之就是因為有太多 ChatGPT 炒作，人類應(yīng)該知道有哪些是 AI 寫的文章。

目前仍處于準系統(tǒng)階段，預(yù)計在接下來幾周內(nèi)改進模型和分析。

除此之外，他還透露，正在測試由學生撰寫的新聞文章數(shù)據(jù)集，并希望最終能發(fā)表論文。

ChatGPT「克星」來了，文章作者是人是 AI 幾秒檢出