讓眾人瘋狂的網(wǎng)紅 AI ChatGPT,原來也有明顯的短板?
一段“網(wǎng)友調教這只 AI”的聊天記錄,在網(wǎng)上傳開了。
可以看到,AI 起初居然說 27 是個質數(shù)。
在網(wǎng)友向其提出質疑后,AI 仍嘴硬稱“27 不能被 3 整除”。
網(wǎng)友不得不和 AI“大戰(zhàn)幾百回合”,最后在人類鍥而不舍的教導下,AI 才終于終于低頭認錯。
有一說一,AI 的認錯態(tài)度倒是很好。
有圍觀者看完后調侃:AI 不是都要統(tǒng)治世界了嗎,怎么會輸給一道簡單的數(shù)學題?
不過,也有很多人為 ChatGPT 說話:這么坦誠的認錯態(tài)度,不比某些人強多了。
數(shù)學水平拉胯,還賊固執(zhí)
具體事情是這樣的:
網(wǎng)友在和 ChatGPT 互動的過程中發(fā)現(xiàn),這只 AI 數(shù)學水平過于拉胯,連 27 是不是質數(shù)這種簡單問題都能搞錯 —— 而且還是在知道質數(shù)定義的情況下……
于是網(wǎng)友讓 ChatGPT 證明它給出的結論,沒想到,AI 居然說 27 不能被 3 整除。
網(wǎng)友表示無語,但還是耐著性子又問了一遍,結果 AI 依然嘴硬,偏把 9 說成是 9.0。
無奈,網(wǎng)友只能搬出代碼,試著用 Python 來教會 AI。
結果 AI 還真學會了!而且人家還主動承認了剛才的錯誤。
有意思的是,我們剛才也去問了 ChatGPT“27 是不是質數(shù)”,發(fā)現(xiàn)它已經(jīng)改過來了。
然后我們又拿了幾個數(shù)字去問 AI,結果在這一回合中,它都正確地判斷了一個數(shù)到底是不是質數(shù)。
不過仔細一看,AI 并沒提到 35 能被 7 整除,于是我們又專門問了一遍。然鵝……
這豈不是一本正經(jīng)地胡說八道嘛?
于是我們也只好搬出 Python 教教它,但這回,連 python 似乎也沒能讓 AI 承認自己的錯誤……
所以這只 AI 為啥算術水平如此堪憂,而且還如此固執(zhí)?
其中一個重要的原因就是,ChatGPT 是個語言大模型,根據(jù) Open AI 的 GPT-3.5 的模型微調而成,它擅長邏輯推理,但并不能執(zhí)行標準的計算機算法。
而且與搜索引擎不同,它目前也沒有網(wǎng)頁瀏覽功能,無法調用在線計算器。
此前,ChatGPT 其實已經(jīng)向用戶坦言,它不懂算術。兩位數(shù)的乘法或許還湊乎,但遇到三位數(shù)的乘法,人家直接不干了。
我們也去問了一遍,現(xiàn)在 AI 到是直接給了個答案,不過是錯的。(正確答案為 186524)
另外,ChatGPT 一般不會根據(jù)用戶的反饋來糾正自己的答案,但如果用戶提出了額外的信息,有時也能輔助 AI 優(yōu)化答案。
所以,我們暫時沒有成功地“教育”AI,大概也許可能是運氣不太好……
除了數(shù)學其他都很全能
盡管 ChatGPT 有時會展現(xiàn)出“人工智障”的一面,但不得不說,大多數(shù)時候它的表現(xiàn)還是很優(yōu)秀的。
比如,哥倫比亞大學教授、谷歌工程師 Kenneth Goodman 就分享,ChatGPT 已經(jīng)做好成為律師的準備了!
在律師執(zhí)業(yè)考試中,ChatGPT 的正確率高達 70%(35/50)。
不僅是法律方面,Goodman 還讓 ChatGPT 參加了其他不同領域的各種考試,都取得了很高的成績。
包括美國醫(yī)師執(zhí)照考試(USMLE),拿掉其中的圖像選擇題后,ChatGPT 同樣做到了 70% 的正確率。
為了防止 ChatGPT 的訓練數(shù)據(jù)中包含這些題目,Goodman 還特意選取了紐約州 2022 年 8 月最新化學注冊考試:
去除 5 個圖片選擇題,ChatGPT 的正確率為 77.7%(35/45)。
同樣批次的英語考試中,ChatGPT 的正確率甚至達到了 91.6%(22/24)
有網(wǎng)友已經(jīng)開始預測,或許我們每個人都將擁有自己的律師 AI 了,咨詢律師的費用也會大大下降。接下來就是醫(yī)生 AI、營養(yǎng)師 AI……
怎么樣,你看好 ChatGPT 的未來應用嗎?(或者你有讓它學好數(shù)學的建議嗎?)
參考鏈接:
[1]https://weibo.com/7095186006/Mj6LVF0zS#comment
[2]https://twitter.com/TonyZador/status/1601316732689604608
[3]https://twitter.com/pythonprimes/status/1601664776194912256
本文來自微信公眾號:量子位 (ID:QbitAI),作者:Alex 羿閣
廣告聲明:文內(nèi)含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。