北京時間 2 月 15 日上午消息,據報道,谷歌聊天機器人演示活動現(xiàn)場翻車導致其股價當天暴跌逾 7%,但微軟的演示活動同樣出現(xiàn)了事實性錯誤。
上周的科技圈掀起了一個聊天機器人的小高潮,微軟和谷歌都試圖通過展示早起版本的 AI 搜索來先發(fā)制人。微軟更是宣布,該公司的 AI 搜索僅用 48 小時就吸引 100 多萬人注冊。
這種技術可以針對用戶的問題直接給出答案,看起來就像是真人創(chuàng)作的一樣。微軟 CEO 薩提亞?納德拉(Satya Nadella)表示,該技術“或許會掀起知識工作的工業(yè)革命”。
但對于擔心準確性的人來說,人工智能還有許多不足之處。
在微軟進行演示時,這項嵌入在必應搜索中的類 ChatGPT 技術分析了 Gap 和 Lululemon 的財報。但業(yè)內人士將其給出的答案與財報原文對比后卻發(fā)現(xiàn),這款聊天機器人遺漏了一些數據,甚至會杜撰一些內容。
“必應 AI 在演示過程中給出了一些完全錯誤的答案,但卻沒人注意到?!豹毩⑺阉饕嫜芯繂T德米特里?布里爾頓(Dmitri Brereton)寫道,“相反,大家都對必應的宣傳歡欣鼓舞?!?/p>
布里爾頓發(fā)現(xiàn),除了財務數據上的錯誤外,微軟在演示中針對吸塵器規(guī)格和墨西哥旅行計劃的回答可能存在事實性錯誤。布里爾頓最初并不是為了給微軟“挑刺”,他只是在細致對比微軟和谷歌的答案時意外發(fā)現(xiàn)了這些問題。
人工智能專家稱這一現(xiàn)象為“幻覺”,也就是說,基于大語言模型生成的工具有杜撰內容的傾向。上周,谷歌推出了一款與之競爭的人工智能工具,演示過程中同樣存在事實性錯誤 —— 但當時的錯誤很快就被人發(fā)現(xiàn)。
這兩家公司都在加緊將新型生成式人工智能整合進搜索引擎,希望在 ChatGPT 引爆行業(yè)熱潮后向世人展示自己在這方面的優(yōu)勢。ChatGPT 是去年 11 月由創(chuàng)業(yè)公司 OpenAI 推出的,他們已經通過微軟融資百億美元,與之競爭的 Stability AI 和 Hugging Face 等創(chuàng)業(yè)公司也在融資中獲得了數十億美元的估值。
谷歌與微軟對待這項技術的態(tài)度差異明顯:由于擔心聲譽風險和安全問題,谷歌遲遲不愿將 AIGC(人工智能生成內容)技術整合進搜索引擎,而微軟卻在上周強調,有可能在短期內向部分公眾開放這項技術。
“我認為不能讓這項技術躺在實驗室里,”納德拉說,“應該安全地推廣出去?!?/p>
但在必應 AI 的演示過程中,的確在公司財報數據上出現(xiàn)了一些問題。
微軟營銷高管約瑟夫?梅赫蒂(Yusuf Mehdi)在演示過程中訪問了 Gap 的投資者關系網站,然后讓必應 AI 根據這家零售商 11 月發(fā)布的第三季財報總結出“要點”。
“很酷,節(jié)約了大量時間?!泵泛盏僬f。
下面是微軟演示過程的屏幕截圖:
以下是這份總結中存在的錯誤:
-Gap 報告的毛利率為 37.4%。但在去除與 Yeezy 有關的費用后,調整后毛利率為 38.7%。
-Gap 的運營利潤率為 4.6%,而非 5.9%。5.9% 這個數據在該公司的財報中根本沒有出現(xiàn)。
-調整后攤薄每股收益為 0.71 美元,而非 0.42 美元,后者同樣在財報中無法找到。Gap 的財報包含一個調整后所得稅收益,約為 0.33 美元。
-Gap 去年 8 月下調了全年預期,并在第三季度財報中表示,“第四季度銷售額可能同比下滑個位數左右”。由此看來,全年營收應該下滑,而非“較低的兩位數增長”。并沒有營業(yè)利潤率或每股收益預期。
微軟表示,該公司知道這些錯誤,他們也預計必應 AI 會犯一些錯誤。
“我們知道這份報告,并且已經通過分析這一問題來改善體驗?!蔽④洶l(fā)言人說,“我們承認仍然有一些工作要做,并且預計到該系統(tǒng)可能會在預覽期間犯一些錯誤,正因如此,反饋才至關重要,這可以幫助我們學習和改進模型?!?/p>
微軟隨后讓必應 AI 對比了 Gap 和 Lululemon 的財報。梅赫蒂希望必應能將兩份財報的數據提取出來,制作成一份表格。
“看看效果多么驚人?!彼f,“就像這樣,一張表格,這個問題的答案有了??梢韵胂笠幌?,用其他方法需要花多長時間?!?/p>
下面是必應 AI 的結果:
下面是表格中出現(xiàn)的幾項錯誤,從利潤率開始:
-Lululemon 的毛利率是 55.9%,不是 58.7%。
-該公司的運營利潤率是 19%,不是 20.7%
-Lululemon 的攤薄每股收益為 2 美元,調整后每股收益為 1.62 美元,必應顯示的攤薄每股收益為 1.65 美元。
-Gap 現(xiàn)金及現(xiàn)金等價物為 6790 萬美元,不是 14 億美元。
-Gap 庫存為 30.4 億美元,不是 19 億美元。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。