設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

蘋果 AI 研究:“獼猴桃”簡單算術(shù)考倒 o1 和 Llama 等 20 多個(gè)最先進(jìn)模型

2024/11/2 7:41:20 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 11 月 2 日消息,《洛杉磯時(shí)報(bào)》昨日(11 月 1 日)發(fā)布博文,報(bào)道稱蘋果研究團(tuán)隊(duì)測試了 20 個(gè)最先進(jìn)的 AI 模型,發(fā)現(xiàn)在有干擾項(xiàng)存在的情況下,它們處理簡單的算術(shù)問題時(shí)表現(xiàn)不佳,甚至不如小學(xué)生。

蘋果公司用以下這道簡單的算術(shù)題測試 20 多個(gè)最先進(jìn)的 AI 模型,IT之家附上題目如下:

Oliver 在星期五采摘了 44 個(gè)獼猴桃、然后他在星期六采摘了 58 個(gè)獼猴桃,星期日采摘的數(shù)量是星期五的兩倍,不過其中有 5 個(gè)獼猴桃的塊頭要比平均值要小,請問 Oliver 這三天共摘了多少個(gè)獼猴桃?

正確答案是 190 個(gè),計(jì)算公式為 44(星期五)+58(星期六)+88(44*2,星期日)。

不過測試的 20 多個(gè)最先進(jìn) AI 模型無法排除干擾項(xiàng),通常不理解獼猴桃的大小和數(shù)量無關(guān),大部分的結(jié)果是 185 個(gè)。

蘋果團(tuán)隊(duì)發(fā)現(xiàn),當(dāng)問題包含看似相關(guān)但實(shí)際上無關(guān)的信息時(shí),AI 模型的表現(xiàn)急劇下降。對此研究認(rèn)為,AI 模型主要依賴于訓(xùn)練數(shù)據(jù)中的語言模式,而非真正理解數(shù)學(xué)概念。

蘋果的研究表明,目前的 AI 模型“無法進(jìn)行真正的邏輯推理”。這一發(fā)現(xiàn)提醒我們,盡管 AI 在某些任務(wù)上表現(xiàn)出色,但其智能并不如表面看起來那樣可靠。

蘋果團(tuán)隊(duì)指出,簡單地?cái)U(kuò)展數(shù)據(jù)或計(jì)算能力并不能根本解決這個(gè)問題,蘋果的論文并非旨在削弱對 AI 能力的熱情,而是提供一種理性的認(rèn)知。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:蘋果,AI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知