2024 年另類 AI 評(píng)測(cè)標(biāo)準(zhǔn)走紅：“威爾?史密斯吃意大利面”領(lǐng)銜

2025/1/1 12:17:19 來源：IT之家作者：遠(yuǎn)洋 責(zé)編：遠(yuǎn)洋

評(píng)論：

IT之家 1 月 1 日消息，據(jù) TechCrunch 報(bào)道，隨著人工智能視頻生成技術(shù)的不斷發(fā)展，一個(gè)有趣的現(xiàn)象開始在業(yè)內(nèi)流行：當(dāng)一家公司發(fā)布全新的人工智能視頻生成器時(shí)，似乎總有人會(huì)第一時(shí)間用它來制作威爾?史密斯吃意大利面的視頻。這不僅演變成了一種網(wǎng)絡(luò)熱梗，更成為衡量新型 AI 視頻生成器性能的非官方基準(zhǔn) —— 檢驗(yàn)其能否逼真地呈現(xiàn)史密斯狼吞虎咽吃面的場(chǎng)景。史密斯本人也在去年 2 月通過 Instagram 發(fā)布了一段模仿視頻，親自參與了這場(chǎng)網(wǎng)絡(luò)狂歡。

IT之家注意到，“威爾?史密斯吃意大利面”只是 2024 年人工智能領(lǐng)域眾多奇特“非官方”評(píng)測(cè)標(biāo)準(zhǔn)中的一個(gè)，此前還有一位 16 歲的開發(fā)者開發(fā)了一款應(yīng)用程序，讓人工智能控制《我的世界》（Minecraft）游戲，并以此測(cè)試其建筑設(shè)計(jì)能力。與此同時(shí)，還有一位英國(guó)程序員創(chuàng)建了一個(gè)平臺(tái)，讓人工智能在“你畫我猜”（Pictionary）和“四子棋”（Connect 4）等游戲中相互對(duì)戰(zhàn)。

人工智能領(lǐng)域不乏更學(xué)術(shù)化的性能測(cè)試，那么為何這些略顯怪異的測(cè)試反而能夠迅速走紅呢？原因之一在于，許多行業(yè)標(biāo)準(zhǔn)的人工智能基準(zhǔn)測(cè)試對(duì)普通人來說過于晦澀難懂。企業(yè)經(jīng)常標(biāo)榜其人工智能在奧林匹克數(shù)學(xué)競(jìng)賽或博士級(jí)別難題中的解題能力，但大多數(shù)人使用聊天機(jī)器人只是為了聊天或回復(fù)電子郵件。

即使是行業(yè)內(nèi)普遍采用的評(píng)測(cè)方法，也未必更有效或更具信息量。以受到眾多人工智能愛好者和開發(fā)者密切關(guān)注的公共基準(zhǔn)測(cè)試平臺(tái)“聊天機(jī)器人競(jìng)技場(chǎng)”（Chatbot Arena）為例，其允許任何網(wǎng)絡(luò)用戶對(duì) AI 在特定任務(wù)上的表現(xiàn)進(jìn)行評(píng)分，例如創(chuàng)建網(wǎng)頁應(yīng)用程序或生成圖像。但參與評(píng)分的用戶往往不具有代表性，他們大多來自人工智能和科技行業(yè)，并且他們的投票也常?；趥€(gè)人且難以捉摸的偏好。

像“四子棋”“我的世界”和“威爾?史密斯吃面條”這類奇特的人工智能基準(zhǔn)測(cè)試顯然不是嚴(yán)謹(jǐn)?shù)膶?shí)證研究，甚至不具備普遍適用性。因?yàn)榧幢?AI 能夠完美生成“威爾?史密斯吃面條”的視頻，也并不意味著其能很好地生成漢堡的圖像。

這些另類的 AI 基準(zhǔn)測(cè)試可能在短期內(nèi)不會(huì)消失，畢竟它們不僅具有娛樂性，而且還易于理解。2025 年，又會(huì)有哪些新奇的基準(zhǔn)測(cè)試會(huì)走紅呢？

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

2024 年另類 AI 評(píng)測(cè)標(biāo)準(zhǔn)走紅：“威爾?史密斯吃意大利面”領(lǐng)銜

相關(guān)文章