IT之家 2 月 23 日消息,OpenAI 新推出的 AI 視頻生成模型 Sora 一經(jīng)發(fā)布就成為業(yè)界焦點(diǎn),不過 Meta 首席人工智能科學(xué)家 Yann LeCun 卻并不認(rèn)同其價(jià)值。
LeCun 主要反對(duì) OpenAI 聲稱 Sora 將最終實(shí)現(xiàn)“構(gòu)建通用物理世界模擬器”的目標(biāo)。他認(rèn)為,如果真要實(shí)現(xiàn),OpenAI 當(dāng)前的方法完全偏離了軌道。
LeCun 在 X 平臺(tái)(原 Twitter)發(fā)帖稱:“通過生成像素來模擬世界的行為,就像曾經(jīng)被廣泛棄用的‘通過合成進(jìn)行分析’一樣,既浪費(fèi)資源又注定失敗?!?/p>
生成模型 vs. 判別模型:老生常談的辯論
據(jù)IT之家了解,LeCun 被譽(yù)為“人工智能教父”之一,也是其中最直言不諱、敢于批評(píng)的人。與其他兩位“教父”對(duì)人工智能發(fā)展表達(dá)擔(dān)憂不同,而 LeCun 則繼續(xù)在 Meta 推進(jìn)研究,同時(shí)不吝于批評(píng)競(jìng)爭(zhēng)對(duì)手。
此次他的評(píng)論涉及機(jī)器學(xué)習(xí)領(lǐng)域中生成模型和判別模型的長(zhǎng)期爭(zhēng)論。LeCun 認(rèn)為,生成模型通過“解釋性潛在變量”生成像素的方法效率低下,無(wú)法充分應(yīng)對(duì)三維空間中復(fù)雜預(yù)測(cè)帶來的不確定性。
簡(jiǎn)單來說,他認(rèn)為這些模型試圖“推斷”太多無(wú)關(guān)緊要的細(xì)節(jié),就像試圖計(jì)算足球的軌跡,卻要分析每一個(gè)足球材料的作用,而不是僅僅分析質(zhì)量和速度。
他在回復(fù)帖子時(shí)說:“如果你只是想生成視頻,這樣做沒什么問題。但如果你想理解世界如何運(yùn)轉(zhuǎn),那么這種方法注定失敗。”
LeCun 的 V-JEPA 模型:另一種選擇
LeCun 承認(rèn),到目前為止,生成式模型在大型語(yǔ)言模型(如 ChatGPT)上取得了一定成功,“因?yàn)槲谋臼请x散的,符號(hào)數(shù)量有限”。但如果像 Sora 那樣模擬世界,就不僅僅是處理幾個(gè)字符了。
作為 OpenAI 方法的競(jìng)爭(zhēng)對(duì)手,LeCun 上周公布了他在 Meta 開發(fā)的模型 V-JEPA,名為“視頻聯(lián)合嵌入預(yù)測(cè)架構(gòu)”(V-JEPA)。
Meta 在一篇博客文章中宣稱:“與試圖填充所有缺失像素的生成式方法不同,V-JEPA 可以丟棄不可預(yù)測(cè)的信息,從而將訓(xùn)練和樣本效率提高 1.5 到 6 倍?!?/p>
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。