新智元報(bào)道
編輯:Aeneas
【新智元導(dǎo)讀】Sora 一出,讓很多人心生恐懼:飯碗徹底被砸了!這位亞馬遜工程師卻告訴我們:真的不必?fù)?dān)心生成式 AI 會(huì)搶人類(lèi)的飯碗,頂多擔(dān)心一下你的人類(lèi)同行吧。
這一周,OpenAI 視頻 AI 工具 Sora 一出現(xiàn),可謂是炸翻了天?!革埻氡2蛔×恕沟目謶郑鎸?shí)地?fù)糁辛嗽S多人。
不過(guò),亞馬遜的一位工程師 Cameron Gould 則認(rèn)為,其實(shí)并不必對(duì) AI 如此懼怕,它并不會(huì)導(dǎo)致我們失去工作。
為什么?原因如下。
Prompt 的自相矛盾
首先,生成式 AI 應(yīng)用在創(chuàng)意內(nèi)容時(shí),生成的一般是圖像、視頻以及一般的非虛構(gòu)內(nèi)容。
給一個(gè)生成式 AI 模型 prompt,就像照看一個(gè)惡毒的孩子,他的唯一目標(biāo),就是通過(guò)「從字面上理解你所說(shuō)的一切」來(lái)惹惱你。
你必須用詞準(zhǔn)確,不能在不重要的細(xì)節(jié)上浪費(fèi)一個(gè)字符,因?yàn)檫@可能就會(huì)使結(jié)果向完全不同的方向傾斜。但是同時(shí),你又需要提供盡可能多的詳細(xì)信息,讓模型不會(huì)誤解你。這種自相矛盾的操作,簡(jiǎn)直太糟糕了!
跟計(jì)算機(jī)進(jìn)行單向?qū)υ?huà),試圖理解它為什么沒(méi)能產(chǎn)生自己想要的結(jié)果,能讓人產(chǎn)生一種連續(xù) 3 小時(shí)撞墻的沖動(dòng)……
Gould 表示,在自己作為軟件工程師的職業(yè)生涯中,其實(shí)已經(jīng)習(xí)慣了和計(jì)算機(jī)的這種單向?qū)υ?huà),但生成式 AI 給他的體驗(yàn),絕對(duì)更糟。
它不是一種可預(yù)測(cè)的編程語(yǔ)言,擁有冪等的函數(shù)。
它完全是一個(gè)黑匣子,幾乎每次都可以在相同的輸入下,產(chǎn)生完全不同的結(jié)果。即使在 prompt 里要求 AI 要保持一致性,它也未必會(huì)聽(tīng)你的。
市值數(shù)十億的公司,就曾受到這一現(xiàn)實(shí)的困擾。最近,加拿大一家法庭裁定,加拿大航空公司必須向其中一名乘客支付賠償金,因?yàn)榱奶鞕C(jī)器人提供了誤導(dǎo)性建議,導(dǎo)致該乘客為機(jī)票支付了近一倍的費(fèi)用。
速度確實(shí)快,但……
當(dāng)然,盡管在一致性方面存在缺陷,但生成式 AI 可以幫我們快速產(chǎn)出東西來(lái)。
比如上面這張圖,就是用生成式 AI 創(chuàng)建的,只花了幾秒鐘就做出來(lái)了。所以,AI 可以讓我們比藝術(shù)家出圖的速度更快,這件事是有可能的。
而 Sora 也讓普羅大眾就可以用比以往快許多倍的方式,生成更復(fù)雜的媒體素材。所以,由于現(xiàn)在一個(gè)人可以做幾個(gè)人的工作,我們真的不需要那么多的藝術(shù)家、軟件工程師、撰稿人了嗎?
不,它的細(xì)節(jié)不對(duì)
答案并沒(méi)有那么簡(jiǎn)單。使用生成式 AI 創(chuàng)作藝術(shù)時(shí),可能你時(shí)常會(huì)想:「不,這不是我想要的。」這也是在論壇上常常出現(xiàn)的觀點(diǎn)。
有人會(huì)反駁說(shuō):這是因?yàn)槟愕?prompt 缺乏細(xì)節(jié),你需要給出更具體的 prompt。這個(gè)觀點(diǎn)確實(shí)有道理。
我們自己的圖片和票房收入超過(guò) 1 億美元的專(zhuān)業(yè)電影,有何不同?我們自己的個(gè)人博客,和專(zhuān)業(yè)的全職作家的博客,有何不同?我們自己做的游戲視頻標(biāo)題,和 30 小時(shí)的 AAA 視頻游戲標(biāo)題,有何不同?
答案就是細(xì)節(jié)。
正是細(xì)節(jié),將業(yè)余愛(ài)好者和專(zhuān)業(yè)人士區(qū)分開(kāi)。
如果想使用生成式 AI 來(lái)創(chuàng)作與專(zhuān)業(yè)內(nèi)容一樣令人印象深刻的作品,我們將需要一個(gè)包含大量細(xì)節(jié)的提示。此外,還需要大量的試驗(yàn)和錯(cuò)誤,才能讓模型產(chǎn)生我們想要的東西。
生成式 AI 只是一種工具,類(lèi)似于自動(dòng)完成、編譯器、拼寫(xiě)檢查器或任何其他輔助工具。它不會(huì)為你做任何工作,除非是它自己的苦差事。
讓我們回到 Sora 的例子。
它只能生成無(wú)聲的視頻。其中沒(méi)有音頻,沒(méi)有對(duì)話(huà),沒(méi)有一個(gè)對(duì)象可以說(shuō)話(huà),或者發(fā)出聲音。
但如果我們想用它拍電影,就需要用它 ——
生成腳本?
閱讀劇本?
生成視頻以配合腳本?
究竟是現(xiàn)代電影的哪些方面,讓電影變得有趣呢?突然間,我們就需要集成一堆不同的生成式 AI 工具,才能完成工作。
當(dāng)然,OpenAI 有一個(gè)名為 Jukebox 的音樂(lè)生成工具,它可以在視頻中添加音樂(lè),但卻無(wú)法添加對(duì)話(huà)。
在一段視頻中,該如何添加對(duì)話(huà)呢?這項(xiàng)任務(wù)聽(tīng)起來(lái)太艱巨了。我們不僅需要生成一個(gè)特定場(chǎng)景的視頻,還需要讓場(chǎng)景中角色的嘴部動(dòng)作和臺(tái)詞保持一致。此外,視頻生成器還需要知道單詞是怎樣說(shuō)出的。不僅僅是語(yǔ)氣,還有節(jié)奏。
想象一下,要解決全部這些細(xì)節(jié),需要多大的人力才能解決?
細(xì)節(jié),變得相當(dāng)困難。在每一個(gè)步驟的每一個(gè)級(jí)別上,都有大量會(huì)影響實(shí)質(zhì)性后果的細(xì)節(jié)。
Gould 表示,自己最近讀到一篇非常喜歡的博文《現(xiàn)實(shí)擁有驚人的細(xì)節(jié)量》。
現(xiàn)實(shí)的細(xì)節(jié)是無(wú)限的,然而 AI 模型的 token 卻是有限的。
它只能帶你走這么遠(yuǎn),之后,我們就需要依靠其他人來(lái)完成工作。
目前為止,人類(lèi)仍然做著最繁重的工作。
更少的細(xì)節(jié),更多的變化
專(zhuān)注于細(xì)節(jié),聽(tīng)起來(lái)實(shí)在是太累了。如果讓你保持簡(jiǎn)單,會(huì)發(fā)生什么呢?如果你只需要提供很短的描述,只用幾分鐘就可以寫(xiě)出來(lái)?
最終,你會(huì)得到多樣化的結(jié)果,大部分與你的想法完全不一致。你需要在成百甚至上千個(gè)結(jié)果中,才能找到你想要的那一個(gè),因?yàn)?prompt 太通用了。你可能永遠(yuǎn)都找不到一個(gè)能用的結(jié)果。
如果 prompt 太簡(jiǎn)單,模型天馬行空的想象力,會(huì)提供無(wú)限的排列供你選擇。比如輸入這個(gè) prompt——「一個(gè)男人」,你會(huì)得到各式各樣的男人。
但實(shí)際上,我想要的是一個(gè)藍(lán)頭發(fā)、棕色眼睛、留著小胡子、穿著一件黑色夾克、戴著兜帽的男人。
如果只輸入「一個(gè)男人」作為提示,需要多長(zhǎng)的時(shí)間才能找到確切的輸出呢?
深度和廣度之間有一個(gè)平衡點(diǎn),你可以最大限度地減少你的努力。這就需要對(duì)細(xì)節(jié)進(jìn)行大量批判性思考,并進(jìn)行大量搜索。
AI 不會(huì)取代我們
所以,為什么說(shuō) AI 不會(huì)取代我們?因?yàn)椋髽I(yè)并不是為了解決生成圖像、視頻剪輯這類(lèi)小問(wèn)題而存在的。企業(yè)是為利益相關(guān)者解決更大型、更復(fù)雜的問(wèn)題。
解決這些問(wèn)題最困難的部分,就是后勤工作。解決大型、復(fù)雜的問(wèn)題需要一大群?jiǎn)栴}解決者的時(shí)間和精力,而所有這些問(wèn)題解決者又需要由其他問(wèn)題解決者組織起來(lái),以保持事情的進(jìn)展。
如果隨機(jī)抓來(lái)兩個(gè)人,讓他們自我管理、自我組織工作,很可能他們的標(biāo)準(zhǔn)和時(shí)間表會(huì)不一致。如果你要讓他們一起工作,你就得設(shè)立標(biāo)準(zhǔn),讓他們?cè)谕瑯拥臅r(shí)間工作,并且產(chǎn)生相同質(zhì)量的結(jié)果。
凝聚力是一種力量,你需要做一些工作,讓獨(dú)立的單位保持一致。一個(gè)團(tuán)隊(duì)單獨(dú)運(yùn)行,可以順利完成任務(wù);但是當(dāng)我們把多個(gè)團(tuán)隊(duì)引入單個(gè)環(huán)境中時(shí),就會(huì)出現(xiàn)很多沖突。
多個(gè)相互依賴(lài)的團(tuán)隊(duì)朝著一個(gè)目標(biāo)努力時(shí),需要一定的凝聚力,才能完成有意義的事。
這項(xiàng)「凝聚力」工作其實(shí)很復(fù)雜,經(jīng)常需要解決人際沖突,而這些沖突通常是不合邏輯的、情緒化的。
顯然,AI 無(wú)法解決這種類(lèi)型的沖突。
總結(jié)來(lái)說(shuō)就是 ——
企業(yè)通過(guò)為很多人 / 企業(yè)解決大問(wèn)題來(lái)賺錢(qián)
大問(wèn)題很難解決,因?yàn)樯婕昂芏鄨F(tuán)隊(duì)
我們需要精心策劃如何統(tǒng)籌這些團(tuán)隊(duì),來(lái)解決人際沖突,并保持凝聚力
在解決人際沖突方面,人是最可靠的資源
很顯然,機(jī)器人根本無(wú)法勝任這些工作,它們的表現(xiàn)會(huì)很糟糕。
AI 不會(huì)搶走你的工作
當(dāng)我們仔細(xì)看一下目前生成式 AI 的現(xiàn)狀,這個(gè)事實(shí)是顯而易見(jiàn)的 —— 目前沒(méi)有任何方法,可以讓工作自動(dòng)化。
提示界面和模型缺乏自主性和批判性思維,導(dǎo)致了關(guān)鍵的局限性。沒(méi)錯(cuò),生成式 AI 的確可以讓我們提高工作效率,但也就僅此而已。
這句話(huà)已經(jīng)被越來(lái)越多人所贊同:AI 不會(huì)搶走你的工作。真正會(huì)對(duì)你造成威脅的,是會(huì)比你更熟練地使用 AI 工具的人。
生成式 AI 是幫助你加快速度的絕佳資源,但它不會(huì)完全自動(dòng)化你的工作。你要做的,就是把它們添加到你的工具箱,熟練地掌握它們。
參考資料:
https://www.camggould.com/posts/The-AI-Endgame/
本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。