新智元報道
編輯:Aeneas
【新智元導(dǎo)讀】Sora 一出,讓很多人心生恐懼:飯碗徹底被砸了!這位亞馬遜工程師卻告訴我們:真的不必擔(dān)心生成式 AI 會搶人類的飯碗,頂多擔(dān)心一下你的人類同行吧。
這一周,OpenAI 視頻 AI 工具 Sora 一出現(xiàn),可謂是炸翻了天?!革埻氡2蛔×恕沟目謶?,真實地擊中了許多人。
不過,亞馬遜的一位工程師 Cameron Gould 則認為,其實并不必對 AI 如此懼怕,它并不會導(dǎo)致我們失去工作。
為什么?原因如下。
Prompt 的自相矛盾
首先,生成式 AI 應(yīng)用在創(chuàng)意內(nèi)容時,生成的一般是圖像、視頻以及一般的非虛構(gòu)內(nèi)容。
給一個生成式 AI 模型 prompt,就像照看一個惡毒的孩子,他的唯一目標(biāo),就是通過「從字面上理解你所說的一切」來惹惱你。
你必須用詞準確,不能在不重要的細節(jié)上浪費一個字符,因為這可能就會使結(jié)果向完全不同的方向傾斜。但是同時,你又需要提供盡可能多的詳細信息,讓模型不會誤解你。這種自相矛盾的操作,簡直太糟糕了!
跟計算機進行單向?qū)υ?,試圖理解它為什么沒能產(chǎn)生自己想要的結(jié)果,能讓人產(chǎn)生一種連續(xù) 3 小時撞墻的沖動……
Gould 表示,在自己作為軟件工程師的職業(yè)生涯中,其實已經(jīng)習(xí)慣了和計算機的這種單向?qū)υ?,但生成?AI 給他的體驗,絕對更糟。
它不是一種可預(yù)測的編程語言,擁有冪等的函數(shù)。
它完全是一個黑匣子,幾乎每次都可以在相同的輸入下,產(chǎn)生完全不同的結(jié)果。即使在 prompt 里要求 AI 要保持一致性,它也未必會聽你的。
市值數(shù)十億的公司,就曾受到這一現(xiàn)實的困擾。最近,加拿大一家法庭裁定,加拿大航空公司必須向其中一名乘客支付賠償金,因為聊天機器人提供了誤導(dǎo)性建議,導(dǎo)致該乘客為機票支付了近一倍的費用。
速度確實快,但……
當(dāng)然,盡管在一致性方面存在缺陷,但生成式 AI 可以幫我們快速產(chǎn)出東西來。
比如上面這張圖,就是用生成式 AI 創(chuàng)建的,只花了幾秒鐘就做出來了。所以,AI 可以讓我們比藝術(shù)家出圖的速度更快,這件事是有可能的。
而 Sora 也讓普羅大眾就可以用比以往快許多倍的方式,生成更復(fù)雜的媒體素材。所以,由于現(xiàn)在一個人可以做幾個人的工作,我們真的不需要那么多的藝術(shù)家、軟件工程師、撰稿人了嗎?
不,它的細節(jié)不對
答案并沒有那么簡單。使用生成式 AI 創(chuàng)作藝術(shù)時,可能你時常會想:「不,這不是我想要的?!惯@也是在論壇上常常出現(xiàn)的觀點。
有人會反駁說:這是因為你的 prompt 缺乏細節(jié),你需要給出更具體的 prompt。這個觀點確實有道理。
我們自己的圖片和票房收入超過 1 億美元的專業(yè)電影,有何不同?我們自己的個人博客,和專業(yè)的全職作家的博客,有何不同?我們自己做的游戲視頻標(biāo)題,和 30 小時的 AAA 視頻游戲標(biāo)題,有何不同?
答案就是細節(jié)。
正是細節(jié),將業(yè)余愛好者和專業(yè)人士區(qū)分開。
如果想使用生成式 AI 來創(chuàng)作與專業(yè)內(nèi)容一樣令人印象深刻的作品,我們將需要一個包含大量細節(jié)的提示。此外,還需要大量的試驗和錯誤,才能讓模型產(chǎn)生我們想要的東西。
生成式 AI 只是一種工具,類似于自動完成、編譯器、拼寫檢查器或任何其他輔助工具。它不會為你做任何工作,除非是它自己的苦差事。
讓我們回到 Sora 的例子。
它只能生成無聲的視頻。其中沒有音頻,沒有對話,沒有一個對象可以說話,或者發(fā)出聲音。
但如果我們想用它拍電影,就需要用它 ——
生成腳本?
閱讀劇本?
生成視頻以配合腳本?
究竟是現(xiàn)代電影的哪些方面,讓電影變得有趣呢?突然間,我們就需要集成一堆不同的生成式 AI 工具,才能完成工作。
當(dāng)然,OpenAI 有一個名為 Jukebox 的音樂生成工具,它可以在視頻中添加音樂,但卻無法添加對話。
在一段視頻中,該如何添加對話呢?這項任務(wù)聽起來太艱巨了。我們不僅需要生成一個特定場景的視頻,還需要讓場景中角色的嘴部動作和臺詞保持一致。此外,視頻生成器還需要知道單詞是怎樣說出的。不僅僅是語氣,還有節(jié)奏。
想象一下,要解決全部這些細節(jié),需要多大的人力才能解決?
細節(jié),變得相當(dāng)困難。在每一個步驟的每一個級別上,都有大量會影響實質(zhì)性后果的細節(jié)。
Gould 表示,自己最近讀到一篇非常喜歡的博文《現(xiàn)實擁有驚人的細節(jié)量》。
現(xiàn)實的細節(jié)是無限的,然而 AI 模型的 token 卻是有限的。
它只能帶你走這么遠,之后,我們就需要依靠其他人來完成工作。
目前為止,人類仍然做著最繁重的工作。
更少的細節(jié),更多的變化
專注于細節(jié),聽起來實在是太累了。如果讓你保持簡單,會發(fā)生什么呢?如果你只需要提供很短的描述,只用幾分鐘就可以寫出來?
最終,你會得到多樣化的結(jié)果,大部分與你的想法完全不一致。你需要在成百甚至上千個結(jié)果中,才能找到你想要的那一個,因為 prompt 太通用了。你可能永遠都找不到一個能用的結(jié)果。
如果 prompt 太簡單,模型天馬行空的想象力,會提供無限的排列供你選擇。比如輸入這個 prompt——「一個男人」,你會得到各式各樣的男人。
但實際上,我想要的是一個藍頭發(fā)、棕色眼睛、留著小胡子、穿著一件黑色夾克、戴著兜帽的男人。
如果只輸入「一個男人」作為提示,需要多長的時間才能找到確切的輸出呢?
深度和廣度之間有一個平衡點,你可以最大限度地減少你的努力。這就需要對細節(jié)進行大量批判性思考,并進行大量搜索。
AI 不會取代我們
所以,為什么說 AI 不會取代我們?因為,企業(yè)并不是為了解決生成圖像、視頻剪輯這類小問題而存在的。企業(yè)是為利益相關(guān)者解決更大型、更復(fù)雜的問題。
解決這些問題最困難的部分,就是后勤工作。解決大型、復(fù)雜的問題需要一大群問題解決者的時間和精力,而所有這些問題解決者又需要由其他問題解決者組織起來,以保持事情的進展。
如果隨機抓來兩個人,讓他們自我管理、自我組織工作,很可能他們的標(biāo)準和時間表會不一致。如果你要讓他們一起工作,你就得設(shè)立標(biāo)準,讓他們在同樣的時間工作,并且產(chǎn)生相同質(zhì)量的結(jié)果。
凝聚力是一種力量,你需要做一些工作,讓獨立的單位保持一致。一個團隊單獨運行,可以順利完成任務(wù);但是當(dāng)我們把多個團隊引入單個環(huán)境中時,就會出現(xiàn)很多沖突。
多個相互依賴的團隊朝著一個目標(biāo)努力時,需要一定的凝聚力,才能完成有意義的事。
這項「凝聚力」工作其實很復(fù)雜,經(jīng)常需要解決人際沖突,而這些沖突通常是不合邏輯的、情緒化的。
顯然,AI 無法解決這種類型的沖突。
總結(jié)來說就是 ——
企業(yè)通過為很多人 / 企業(yè)解決大問題來賺錢
大問題很難解決,因為涉及很多團隊
我們需要精心策劃如何統(tǒng)籌這些團隊,來解決人際沖突,并保持凝聚力
在解決人際沖突方面,人是最可靠的資源
很顯然,機器人根本無法勝任這些工作,它們的表現(xiàn)會很糟糕。
AI 不會搶走你的工作
當(dāng)我們仔細看一下目前生成式 AI 的現(xiàn)狀,這個事實是顯而易見的 —— 目前沒有任何方法,可以讓工作自動化。
提示界面和模型缺乏自主性和批判性思維,導(dǎo)致了關(guān)鍵的局限性。沒錯,生成式 AI 的確可以讓我們提高工作效率,但也就僅此而已。
這句話已經(jīng)被越來越多人所贊同:AI 不會搶走你的工作。真正會對你造成威脅的,是會比你更熟練地使用 AI 工具的人。
生成式 AI 是幫助你加快速度的絕佳資源,但它不會完全自動化你的工作。你要做的,就是把它們添加到你的工具箱,熟練地掌握它們。
參考資料:
https://www.camggould.com/posts/The-AI-Endgame/
本文來自微信公眾號:新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。