OpenAI 的 Sora 會砸掉誰的飯碗？

2024/2/18 9:05:12 來源：新浪科技作者：鄭峻責編：遠洋

評論：

出品 / 新浪科技（ID:techsina）

作者 / 鄭峻

不約而同，同日出招。兩個 AI 巨頭在同一天各自放出了自己的 AI 新核武器，OpenAI 的文生視頻模型 Sora 又一次贏得了滿堂彩。Sora 的驚艷亮相，不僅碾壓了諸多 AGI 視頻同行，更有可能改變電影電視廣告游戲行業(yè)的未來游戲規(guī)則。

谷歌新模式性能完勝

周四，谷歌突然發(fā)布了新一代多模態(tài)大模型 Gemini 1.5 Pro，在與 OpenAI 的大模型之戰(zhàn)中加速超越。這是業(yè)界迄今最強的大語言模型，最高可支持 10,000K Token 上下文，直接將性能提升到了百萬級別，在性能上完全秒殺了 OpenAI 的 GPT-4 Turbo。

百萬級別 Token 意味著什么？谷歌 AI 項目負責人杰夫?迪恩 (Jeff Dean) 解釋說，在 Gemini 1.5 Pro 百萬級別上下文窗口支持能力下，用戶可以完成復雜的內容交互，輕松解析整本圖書、電影、播客，理解非常長的文檔，甚至是數(shù)百個文件數(shù)十萬行的代碼庫。

Gemini 1.5 Pro 的發(fā)布，意味著谷歌在和 OpenAI 的軍備競賽中占據了強大的性能優(yōu)勢。相比之下，OpenAI 的 GPT-4 Turbo 只能處理 128k Token，而且近期更是出現(xiàn)了性能下滑的不利狀況，直到上個月發(fā)布更新之后才有所改善。

OpenAI 的 Sora 會砸掉誰的飯碗？

然而，OpenAI 并沒有讓谷歌獨美。就在同一天，他們發(fā)布了文本生成視頻的 AI 模型 Sora，只需文本就能自動生成視頻；繼文本模型 ChatGPT 和圖片模型 Dall-E 之后，OpenAI 又開始顛覆視頻領域。

相比谷歌 Gemini 1.5 Pro 基于數(shù)據性能的硬實力優(yōu)勢，Sora 基于視覺美學的驚艷表現(xiàn)，顯然更容易讓人印象深刻，迅速成為了社交網站上的熱點。

以假亂真細節(jié)驚艷

Sora 到底驚艷在哪里？OpenAI 展示了多段 Sora 制作的視頻內容，光是這些片段，就已經足夠讓人大跌眼鏡。OpenAI 在官方博客中寫道，Sora 不僅可以理解用戶的需求，還知道這些事物在現(xiàn)實世界如何存在。

只需要輸入一段文本，Sora 就能自動生成最長一分鐘的高清視頻。令人難以置信的是，Sora 不僅可以準確把握用戶文本中的復雜意思，并且還能分拆出不同的元素，將其轉換為有具體創(chuàng)意構思的視頻內容，看起來就像是專業(yè)導演、攝像和剪輯的作品。

OpenAI 的 Sora 會砸掉誰的飯碗？

一位戴著墨鏡、穿著皮衣的時尚女子走在雨后夜晚的東京市區(qū)街道上，抹了鮮艷唇彩的唇角微微翹起，即便戴著墨鏡也能看到她的微笑，地面的積水映出了她的身影和燈紅酒綠的霓虹燈；熱鬧非凡的唐人街正在進行舞龍表演，熙熙攘攘的人群目光都聚焦在躍動的彩龍身上，整個環(huán)境的喜慶氛圍仿佛令人身臨其境。

與此前的 AI 視頻存在明顯塑料感不同，此次 Sora 制作的視頻在逼真度和藝術感方面有著顯著差別：微微卷曲的人物頭發(fā)，女人臉上的黑痣粉刺，地面積水倒映的霓虹光影，街頭商販擺賣的諸多食品，天空飄落的櫻花細雪，細節(jié)的精細度幾乎已經做到了以假亂真。

OpenAI 的 Sora 會砸掉誰的飯碗？

更令人驚訝的是，Sora 視頻在構圖、色彩、創(chuàng)意和運鏡方面，都呈現(xiàn)出明顯的電影風格，無論是一鏡到底還是多機位都可以無縫切換，甚至還有“演員”的表情神態(tài)，這是此前的文生視頻產品所不具備的。OpenAI 一出手就將整個 AI 視頻行業(yè)提升了一個級別。

雖然 Sora 制作的視頻還沒有到完美的地步，仔細看還能看出“穿幫”之處，人物吃過的餅干甚至會完好無損，但在影像畫質上已經較此前的 AI 視頻有了質的飛躍，甚至有了電影的質感。而且，僅僅根據一段抽象的文字就能制作類電影的多鏡頭視頻，這種語義理解和鏡頭運用能力更是接近了人類導演、攝像與剪輯的水平。顯然，視頻領域的 ChatGPT 時刻已經到來。

AI 進化速度令人震驚

Sora 發(fā)布之后，網絡一片驚嘆，幾乎搶盡了 Gemini 的風頭。AI 的進化速度實在令人震驚。要知道，此時距離 OpenAI 推出 ChatGPT，開啟生成式 AI 時代，僅僅過去了 14 個月時間。直到去年，我們才剛剛熟悉文本生成圖片的產品，而僅僅半年前，MidJourney 創(chuàng)作的 AI 圖片里還會出現(xiàn)六指人物。而現(xiàn)在，Sora 的視頻就已經讓所有人開始感受到現(xiàn)實和虛擬的界限模糊。

雖然 OpenAI 的 GPT-4 Turbo 此前出現(xiàn)了性能下滑和速度變慢的狀況，令人擔心生成式 AI 的增長遭遇了瓶頸；但 Sora 的發(fā)布無疑打消了所有人的擔憂。云計算公司 Box 創(chuàng)始人兼 CEO 列維 (Aaron Levie) 在 Sora 發(fā)布之后感慨說，“如果有人還擔心 AI 進化速度會變慢的話，我們又一次看到了完全相反的典范?！?/p>

目前 Sora 只面向邀請的制作者和安全專家開放測試，發(fā)現(xiàn)和解決可能的安全問題，還沒有宣布正式的公測時間表。畢竟在虛假信息充斥的互聯(lián)網，DeepFake 的道德問題也已經成為了關注焦點，像 Sora 這樣以假亂真的視頻一旦被濫用，可能會引發(fā)災難性后果。

在發(fā)布 Sora 的幾乎同一時間，OpenAI 還完成了一項要約售股交易，并不是融資用于公司用途，而是允許員工向以 Thrive Capital 牽頭的風投機構出售現(xiàn)有股份套現(xiàn)。值得一提的是，作為 OpenAI 董事會成員，奧特曼自己并不持有公司股票，估值飆升并不能給他帶來巨額財富。

此次交易對 OpenAI 的整體估值達到了 800 億美元，較之去年年初的 300 億美元飆升了兩倍多。按照投融資市場調研公司 CB Insights 統(tǒng)計，OpenAI 已經成為全球估值最高的創(chuàng)業(yè)公司之一，僅次于字節(jié)跳動和 SpaceX。

實際上，此次交易本應在去年 11 月完成，只是因為奧特曼與董事會的沖突風波才被迫擱置。隨著奧特曼重新回到 OpenAI CEO 職位，投資者再次給這家 AI 巨頭投出了信任票。顯然，在 Sora 正式發(fā)布之后，OpenAI 的估值還會進一步飆升。

巨頭出手碾壓 AGI 同行

那么，令人驚艷的文本生視頻 Sora 究竟會帶來哪些沖擊？

OpenAI 的 Sora 會砸掉誰的飯碗？

AGI 視頻同行無疑是遭受最直接沖擊的。Sora 發(fā)布之后，AI 視頻創(chuàng)業(yè)公司 Runway CEO 瓦倫祖拉 (Cristóbal Valenzuela) 在 X 平臺 (此前的推特) 上簡單發(fā)布了兩個字，“Game On.”(競爭開始了)。幾個月前，Runway 剛剛發(fā)布了 Gen-2 視頻模型。而另一家 AI 視頻公司 Stability 的 CEO 莫斯塔克 (Emad Mostaque) 則直接感慨，“奧特曼真是個魔術師?！?/p>

Runway 創(chuàng)辦已有五年時間，在 AI 視頻領域占據著先發(fā)優(yōu)勢，已經得到了好萊塢主流片場的使用。去年拿到七項奧斯卡大獎的年度影片《瞬息全宇宙》就使用了 Runway 來制作 AI 視頻。在《瞬息全宇宙》大獲成功之后，Runway 新一輪融資估值也水漲船高，達到了 15 億美元，是一年之前估值的三倍。

文生視頻領域是目前最熱的創(chuàng)業(yè)領域。過去幾個月時間，隨著生成式 AI 熱潮涌動，也涌現(xiàn)出了不少文本生視頻和圖片生視頻的創(chuàng)業(yè)公司。A16z 的 AI 投資合伙人摩爾 (Justin Moore) 列出了他所跟蹤的 20 多家文生視頻創(chuàng)業(yè)團隊，其中不乏 Pika、Zeroscope 這樣一度引發(fā)網絡驚嘆的創(chuàng)業(yè)新貴。

去年年底，斯坦福華人畢業(yè)生創(chuàng)辦的 Pika 視頻一度引發(fā)了中美互聯(lián)網的驚嘆。得益于 AI 視頻的驚艷表現(xiàn)，這家僅有四人的創(chuàng)業(yè)公司，在不到半年時間就完成了超過 5500 萬美元的三輪融資，估值飆升到了 2.5 億美元。

但現(xiàn)在，AI 巨頭 OpenAI 直接拋出了 Sora。無論是視頻時長，還是畫面精細度，還是細節(jié)完整性，或是多鏡頭拍攝，Sora 都遠遠超越了這些小創(chuàng)業(yè)公司的視頻，用碾壓來形容也并不為過。雖然 AI 視頻領域還有著巨大的提升和增長空間，但這些小公司的未來是否有能力與 OpenAI 競爭依然是個巨大的疑問。

左右好萊塢勞資談判

不過，Sora 影響的不僅是其他 AGI 視頻創(chuàng)業(yè)公司的生存空間，更會改變整個好萊塢以及電影、電視、廣告、游戲行業(yè)的未來游戲規(guī)則。

好萊塢使用 AI 制作圖片和視頻，并不是什么新鮮事，從 CG (電腦動畫)、VR 到 AI，影視娛樂行業(yè)一直是高新技術的最先采用者。然而，與其他技術不同，AI 工具始終是扎在好萊塢從業(yè)人員心中的一根刺。

除了《瞬息全宇宙》使用了 Runway 的 AI 視頻工具，去年 21 世紀?？怂挂呀浥c IBM 沃森合作，用 AI 工具為關于 AI 主題的恐怖片《摩根》制作預告片；迪士尼旗下的漫威更完全用 AI 制作了《秘密入侵》的開頭動畫。

當時正值好萊塢演員和編劇工會大罷工期間。而生成式 AI 在影視行業(yè)的應用也是雙方的爭議焦點之一。就在雙方談判的過程中，演員編劇們得知迪士尼漫威新一季的《秘密入侵》已經完全使用 AI 技術打造開場場景。這一消息讓雙方的談判再次擱淺。

為什么影視行業(yè)使用 AI 工具引發(fā)這么多的爭議？業(yè)內人士主要是擔心制片方使用現(xiàn)有素材進行 AI 訓練，未來頻繁使用 AI 工具生成內容，這不僅侵犯到了創(chuàng)作者已有作品的版權，沒有給他們足夠的回報，更會影響到創(chuàng)作者未來的工作機會和空間。

雖然去年編劇和演員們不惜讓行業(yè)停擺和自己失業(yè)，換來了制片方們的暫時讓步，對 AI 工具的使用制定更多的規(guī)范。但三年后的下一次勞資談判，面對性能必然大升級的 AI，演員編劇們的處境可能會更加艱難。

電影電視 TikTok 化

隨著文生視頻模型 Sora 的驚艷亮相，或許整個好萊塢從業(yè)人員都會面臨著一個巨大的疑問：按照 AI 的指數(shù)級進化速度，或許不需要再等待多久，AI 就可以生成一部完整劇情的短片甚至電影，從劇本到拍攝到表演到后期都可以完全搞定，那么好萊塢的未來會變成什么樣子？

OpenAI 的 Sora 會砸掉誰的飯碗？

拍攝《當她醒來》恐怖電影的好萊塢導演戴夫?克拉克 (Dave Clark) 已經在使用 AI 工具制作電影。在他看來，Sora 等 AI 技術帶來的并不是威脅，創(chuàng)作者需要去擁抱 AI 技術，打造此前無法實現(xiàn)或是想象的內容。“這是改變游戲規(guī)則的技術。你不應該去擔心自己的工作，而應該擔心是誰在使用這些工具?！?/p>

行業(yè)調查公司 CVL Economics 上個月發(fā)布的一項對 300 位好萊塢行業(yè)領袖的調查顯示，擔憂情緒彌漫在整個好萊塢。36% 的受訪者表示生成式 AI 已經減少了他們公司的日常工作技能需求，72% 的受訪公司都是生成式 AI 工具的最早采用者。

更為殘酷的現(xiàn)實是，75% 的受訪者承認，生成式 AI (工具、軟件、模型) 已經促使他們業(yè)務部門削減與合并工作崗位。這些掌控著好萊塢行業(yè)秩序的人們預計，未來三年好萊塢總計會有超過 20 萬人的工作崗位會遭受 AI 沖擊，尤其是視覺特效、音效師、畫圖師等后期工作崗位。

電影《Shovel Buddies》的編劇海勒曼 (Jason Hellerman) 認為，隨著 AI 工具的逐漸完善，未來制片方當然可能會通過 Sora 這樣的工具生成視頻，而不再需要給一個制作團隊支付薪酬。AI 生成的內容也可能會創(chuàng)造一個全新的類型，但如果任何人都可以用 AI 制作視頻和電影，成為“內容創(chuàng)作者”，這也不可避免會帶來專業(yè)水準的降低。

他預測，未來每個人都可以生成自己視頻，就像是現(xiàn)在每個人都在手機上拍攝和觀看 TikTok 短視頻。習慣了短視頻的 Z 世代年輕人未來會逐漸摒棄電影和電視這樣的長內容。也許在 AI 生成視頻的未來，電影和電視也會變成類似 TikTok 短視頻這樣的形式。

本文來自微信公眾號：新浪科技（ID：techsina），作者：努力碼稿的小浪

廣告聲明：文內含有的對外跳轉鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

關鍵詞：Sora，OpenAI

OpenAI 的 Sora 會砸掉誰的飯碗？

相關文章