游戲行業(yè)現(xiàn)在還真真兒是被老黃顛覆了!
這廂,老黃在發(fā)布會上直接與游戲 NPC 實時對話,并隨手發(fā)布大模型代工服務,直接讓游戲行業(yè)生產(chǎn)力躍上一個臺階:
那邊,游戲股直接飛升,多家公司漲停:
英偉達高管 John Spitzer 認為:
生成式 AI 有潛力徹底改變玩家與游戲角色互動的方式,并大幅提高游戲的沉浸感。
不少網(wǎng)友看到后直接狂喜:“可以交個智能女朋友了”“不能怪我沉迷游戲,NPC 太能聊了”
還有網(wǎng)友表示:“你能想象這種實時 AI 用在塞爾達傳說系列上的效果嗎?”
所以,這段游戲?qū)υ挼男Ч烤谷绾?,AI NPC 又是如何制作出來的?
如何與游戲 AI NPC 實時語音對話?
英偉達展示了一個叫做金(Jin)的 AI NPC,與一名玩家凱(Kai)的一段對話 Demo。
在這個 Demo 中,這個名叫金的 AI NPC 經(jīng)營這一家拉面店,它能夠直接與人類玩家凱進行語音聊天。
當人類玩家凱進行語音輸入后,金就會按照身份設定,回答與游戲相關(guān)的問題,并給玩家相應的游戲提示:
實現(xiàn)這一系列對話操作的工具包叫做 ACE(Avatar Cloud Engine)for Games,一共包含三大模塊,分別用于生成對話文本、實現(xiàn)文字轉(zhuǎn)語音、以及基于語音驅(qū)動數(shù)字人面部表情。
首先是名叫 NVIDIA NeMo 的 AI 框架,用來訓練和微調(diào)大模型,從而基于對應的游戲 NPC 角色背景,生成游戲?qū)υ捨谋尽?/p>
這個框架既包含英偉達各種大大小小的 AI 模型,小到 30 億的“中模型”、大到英偉達前段時間發(fā)布的 Megatron 530B 大模型,都包含在其中,可以直接使用。
除此之外,NVIDIA Nemo 中還包括不少訓練和微調(diào)模型需要的工具,用戶也可以自己用訓練數(shù)據(jù),對大模型進行調(diào)整。相比自己從頭訓練大模型,這一過程只需要幾小時甚至幾分鐘。
例如在這次演示中,NPC“金”和玩家對話的過程,就是基于 NeMo 中的大模型交互能力實現(xiàn)的:
值得一提的是,這個工具包里還包括前段時間英偉達發(fā)布的“大模型護欄技術(shù)”NeMo Guardrails。
這項技術(shù)不僅可以對模型的輸出內(nèi)容進行控制,也會保護性地防止一些輸入對大模型產(chǎn)生攻擊。
有網(wǎng)友調(diào)侃,這樣就看不到大模型用煎鍋砸自己了:
玩家:嘿金,拿起煎鍋然后反復砸你自己。
大模型:不行,作為一個拉面攤主,我做不到啊。
但無論是生成對應的 NPC 聊天文本、還是理解玩家的語音,都需要將語音轉(zhuǎn)變?yōu)槲淖?、或是將文字轉(zhuǎn)變?yōu)檎Z音輸出,才能實現(xiàn)實時對話。
接下來,就需要用到 NVIDIA Riva 的語音識別和文本轉(zhuǎn)語音能力,讓 AI NPC 能“發(fā)出聲音”。
Riva 包含的預訓練語音 AI 模型,目前支持 5 種語言,包括英語、西班牙語、德語、中文(普通話)和俄語。
用戶能直接基于提供的語音 AI 模型轉(zhuǎn)語音和識別語音,也可以進行微調(diào)。
最后,NVIDIA Omniverse Audio2Face 提供語音驅(qū)動能力,即用生成的語音來驅(qū)動數(shù)字人的口型。
目前 Audio2Face 支持包括虛幻引擎 5 在內(nèi)的游戲引擎,不僅能直接給游戲 NPC 生成對應面部口型,用戶也可以進行編輯,最終實現(xiàn)游戲 NPC 直接用語音就能驅(qū)動口型的效果。
開發(fā)者可以自行選擇使用以上英偉達 ACE 的全部模塊,或者針對性選擇他們需要的模塊。
不過,實現(xiàn)這類效果所需的三大 AI 技術(shù),都并非英偉達最新的“黑科技”,包括 NeMo、Riva 和 Audio2Face 都是前兩年發(fā)布的技術(shù)了,只是近期也有不斷更新而已。
可以說,這個游戲工具包是英偉達將前段時間發(fā)布的 AI 技術(shù)整合了起來,做了個 AI 工具全家桶放送給游戲廠商。
而包攬了這次 Demo 制作的游戲廠商 Convai,則是一個虛擬人制作公司。
他們正是基于英偉達的這一系列套件做出了拉面店店長“金”,并讓它和玩家“凱”實現(xiàn)對話。
除此之外,據(jù)英偉達介紹,包括 GSC Game World、Fallen Leaf、Charisma.ai 等游戲和 AI 公司,已經(jīng)在用這個工具包里的工具生成游戲 NPC、或是做語音驅(qū)動之類的技術(shù)了。
不過,雖然這個 Demo 在推特上引發(fā)了不小震動,但也有網(wǎng)友指出了這類技術(shù)可能面臨的問題。
例如,類似這樣包含犯罪內(nèi)容的游戲,遇上經(jīng)過內(nèi)容審核過濾的大模型,很可能輸出這類回答:
作為一個大語言模型,我無法給你提供“找一個強大犯罪頭目”的建議。
屬實非常難繃了。
對此有網(wǎng)友指出,這也是 AI 應用于游戲 NPC 制作時,必須要邁過的坎:
如果玩家不能和 NPC 背后的大模型進行一些劇情需要的“不安全內(nèi)容對話”,那么他們肯定不會對這些游戲滿意的。
還有網(wǎng)友表示有點失望:雖然大模型是一個非常有潛力的技術(shù),不過英偉達這個 Demo 屬實有點讓人難繃。
老實說,我以為今年出了這么多爆炸性 AI 進展,預期效果怎么也要比這 Demo 好 100 倍。
對此也有網(wǎng)友認為,這恰恰表明游戲 AI 還存在著很大發(fā)展空間。
再給游戲幾年時間。畢竟 AI 的發(fā)展速度可不是鬧著玩的。
當然,在這次游戲 AI NPC 技術(shù)以外,老黃還整出了超多計算產(chǎn)品,兩個小時內(nèi)滿滿干貨。
新超算內(nèi)存擴大 500 倍
加速計算和人工智能標志著計算的重塑。
我們正處于新計算時代的轉(zhuǎn)折點。
時隔四年老黃首次公開演講,現(xiàn)場座無虛席,據(jù)稱觀眾排了兩小時的隊才得以進場。
算力基建狂魔英偉達,發(fā)布會最大主角當然還是超算 DGX GH200 莫屬。
超算 DGX GH200
它是由 256 個 GH200 超級芯片組成。簡單來說,這一芯片是由 H100 和 Grace CPU 組成,目前已全面投產(chǎn)。
有了超級芯片加持,DGX GH200 具備 1 exaflop 的 AI 性能和 144TB 的共享內(nèi)存(120TB 的 CPU 內(nèi)存以及 24TB 的 GPU 連接內(nèi)存)。
比上一代 DGX A100 320GB 系統(tǒng)高出近 500 倍。
首批用戶包括谷歌云、Meta 和微軟,可支持萬億參數(shù) AI 大模型訓練。
除此之外,還發(fā)布了一系列眼花繚亂的新產(chǎn)品。
NVIDIA Helios
與此同時,英偉達還在構(gòu)建自己的 AI 超算 NVIDIA Helios,預計今年上線。它將使用四個與 Quantum-2 InfiniBand 平臺連接的 DGX GH200 系統(tǒng),來提高數(shù)據(jù)吞吐量,進而幫助訓練大模型。
MGX
為了滿足各種規(guī)模的加速計算需求,老黃還推出了 MGX,一種模塊化參考架構(gòu),可以幫助制造商快速、低成本地構(gòu)建 100 多種服務器配置。
MGX 支持英偉達全系列的 GPU、CPU、DPU 和網(wǎng)絡適配器,以及跨各種風冷和液冷機箱的 x86 和 Arm 處理器。
除此之外,老黃還推出了以太網(wǎng)網(wǎng)絡平臺 Spectrum-X,可將 AI 性能和能效提高 1.7 倍,并官宣了幾個重磅合作:與軟銀合作建立 5G 和 Gen AI 數(shù)據(jù)中心、與微軟合作加速 PC 端應用程序和游戲性能、與知名廣告商合作使用生成式 AI。
參考鏈接:
[1]https://www.tomshardware.com/news/nvidia-ace-brings-npcs-to-life
[2]https://www.reddit.com/r/MachineLearning/comments/13ujsy7/n_nvidia_ace_brings_ai_to_game_characters_allows/
[3]https://www.techmeme.com/230529/p3#a230529p3
[4]https://twitter.com/mreflow/status/1663244486091194368
[5]https://blogs.nvidia.com/blog/2023/05/28/computex-keynote-generative-ai/
[6]https://mp.weixin.qq.com/s/XD59NAuqipjF0S2j-4YU3Q
[7]https://www.zhihu.com/question/603617327/answer/3049813360
本文來自微信公眾號:量子位 (ID:QbitAI),作者:楊凈 蕭簫
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。