老黃攜「超級(jí) GPU」炸場(chǎng),E 級(jí) AI 超算性能飛升,買(mǎi)越多越劃算,谷歌微軟 Meta 搶先試用

新智元 2023/5/30 12:12:05 責(zé)編:夢(mèng)澤

英偉達(dá)又放大招了,這次直接用超級(jí) GPU GH200 燃爆了市場(chǎng)。

昨日的 COMPUTEX 大會(huì)上,英偉達(dá) CEO 黃仁勛向全世界宣布 ——

我們已經(jīng)到達(dá)了生成式 AI 的引爆點(diǎn)。從此,全世界的每個(gè)角落,都會(huì)有計(jì)算需求。

股價(jià)剛剛暴漲 2000 億美元的英偉達(dá),為這一刻早已做好準(zhǔn)備。

一開(kāi)場(chǎng),身著黑皮衣的老黃慷慨激昂地走上舞臺(tái),「大家好!We’re back!」

隨后,便祭出大殺器 ——「超級(jí) GPU」 GH200,并宣布谷歌云、Meta 和微軟將率先獲得 GH200。

據(jù)稱(chēng),有超過(guò) 3500 人親臨現(xiàn)場(chǎng),體驗(yàn)了這個(gè)長(zhǎng)達(dá) 2 個(gè)小時(shí)的激情演講。

時(shí)隔 4 年,闊別已久的老黃也是狂飆中文。

「超級(jí)芯片」GH200

要說(shuō),這次演講中,重頭戲還是在 GPU 上。畢竟 AI 的 iPhone 已經(jīng)來(lái)臨。

老黃左右手分別端了一個(gè)芯片,重磅宣布,「GH200 超級(jí)芯片」已經(jīng)全面投產(chǎn)。

這一「超級(jí) GPU」使用 NVLink-c2c 互連技術(shù),將基于 ARM 節(jié)能的 GraceCPU 和高性能 NVIDIA H100 Tensor Core GPU 結(jié)合在一起,提供了高達(dá) 900GB/s的總帶寬。

目前,由 GH200 加持的系統(tǒng)加入了 400 多種系統(tǒng)配置。

這些系統(tǒng)配置由英偉達(dá)最新的 CPU、 GPU 和 DPU 架構(gòu)的不同組合提供動(dòng)力。

其中包括 Grace、Hopper、Ada Lovelace 和 BlueField,這些架構(gòu)的創(chuàng)建是為了滿足對(duì)生成式 AI 不斷增長(zhǎng)的需求。

此外,老黃還宣布了一個(gè)更重磅的:256 個(gè) GH200 組成的超算來(lái)了。

超算 DGX GH200,今年上市

英偉達(dá)表示,全新 DGX GH200 人工智能超級(jí)計(jì)算平臺(tái),是專(zhuān)為大規(guī)模生成式 AI 的負(fù)載而設(shè)計(jì)。

這臺(tái)由 256 塊 Grace Hopper 超級(jí)芯片組成的超算,將擁有高達(dá) 1 exaflop 的超凡 AI 性能,以及 144TB 的共享內(nèi)存(比上一代 DGX A100 多了近 500 倍)。

舉個(gè)例子,在 GPT-3 訓(xùn)練中,它能比上一代 DGX H100 集群快 2.2 倍。

此外,這個(gè)龐然大物還包含了 150 英里的光纖和 2,000 多個(gè)風(fēng)扇。

目前,英偉達(dá)已經(jīng)與三大巨頭進(jìn)行了合作,谷歌、 Meta 和微軟。

由于生成式人工智能的爆炸式增長(zhǎng),微軟、谷歌等巨頭希望擁有更強(qiáng)大、性能更好的系統(tǒng)。

而 DGX H200 的設(shè)計(jì)目的是,通過(guò)使用英偉達(dá)定制的 NVLink Switch 芯片,繞開(kāi) InfiniBand 和以太網(wǎng)等標(biāo)準(zhǔn)集群連接的局限性,為最大工作負(fù)載的大規(guī)??蓴U(kuò)展性提供最大的吞吐量。

另外,英偉達(dá)表示正在建造自己的大型 AI 超級(jí)計(jì)算機(jī) NVIDIA Helios,預(yù)計(jì)在今年上線。

它將使用 4 個(gè)與 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò)連接的 DGX GH200 系統(tǒng),以提高數(shù)據(jù)吞吐量,以訓(xùn)練大型 AI 模型。

以往的數(shù)據(jù)中心都非常龐大,而且是基于 CPU 的,算法的迭代要花很長(zhǎng)時(shí)間,大部分算法,也都是 CPU 中心的。

而現(xiàn)在,有了 Grace Hopper,只需要幾天甚至幾個(gè)小時(shí),就能完成這個(gè)過(guò)程。簡(jiǎn)直要把整個(gè)行業(yè)都革命掉了!

(等等,PaLM 的參數(shù)不是 540B 么?)

老黃:買(mǎi)越多,越省錢(qián)!

作為現(xiàn)在的扛把子,這樣一個(gè)重 65 磅,價(jià)值 200000 美元的 H100 計(jì)算機(jī),是世界上第一個(gè)搭載了 Transformer Engine,也是目前全世界最昂貴的計(jì)算機(jī)。

老黃表示,可以說(shuō),像這樣的產(chǎn)品,你買(mǎi)得越多,就省得越多。

接下來(lái),老黃提到 1964 年的 IBM 360,強(qiáng)調(diào)了 CPU 的重要性。

老黃自信地重復(fù)表示,「而 60 年后,我們現(xiàn)在有數(shù)據(jù)中心。今天,數(shù)據(jù)中心就是一個(gè)計(jì)算機(jī)。」

正如老黃所說(shuō),一種新的計(jì)算模式正在被創(chuàng)造。

為什么使用 GPU 勝過(guò)使用 CPU?

老黃從配置上給出了分析:花費(fèi) 1000 萬(wàn)美金成本,你可以建置一個(gè)有 960 顆 CPU 的數(shù)據(jù)中心,但這個(gè)數(shù)據(jù)中心要 11GWh 的功率,處理 1X LLM(大語(yǔ)言模型)的數(shù)據(jù)量。

但一樣的錢(qián),你可以建置一個(gè)配備有 48 個(gè) GPU 的數(shù)據(jù)中心,但只要 3.2GWh 的功耗,而且可以處理 44X LLM 的數(shù)據(jù)量。

要知道,如此配置已經(jīng)足夠驚人。然而,這還不夠。

為了獲得極致性能,你可以在功耗不變的情況下,把 GPU 數(shù)量直接拉到 172 個(gè)。

此時(shí)的算力,可以高達(dá) CPU 數(shù)據(jù)中心的 150 倍。當(dāng)然,預(yù)算也提高到了 3400 萬(wàn)美元。

此外,如果你就只是單純地想完成手頭的工作(1X LLM),老黃也幫你把成本打下來(lái)了 ——

只需花 40 萬(wàn)美金,就能買(mǎi)一個(gè)搭載了 2 個(gè) GPU 的數(shù)據(jù)中心,功耗僅 0.13GWh。

臺(tái)下響起一片掌聲,老黃又拿出了口頭禪「The more you buy,The more you save」,甚至重復(fù)了三遍。

這背后的策略,究竟是什么?老黃給了一個(gè)公式。

MGX:模塊化架構(gòu)

與此同時(shí),老黃還推出了 NVIDIA MGXTM,一個(gè)供系統(tǒng)制造商快速、低成本地構(gòu)建 100 多個(gè)服務(wù)器變體的參考架構(gòu)。

據(jù)稱(chēng),這個(gè)規(guī)范可以將開(kāi)發(fā)成本削減多達(dá)四分之三,并將開(kāi)發(fā)時(shí)間縮短三分之二,僅需要 6 個(gè)月。

有了 MGX,科技公司可以為他們的服務(wù)器優(yōu)化加速計(jì)算的基本系統(tǒng)架構(gòu),然后選擇自己的 GPU,DPU 和 CPU。

MGX 還可以很容易地集成到云和企業(yè)數(shù)據(jù)中心。

除了硬件之外,MGX 還得到了英偉達(dá)完整軟件棧的支持,這使得開(kāi)發(fā)者和企業(yè)能夠構(gòu)建和加速 AI、 HPC 和其他應(yīng)用程序。

這包括 NVIDIA AI Enterprise,NVIDIA AI 平臺(tái)的軟件層,其特點(diǎn)是有 100 多個(gè)框架、預(yù)訓(xùn)練的模型和開(kāi)發(fā)工具,以加速人工智能和數(shù)據(jù)科學(xué),為企業(yè)人工智能開(kāi)發(fā)和部署提供充分支持。

將 AI 引入游戲,實(shí)時(shí)語(yǔ)音聊天的 NPC 角色來(lái)了

這次演講的亮點(diǎn),還有全新的定制 AI 模型代工服務(wù) ——Avatar Cloud Engine (ACE) for Game。

現(xiàn)場(chǎng),老黃右手手持一塊 RTX 4060 Ti,左手手持一臺(tái)電腦,展示了運(yùn)行實(shí)時(shí)光線追蹤的 Cyberpunk 2077。

在一個(gè)充滿「賽博朋克」風(fēng)格的拉面店場(chǎng)景中,玩家按下一個(gè)按鈕,可以用自己的聲音說(shuō)話,然后店主 Jin 會(huì)進(jìn)行回答。

Jin 是一個(gè) NPC 角色,但他的回答是由生成式 AI 根據(jù)玩家的語(yǔ)音輸入實(shí)時(shí)生成的。Jin 還有著逼真的面部動(dòng)畫(huà)和聲音,與玩家的語(yǔ)氣和背景故事相符。

這個(gè)逼真人物角色的生成,使用了一個(gè)實(shí)時(shí)人工智能模型渲染工具 Nvidia Ace。

老黃表示,這個(gè)游戲中的角色并沒(méi)有預(yù)先設(shè)定。他們有一個(gè)典型的任務(wù)提供者 NPC 類(lèi)型。

但是從視頻中,可以看到,虛擬角色的談話有點(diǎn)生硬,但還不算太糟。

那些沒(méi)有 AI 專(zhuān)業(yè)知識(shí)的人,將被拋棄

40 年來(lái),我們創(chuàng)造了 PC、互聯(lián)網(wǎng)、移動(dòng)、云,現(xiàn)在是人工智能時(shí)代。

你會(huì)創(chuàng)造什么?不管是什么,都要像我們一樣追趕它。要奔跑,不要走。要么是你為食物而奔跑,要么就是你任自己逃避,成為食物。

5 月 27 日,黃仁勛在臺(tái)灣大學(xué)發(fā)表了畢業(yè)典禮演講。

此刻,他正為全世界所矚目。

瞬間變身萬(wàn)億掌門(mén)人,讓他的話更有底氣。

黃仁勛表示,每個(gè)公司和個(gè)人都應(yīng)該熟悉人工智能,否則,就有失敗的危險(xiǎn)。

他強(qiáng)調(diào):敏捷的公司會(huì)利用人工智能提高自己的地位,這樣的公司不會(huì)倒閉。

很多人擔(dān)心,AI 會(huì)搶走自己的工作,但真正會(huì)搶走你飯碗的,是掌握了 AI 技術(shù)的人。

當(dāng)時(shí),他在演講中預(yù)言:從各方面來(lái)看,AI 的興盛是計(jì)算機(jī)產(chǎn)業(yè)的再生契機(jī)。在下個(gè)十年,我們的產(chǎn)業(yè)將使用新型的 AI 電腦,取代價(jià)值萬(wàn)億美元的傳統(tǒng)電腦。

而從今天的演講中,我們仿佛已經(jīng)窺見(jiàn)了這種未來(lái)的雛形。

參考資料:

  • https://www.youtube.com/watch?v=fHwmLOYJU_w

本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能英偉達(dá)

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知