作者 | 宛辰、Li Yuan
編輯 | 靖宇
「瘋球了,徹底瘋球了!」
「這是什么?泰勒?斯威夫特的演唱會嗎?」
當(dāng)?shù)貢r間 3 月 18 日中午,美國加州圣何塞 SAP 體育中心,超過萬人的冰球體育館內(nèi)座無虛席。
這是 2024 年英偉達的 GTC 大會現(xiàn)場,人們等待的并不是 1 米 80 的白人女星,而是一位身穿皮衣的亞裔中年男性 —— 英偉達創(chuàng)始人兼 CEO 黃仁勛。
15 個月內(nèi)市值暴漲 6 倍至超過 2 萬億美元,成為繼蘋果和微軟之后的全球第三大科技公司,并且仍然看不到增長的天花板 —— 是的,從某種意義上看,黃仁勛可能比斯威夫特更像一個「搖滾巨星」。
時隔 5 年再度回歸線下的 GTC,現(xiàn)場爆滿。開場,老黃打趣道:「你要意識到,這不是一場演唱會,而是一個開發(fā)者大會」。面對「粉絲」的熱情歡呼,黃仁勛也不禁用調(diào)侃作為開場白。
很難想象能有一個會議容納如此多不同行業(yè)背景的人,從氣候技術(shù)到無線電科學(xué)、從機器人到自動駕駛、從 IT 業(yè)到非 IT 業(yè)?!缸谶@個會場里的你我他,代表世界上 100 萬億美元的行業(yè)」。
而把如此多行業(yè)和英偉達締結(jié)聯(lián)系的,正是 AI。以大語言模型為核心的 AI 正在席卷幾乎所有行業(yè),英偉達為各行各業(yè)的 AI 變革提供算力引擎。
兩萬億美元市值如何「坐實」、如何用算力繼續(xù)推送新一波的 AI 浪潮、更重要的是,英偉達如何成為「新計算時代」的王者?面對這些巨型問題,今年的這場 GTC 大會對于英偉達來說,尤其重要。
在長達 2 小時的開場演講中,黃仁勛介紹了當(dāng)下爆火的 AI 背后,英偉達準(zhǔn)備好的新引擎:新計算架構(gòu)下的硬件、軟件、服務(wù),點燃了一個加速生成式 AI 應(yīng)用的新生態(tài):
硬件上,新 Blackwell 架構(gòu) GPU 組成的 GB200「新核彈」,將提供 4 倍于 Hopper 的訓(xùn)練性能,大模型參數(shù)達到了萬億級別。
軟件層面,NIM「數(shù)字盒子」,讓企業(yè)能更簡單的在英偉達平臺上定制大模型;Omniverse 將機器人、無人駕駛和數(shù)字孿生的訓(xùn)練和應(yīng)用融合在一個平臺之中。
從這次發(fā)布會,你可以看到英偉達一方面通過「新 AI 核彈」穩(wěn)固自己「生成 AI 算力基建」的地位;另一方面通過 NIM、Omniverse 進一步擴大產(chǎn)業(yè)鏈下游,力求將自己的客戶 —— 大模型公司 —— 逐漸管道化;同時利用 Thor+ Omniverse 成為數(shù)字孿生、無人駕駛以及機器人等新興行業(yè)最重要的基礎(chǔ)平臺。
在發(fā)布預(yù)測天氣的 Earth-2 模型時,黃仁勛背后出現(xiàn)了一張地球的衛(wèi)星圖片?!杆囊靶囊恢倍际钦麄€地球,無論是物理的,還是虛擬的?!瓜矚g瞎猜的人,可能會寫下這樣的圖注。
01. Blackwell,專為 Transformer 而生
過去 10 年,隨著 AI 的代際發(fā)展,英偉達提供所需算力的速度也在加快。
現(xiàn)在,生成式 AI 時代,英偉達計算平臺進入下一個周期 ——Blackwell。這一新架構(gòu)是繼兩年前推出的 Hopper 架構(gòu)以來的全新架構(gòu)。
與之前的 Hopper GPU 一樣,Blackwell GPU 將作為獨立 GPU 提供,或者兩個 Blackwell GPU 可以組合并與英偉達的 Grace CPU 配對,創(chuàng)建一個超級芯片 GB200。
作為一個超大規(guī)模的芯片,GB200 通過 900GB/s 超低功耗的片間互聯(lián),將兩個 B200 GPU 與 Grace CPU 相連。
英偉達表示,該系統(tǒng)可以部署 27 萬億參數(shù)的模型。這甚至比最大的模型(例如 GPT-4)還要大得多,據(jù)報道 GPT-4 有 1.7 萬億個參數(shù)。
為了實現(xiàn)超高的 AI 性能,搭載 GB200 的系統(tǒng)可與英偉達 Quantum-X800 InfiniBand 和 Spectrum-X800 以太網(wǎng)平臺連接。這兩個平臺均可提供速度高達 800Gb / s 的高性能網(wǎng)絡(luò)。
Nvidia 還發(fā)布了 GB200 NVL72 液冷機架系統(tǒng),其中包含 36 顆 GB200 Grace Blackwell Superchips。Nvidia 表示,與當(dāng)前的 H100 GPU 相比,該系統(tǒng)的推理工作負載性能提高了 30 倍。
作為英偉達在 AI 訓(xùn)練和推理方面的新的頂級領(lǐng)導(dǎo)者,Blackwell GPU 和 GB200 超級芯片也將被引入云平臺 NVIDIA DGX B200 系統(tǒng)中,用以模型訓(xùn)練、微調(diào)和推理。所有 NVIDIA DGX 平臺均包含用于企業(yè)級開發(fā)和部署的 NVIDIA AI Enterprise 軟件。
亞馬遜,谷歌、微軟和甲骨文將通過云服務(wù)出售 GB200 的訪問權(quán)限。
02. 定制大模型,更簡單
數(shù)據(jù)顯示,在這一波 AI 浪潮中,英偉達提供的 AI 算力可能達到了所有所需算力的 90% 甚至更高。而怎樣才能賣出更多算力?顯然是讓更多企業(yè)用上大模型。
企業(yè)想要使用大模型,通常需要進行微調(diào)和私有化部署,才能對自己的企業(yè)的業(yè)務(wù)有所助益。而在目前,通常通過部署模型的云廠商或者小的服務(wù)商完成。
此次發(fā)布會上,英偉達則推出了自己的模型定制服務(wù),Nvidia Inference Manager,簡稱 NIM,來實現(xiàn)有英偉達硬件的地方,就可以進行簡單的調(diào)試使用大模型。
NIM 被形容為一個數(shù)字盒子,在英偉達提供的網(wǎng)站下載即可使用。
盒子中包含幾個要件。首先是基礎(chǔ)大模型,有多種相關(guān)模型可供選擇,黃仁勛提到其中包括開源模型如 Llama,來自合作伙伴的模型,也包括英偉達自己創(chuàng)建的一些模型 —— 例如英偉達剛剛在 GTC 公布了一個新的天氣預(yù)測模型。
按照英偉達的說法,它們都是根據(jù)英偉達硬件已經(jīng)優(yōu)化好的,無論你的硬件是筆記本電腦這樣只有一塊 CPU 的,還是公司級別有多個 GPU 節(jié)點的,都可以直接使用。
第二是可以幫助用戶微調(diào)大模型的工具,這包含多項微服務(wù)。
比如,英偉達 2023 年 11 月宣布的 NVIDIA NeMo Retriever 技術(shù),就被集成在整個的微服務(wù)中,可以幫助企業(yè)啟用 RAG 功能 —— 簡單來說就是幫助企業(yè)更好地使用自己的專有數(shù)據(jù)。
黃仁勛在演講中舉例子道:只下載了 Llama 2 模型時,他向 Llama2 提問公司獨有的編程語言方面的問題,Llama 2 無法很好地回答。而將公司的私有數(shù)據(jù)提供給大模型之后,大模型不但能回答出這個問題了,還能夠使用公司獨有的編程語言進行編程了。
除了 RAG 增強,還有一系列的微服務(wù)可以幫助用戶使用大模型。包括 Lemo 檢索器,幫助信息的快速檢索,數(shù)字人的微服務(wù),幫助用戶創(chuàng)建數(shù)字人等等。都包含在微服務(wù)中。
「未來我們將怎么構(gòu)筑軟件?應(yīng)該不是一行行地寫代碼。」黃仁勛講到,「很有可能是一個超級 AI 將任務(wù)分解,再交給一個一個的 NIM 去做?!?/p>
這樣的 NIM,則可以被安裝在任何英偉達硬件適配的地方。比如英偉達的 DGX 系統(tǒng)上,任何云上、企業(yè)私有的數(shù)據(jù)中心、或者是個人的硬件上。黃仁勛直接在演講中說道:「我們是 AI 鑄造廠。」
這項微服務(wù),現(xiàn)在開發(fā)者可以免費試用。而企業(yè)則需要在企業(yè)軟件訂閱中,之前有消息稱,每個 GPU 每年收取費用 4500 美元。
03.「現(xiàn)實 AI」:數(shù)字倉庫和機器人
在推進算力和算力的使用上,英偉達是認(rèn)真的。英偉達在二十年前就做出了 CUDA,推崇加速計算,今日的碩果累累來自于二十年前種下的因。
黃仁勛開場時回顧二十年前,半開玩笑地講到:「當(dāng)時我們已經(jīng)算到了有今日。」
而黃仁勛看到的未來是什么樣的呢?
在今天的 GTC 上,我們也小小地瞥見了一下黃仁勛眼中的未來:在世界的底層,是無限擴展的、不竭的算力,在中層,是數(shù)字孿生,是 simulation,是依靠算力帶來的對物理世界的無限精準(zhǔn)的模仿,實驗和預(yù)測,而在上層,則是一個依靠算力達到最優(yōu)解的世界 —— 在這個世界里,人與機器人共生。一切第一次發(fā)生的,都是發(fā)生過無數(shù)次的。
這其中,英偉達 2021 年開始推出的 Omniverse,就是中間層非常重要的工具。
Omniverse 是英偉達擅長的計算機圖形、人工智能、科技計算和物理模擬真正大一統(tǒng)的平臺,能夠?qū)Νh(huán)境實現(xiàn) 1:1 的數(shù)字孿生。
此次發(fā)布會,結(jié)合人工智能的浪潮,Omniverse 展現(xiàn)了許多新的應(yīng)用可能。
Omniverse 可以為現(xiàn)在最火的具身智能,提供一個訓(xùn)練場所。英偉達表示,英偉達建立了 Isaac Lab,一款機器人學(xué)習(xí)應(yīng)用程序,用于在 Omniverse Isaac 模擬器上進行訓(xùn)練。通過新的計算編排服務(wù),可以在基于物理的模擬中訓(xùn)練機器人,并能零次訓(xùn)練(zero-shot)遷移到實際環(huán)境。
機器人模型將使機器人能夠從少量人類演示中學(xué)習(xí),從視頻中理解人類、在模擬中訓(xùn)練模型,并最終直接部署到物理機器人上。
黃仁勛還在發(fā)布會上宣布了 Project GR00T 項目,GR00T 是一個用于人形機器人的通用基礎(chǔ)模型,基于 Jetson Thor(英偉達的一款 GPU)來開發(fā)生產(chǎn)機器人。
除此之外,英偉達還展示了一個數(shù)字倉庫的案例。
視頻中,展示了一個一個 10 萬平方英尺倉庫的 Omniverse 模擬環(huán)境,它整合了運行視頻、Isaac 感知器堆棧的數(shù)字工人 AMR、來自 100 個模擬天花板安裝攝像頭的整個倉庫的集中活動地圖等。
在視頻中,一個數(shù)字工人 AMR 的原定計劃的路線上,發(fā)生了一起事故,路徑受阻。英偉達 Metropolis 可以實時改變路徑規(guī)劃。通過基于生成式 AI 的 Metropolis 視覺基礎(chǔ)模型,操作員甚至可以使用自然語言提問發(fā)生了什么事情。
在此次 GTC 上,英偉達宣布,將創(chuàng)建 Omniverse Cloud 的 api,而且將非常易用,企業(yè)可以更容易地使用 Omniverse,同時其中還將有 AI 的能力。比如可以直接用自然語言場景描述,創(chuàng)建仿真環(huán)境的 3D 圖像。
同時,英偉達宣布與 Vision Pro 達成合作,Omniverse Cloud 將能夠向 Vision Pro 串流?!笍奶摂M車上下來,穿過車門的感覺,非常奇怪,但也非常棒?!裹S仁勛講到,「Vision Pro 將把你帶入 Omniverse Cloud,你能夠體驗到的工作流是無與倫比的。」
超過 1 萬人在現(xiàn)場觀看 Keynote,900 場以上的分享以及數(shù)百家展商,2024 年 GTC 被戲稱為「AI 界的伍德斯托克」—— 除了蘋果公司,少有公司能讓科技變成一種人人想要「沾上邊」的時尚。畢竟,在「生成式 AI」代表未來的當(dāng)下,每個人都想成為那個跟上潮流的人。
英偉達無疑是那個潮流背后最大的推手之一,同時也是目前最大的受益方,它需要做的,是為所有人提供更大的夢想,和更多的算力。順便,或許,成為全球市值最高的公司,沒有之一。
本文來自微信公眾號:極客公園 (ID:geekpark),作者:宛辰、Li Yuan
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。