作者 | 宛辰
編輯 | 靖宇
氣氛突然嚴(yán)肅了起來。
「有媒體認(rèn)為你要么是 AI 時(shí)代的達(dá)芬奇,要么是 AI 時(shí)代的奧本海默,你怎么看?」
「奧本海默是造炸彈的,我們(英偉達(dá))不干這個(gè)?!姑鎸@個(gè)多少有點(diǎn)戲謔的問題,英偉達(dá)創(chuàng)始人、CEO 黃仁勛遲疑片刻,非常認(rèn)真地回答了出來。
當(dāng)?shù)貢r(shí)間 3 月 19 日,以堪比流行巨星的熱度完成了 GTC 2024 的開場演講后第二天,黃仁勛接受了全球媒體采訪。
無論是宏大問題例如「AGI 何時(shí)到來」、「英偉達(dá)如何看待中國市場」,或者是具體到新推出的 NIM 軟件如何應(yīng)用,這位全球市值第三公司的掌舵人,都能將問題分解并抽象成更容易理解的層次,用簡單的比喻回答出來,雖然其中可能不乏「太極」的嫌疑,但至少令人難以懷疑回答者的誠懇。
兩萬億的市值新高度下,老黃認(rèn)為,GPU 芯片市場,不是英偉達(dá)的追求 ——「英偉達(dá)不造芯片,英偉達(dá)造數(shù)據(jù)中心」,為此,英偉達(dá)搭建了所有:硬件、軟件、服務(wù),讓客戶決定怎么購買自己的數(shù)據(jù)中心。
01.GTC 新品的中國市場計(jì)劃
問:新的網(wǎng)絡(luò)和技術(shù)計(jì)劃向中國銷售多少?有任何中國特定 SKU 的信息可以披露嗎?是否為該市場做出了任何考慮或改變?
黃仁勛:我還沒有向你宣布這一點(diǎn),你很貪婪(哈哈),這就是全部答案。現(xiàn)在對于中國,我們有 L20 和 H20 芯片符合出口要求,我們正在盡最大努力為中國市場組織調(diào)配資源。
02.AI Foundry 的目標(biāo)
問:你在主題演講里提到 AI Foundry 正在許多企業(yè)起作用,這個(gè)計(jì)劃的總體戰(zhàn)略和長期目標(biāo)是什么?
黃仁勛:AI Foundry 的目標(biāo)是構(gòu)建軟件。這不是指軟件作為工具,任何人都有這樣的軟件。很久以前創(chuàng)建的兩個(gè)最重要的軟件,一個(gè)叫做 Office,它讓軟件變得 RTS(Real-Time Software,實(shí)時(shí)軟件)。
另一個(gè)非常重要的軟件叫做 cuDNN(CUDA 深度神經(jīng)網(wǎng)絡(luò)庫)。我們有 AI 所有這些不同的。未來的庫是一個(gè)微服務(wù),因?yàn)槲磥淼膸觳粌H僅用數(shù)學(xué)來描述,還用 AI 來描述。未來,它們都將變成 NIMs(微服務(wù))。
這些 NIMs 是超級復(fù)雜的軟件,你所要做的就是來到我們的網(wǎng)站。你可以選擇用戶在那里,或者下載它、在另一個(gè)云端運(yùn)行它,或者下載在你的本地計(jì)算機(jī)上運(yùn)行。當(dāng)運(yùn)行你的工作站、你的數(shù)據(jù)中心時(shí),這項(xiàng)服務(wù)將使它們非常高效,所以這是一種在環(huán)境中使用的新方式?,F(xiàn)在,當(dāng)你作為一個(gè)企業(yè)運(yùn)行這些庫時(shí),我們有一個(gè)軟件許可(Liscence)的授權(quán)操作系統(tǒng)可用,你可以以 4500 美元 / GPU / 年的價(jià)格使用這些服務(wù)。
03.Blackwell 定價(jià)
問:你之前說最新一代 AI 芯片 Blackwell 的定價(jià)在 3 萬至 4 萬美元,有更精確的信息嗎?
黃仁勛:這很難說,我也只是試圖讓大家對我們產(chǎn)品的定價(jià)有一定體感,并不打算給出具體報(bào)價(jià)。
Blackwell 系統(tǒng)的定價(jià)非常不同,因?yàn)槊總€(gè)人要的配置不同。如果不僅使用 Blackwell,Blackwell 系統(tǒng)通常包括 NV-Link 在里面,所以不同系統(tǒng)的定價(jià)不同。像往常一樣,定價(jià)范圍通常視 TCO(總體擁有成本)而定。
英偉達(dá)不造芯片,英偉達(dá)造數(shù)據(jù)中心,為此我們搭建了所有任務(wù),引入所有軟件,調(diào)整它使數(shù)據(jù)中心系統(tǒng)盡可能地運(yùn)轉(zhuǎn)良好。然后,瘋狂的部分來了,我們將數(shù)據(jù)中心聚合成更小的部分,允許客戶根據(jù)自己的特定需求對其進(jìn)行修改,這包括網(wǎng)絡(luò)、存儲(chǔ)、控制平面、安全和管理模塊,想辦法把數(shù)據(jù)中心整合到客戶的系統(tǒng)中,最終,客戶決定如何購買它,所以跟過去銷售芯片不同,Blackwell 的定價(jià)不是芯片的事,我們的商業(yè)模式也反映了這一點(diǎn)。
英偉達(dá)的機(jī)會(huì)不是 GPU 芯片,是數(shù)據(jù)中心,數(shù)據(jù)中心正在快速走向加速,這是每年 2500 億美元的市場,并以每年 20% 至 25% 的速度增長,這主要是由于 AI 方面的需求。其中,英偉達(dá)會(huì)占據(jù)重要的份額,從 1 萬億美元升至 2 萬億美元,我認(rèn)為是合理的。
04.Sam Altman 要擴(kuò)張到芯片行業(yè)
問:Sam Altman 一直在與芯片業(yè)的人們談?wù)摂U(kuò)大 AI 芯片的規(guī)模。他和你談過這個(gè)問題嗎?
黃仁勛:我不知道他的意圖。他認(rèn)為生成式 AI 會(huì)變得很大,在這一點(diǎn)我很認(rèn)同。
今天計(jì)算機(jī)產(chǎn)生像素的方式是從數(shù)據(jù)集中檢索數(shù)據(jù),處理數(shù)據(jù),然后傳遞數(shù)據(jù)。在整個(gè)過程中,人們認(rèn)為需要消耗的能源非常少,但這恰恰相反。原因是每次你觸摸手機(jī)、每個(gè)提示,需要與數(shù)據(jù)集賽跑并返回。從數(shù)據(jù)集中檢索數(shù)據(jù),使用 CPU 收集所有必要的部分,然后以一種從推薦系統(tǒng)的角度看有意義的方式組合信息,然后將結(jié)果信息發(fā)送回用戶,這個(gè)過程需要大量的計(jì)算。
這就像每次問我一個(gè)問題,我都需要跑回辦公室檢索信息,這需要大量的精力。未來,越來越多的計(jì)算將是生成的,而不是基于檢索的。當(dāng)然,這個(gè)生成過程必須是智能的、與上下文相關(guān)的。我相信,未來人們電腦上的幾乎每一個(gè)像素、每一次交互都將通過生成過程產(chǎn)生,我相信 Sam 也這么認(rèn)為。希望通過 Blackwell 新一代架構(gòu)能為生成式 AI 這個(gè)領(lǐng)域做出重大貢獻(xiàn)?,F(xiàn)在大多數(shù)體驗(yàn)還是基于檢索的,但是如果未來每個(gè)人的人機(jī)交互都是生成式的體驗(yàn),我會(huì)很驚訝。這是一個(gè)巨大的機(jī)遇。
05.個(gè)人大模型會(huì)是什么樣子?
問:我完全同意你對未來軟件的定義,我們的生活也在通過 LLM 發(fā)生很大變化。在基礎(chǔ)模型方面,你認(rèn)為未來會(huì)是什么樣的?
黃仁勛:核心是,我們?nèi)绾螕碛袀€(gè)人的大模型?有一些方式可以做到。開始,我們認(rèn)為這個(gè)過程可能需要微調(diào)(fine tuning),在持續(xù)的使用過程中,持續(xù)微調(diào)。
但是,正如你所知,微調(diào)是相當(dāng)耗時(shí)的。然后我們發(fā)現(xiàn)了提示詞工程(prompt engineering),發(fā)現(xiàn)了上下文學(xué)習(xí)(context learning),發(fā)現(xiàn)了工作環(huán)境(working environment)等等。
我認(rèn)為答案將是所有這些的組合。在未來,你可以通過只微調(diào)一層叫 Lora 的權(quán)重(weights),鎖定其他部分不必微調(diào),從而低成本地做微調(diào),你可以做提示詞共創(chuàng)、上下文學(xué)習(xí)、增加模型記憶,所有這些成就了你獨(dú)特的大模型,可以在云端運(yùn)行,也可以在你的本地電腦上運(yùn)行。
06.對 AI 芯片初創(chuàng)公司的看法
問:昨天在你的主題演講后,芯片公司 Groq 發(fā)推文說自家芯片跑得仍然更快,你怎么看 AI 芯片初創(chuàng)公司的評論?
黃仁勛:我還沒了解那么多(哈哈),不評論了。
任何以 token 方式做生成的模型都需要其獨(dú)特的方式,因?yàn)?Transformer 不是任何一個(gè)模型的名稱。
這些模型總體基于 Transformer 技術(shù),都利用了 Transformer 注意力機(jī)制,但模型與模型之間存在巨大差別。有的模型用了混合專家模型(Mixture of Experts),混合模型里有的是兩個(gè)專家模型,有的是四個(gè)專家模型,這些模型等待消息,以及路由分發(fā),里面的一切步驟都不同,模型中的每一個(gè)都需要特殊優(yōu)化。
此時(shí),如果計(jì)算單元被設(shè)計(jì)成只能以特定的方式、做特定的事情,它就是一個(gè)可配置的電腦,而不是可編程配置的計(jì)算機(jī),就無法受益于軟件創(chuàng)新的速度和潛力。
就像 CPU 的奇跡不可低估一樣,這么多年,CPU 一直是 CPU 的原因,是它克服了這些年來設(shè)置在 PC 主板上的可配置硬件,軟件工程師的才能可以通過 CPU 來實(shí)現(xiàn)。相反,如果你把它固定在芯片上,你就斷了軟件工程師能帶給芯片的聰穎智慧。
這就是英偉達(dá)芯片能夠在不同的 AI 模型架構(gòu)(從 AlexNet 一直到 Transformer)下,都能表現(xiàn)出色的原因,英偉達(dá)找到了一種方法,從一種非常專業(yè)的計(jì)算形式中受益。芯片在這里被用來促進(jìn)軟件,而英偉達(dá)的工作是促進(jìn)發(fā)明,促進(jìn)像 ChatGPT 的發(fā)明。
07.機(jī)器人空間模擬如何利用語言模型?
問:你講述了使用生成式 AI 和模擬 / 仿真(simulation)來大規(guī)模訓(xùn)練機(jī)器人,但是有很多事情我們不知道如何很好地模擬,特別是當(dāng)涉及到結(jié)構(gòu)性的環(huán)境,如何突破限制繼續(xù)訓(xùn)練機(jī)器人?
黃仁勛:有多種方法可以做到這一點(diǎn)。首先,你可以在我們的語言模型上下文中構(gòu)建你的問題或觀點(diǎn)。
大型語言模型以不受約束和非結(jié)構(gòu)化的方式運(yùn)行,這同時(shí)也是它的潛力之一。它從文本中學(xué)到了很多東西,但可能不適合泛化。它們?nèi)绾卧诳臻g泛化是一種「魔力」,機(jī)器人的 ChatGPT 時(shí)刻可能就在眼前。
為了克服這個(gè)問題,你可以指定上下文和問題,例如告訴它處在特定條件的廚房中。通過應(yīng)用 ChatGPT 的魔力,機(jī)器人可以有效地泛化并生成對軟件有意義的 token。一旦你的計(jì)算機(jī)感官識(shí)別了這些 token,機(jī)器人可以根據(jù)這些例子進(jìn)行歸納。
08.預(yù)判下一個(gè) ChatGPT 時(shí)刻
問:你提到一些行業(yè)先迎來 ChatGPT 時(shí)刻。哪些行業(yè)會(huì)率先變化?可以分享你看到的突破,尤其讓你激動(dòng)人心的案例嗎?
黃仁勛:有很多例子。我對 Sora 非常興奮,去年在 wayve 上看到了同樣的能力,這是關(guān)于文生視頻的例子。
為了生成一個(gè)這樣的視頻,模型必須對物理規(guī)律有感知,比如把放在桌子上,而不是中間;走路的人是在地面上。不能違背物理規(guī)律。
另一個(gè)例子是我們用 Earth-2 來預(yù)測極端天氣影響。這是一個(gè)關(guān)鍵的研究領(lǐng)域,因?yàn)闃O端天氣事件會(huì)對當(dāng)?shù)厣鐓^(qū)造成毀滅性的影響。利用 Earth-2,可以在 3 公里尺度上預(yù)測極端天氣事件的影響。這是對現(xiàn)有方法的重大改進(jìn),現(xiàn)有方法需要的超級計(jì)算機(jī)要大 2.5 萬倍。
生成新藥物和蛋白質(zhì)是另一個(gè)非常令人印象深刻的潛在用例。這是通過像 Alphago 這樣的強(qiáng)化學(xué)習(xí)循環(huán)來實(shí)現(xiàn)的,它允許在不消耗純物質(zhì)的情況下探索大分子空間,這有可能徹底改變藥物發(fā)現(xiàn)。
這些是非常有影響力的東西,機(jī)器人技術(shù)也是如此。
09.芯片出口管制如何影響英偉達(dá)
問:對芯片的出口管制,以及地緣政治,會(huì)對英偉達(dá)產(chǎn)生什么影響?
黃仁勛:有兩件事我們必須馬上去做。第一,了解所有政策,以確保其合規(guī);第二,也要提高供應(yīng)鏈韌性。
關(guān)于后者,我舉個(gè)例子。當(dāng)我們把 Blackwell 芯片配置成 DGX 處理器時(shí),其中有 60 萬個(gè)零件來自世界各地,很多來自中國。就像全球汽車供應(yīng)鏈的復(fù)雜性一樣,供應(yīng)鏈的全球化很難被打破。
10.和臺(tái)積電的關(guān)系
問:你能談?wù)勁c臺(tái)積電的關(guān)系嗎?在過去的幾年里,隨著不斷芯片封裝的復(fù)雜性,臺(tái)積電如何幫助英偉達(dá)實(shí)現(xiàn)目標(biāo)的?
黃仁勛:與臺(tái)積電的合作是我們最緊密的合作之一,因?yàn)槲覀円龅氖虑榉浅ky,而他們能做得非常好。
我們從臺(tái)積電得到了計(jì)算單元,CPU、GPU 裸芯片,良率很好。存儲(chǔ)器是來自美光、海力士、三星,并且這些組裝必須在臺(tái)灣完成。所以,供應(yīng)鏈并非易事,需要公司之間的協(xié)調(diào)。這些大公司與我們一起合作,也逐漸意識(shí)到,更加密切的合作是非常必要的。
我們從各家公司獲取部件,然后組裝,第三家公司測試,第四家公司組成系統(tǒng),當(dāng)然這個(gè)大系統(tǒng)最后是為了建成一個(gè)超級計(jì)算機(jī),再進(jìn)行測試。最終,我們建立了數(shù)據(jù)中心。想象下,所有的加工制造就是為了形成一個(gè)巨大的數(shù)據(jù)中心。整個(gè)供應(yīng)鏈從上到下復(fù)雜度非常高,因?yàn)槲覀儾粌H僅是組裝,除了芯片本身是個(gè)奇跡外,我們做成了巨大而龐雜的系統(tǒng)。
所以,當(dāng)人們問我對 GPU 是什么感受時(shí),可能一部分覺得它有點(diǎn)像 Soc(集成芯片)而已,而我看到的是架子、線纜、交換機(jī)等等。這才是我心中 GPU 和軟件的模型。臺(tái)積電真的很重要。
11.云業(yè)務(wù)的戰(zhàn)略
問:英偉達(dá)正在向云業(yè)務(wù)轉(zhuǎn)型,其他云廠商則在做自己的芯片。他們會(huì)影響你的定價(jià)策略嗎?英偉達(dá)云業(yè)務(wù)的策略是什么?會(huì)向中國客戶銷售 DGX 云業(yè)務(wù)嗎?
黃仁勛:英偉達(dá)與云服務(wù)提供商合作,將其硬件和軟件放入他們的云中,這樣做的目標(biāo)是將客戶帶到他們的云中。
英偉達(dá)是一家計(jì)算平臺(tái)公司,我們開發(fā)軟件,我們有一批追隨英偉達(dá)的開發(fā)者,因而,我們?yōu)槭褂糜ミ_(dá) DGX 的云服務(wù)供應(yīng)商(CSP)創(chuàng)造需求、帶去客戶。
12.「當(dāng)代達(dá)芬奇」,還是「奧本海默」?
問:你曾說 AGI 將在 5 年內(nèi)到來,這個(gè)時(shí)間預(yù)測有發(fā)生變化嗎?AGI 的加速到來會(huì)讓你感到害怕嗎?有人說你是當(dāng)代達(dá)芬奇(多才多藝、做出如此貢獻(xiàn)),也有人說你是當(dāng)代的奧本海默,你怎么看?
黃仁勛:奧本海默是造炸彈的,我們(英偉達(dá))不干這個(gè)。
先具體定義 AGI,這樣我們才能知道什么程度才算到達(dá) AGI、什么時(shí)候到達(dá)。如果 AGI 意味著在大量的測試集上,數(shù)學(xué)測試、閱讀測試、邏輯測試、醫(yī)學(xué)考試、法律考試、GMAT、SAT 等等,軟件程序可以做到比大多數(shù)人類都更好,甚至比所有人都好,那么計(jì)算機(jī)在 5 年內(nèi)可以實(shí)現(xiàn) AGI。
本文來自微信公眾號(hào):極客公園 (ID:geekpark),作者:宛辰
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。