設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

三大芯片巨頭正面碰撞,燃起獨(dú)立 GPU 新戰(zhàn)火

2021/8/25 11:17:43 來(lái)源:愛(ài)集微 作者:李延 責(zé)編:遠(yuǎn)洋

在剛剛結(jié)束的 2021 年架構(gòu)日上,Intel 公布了全新的獨(dú)立顯卡架構(gòu) Xe HPG,基于該架構(gòu)的首批 GPU 將采用臺(tái)積電 N6 工藝,于 2022 年第一季度上市。這是 Intel 從 1998 年發(fā)布 i740 以來(lái),二十多年之后再次踏入獨(dú)立 GPU 市場(chǎng)。

由于 Intel 的加入,獨(dú)立 GPU 的市場(chǎng)將再次變成“三國(guó)殺”的局面,從圖形圖像到 AI 和高性能計(jì)算,技術(shù)競(jìng)爭(zhēng)和市場(chǎng)爭(zhēng)奪將全面升級(jí)。

從專(zhuān)用到通用

GPU 市場(chǎng)行情大好。根據(jù)市場(chǎng)研究公司 Jon Peddie Research 的報(bào)告,2021 年第一季全球 GPU 出貨量達(dá) 1.19 億顆,同比增長(zhǎng) 38.78%,環(huán)比下降 3%。

雖然 Intel 在整體 GPU 出貨上占據(jù)了 68% 的市場(chǎng)份額,但是在獨(dú)立 GPU 方面,英偉達(dá)則以 81% 的份額占據(jù)絕對(duì)領(lǐng)先,而 AMD 以 19% 的占有率排名第二。據(jù) JPR 的分析師預(yù)測(cè),獨(dú)立 GPU 的出貨量還將繼續(xù)提升,到 2025 年將占整體 GPU 市場(chǎng)的 26%。

無(wú)論是云端、邊緣側(cè)還是終端,各種電子系統(tǒng)都需要高性能的圖像處理能力,GPU 的發(fā)展因此進(jìn)入加速階段。獨(dú)立 GPU 因?yàn)橛猛緩V泛,更是成為了大芯片中的佼佼者,架構(gòu)和工藝都已達(dá)芯片業(yè)的頂峰。

英偉達(dá)在 2020 年發(fā)布的面向消費(fèi)市場(chǎng)的旗艦級(jí) GeForce RTX 30 系列 GPU,采用了三星 8nm 工藝,其中的 RTX3080 和 RTX3090,所包含的晶體管數(shù)目已經(jīng)達(dá)到了 280 億個(gè)。與之對(duì)應(yīng),AMD 的 RX 6000 系列,采用了臺(tái)積電的 7nm 工藝,晶體管數(shù)目也達(dá)到了 268 億個(gè)。

頂尖的工藝和龐大的晶體管數(shù)目對(duì)應(yīng)了越來(lái)越復(fù)雜的芯片架構(gòu)。以目前最新的英偉達(dá)安培(Ampere)架構(gòu)為例,其運(yùn)算部份就包括了流處理器 (Stream Processor,SP)、紋理單元(Texture mapping unit, TMU)、張量單元(Tensor Core)、光線追蹤單元(RT Cores)、光柵化處理單元(ROPs)。

其中,在游戲中應(yīng)用越來(lái)越多的光線追蹤技術(shù)由光追單元來(lái)負(fù)責(zé),而將 GPU 帶入 AI 領(lǐng)域的則是張量單元,可用于實(shí)時(shí)深度學(xué)習(xí)、大型矩陣運(yùn)算和深度學(xué)習(xí)超級(jí)采樣(DLSS)。這兩個(gè)單元的引入也將 GPU 的性能和作用完全提升,從圖形處理器升級(jí)成計(jì)算處理器。

為了追求性能的極致,獨(dú)立 GPU 之間的競(jìng)爭(zhēng)因此就演化了成了架構(gòu)之間的比拼。英偉達(dá)在 2020 年推出了安培架構(gòu),AMD 則回應(yīng)了 RDNA 2 架構(gòu),使得其 RX 6000 在性能上可以與 RTX 30 一較高下。

有人將 GPU 架構(gòu)的升級(jí)趨勢(shì)概括為“更多”、“更專(zhuān)”、“更智能”。晶體管數(shù)量和運(yùn)算單元的增加是為多,其中包括流處理器單元、紋理單元、光柵單元等數(shù)量上升。“更專(zhuān)”是指除了常規(guī)的計(jì)算單元,GPU 還會(huì)增加新的運(yùn)算單元。“更智能”是指 GPU 的 AI 運(yùn)算能力上升。

這次 Intel 加入戰(zhàn)局也是有備而來(lái),Xe 架構(gòu)經(jīng)過(guò)多年打磨而出,不但具備了時(shí)下最流行的各種元素,還使用了臺(tái)積電的 6 納米工藝,完全有實(shí)力與英偉達(dá)和 AMD 一較高下。

不過(guò),有業(yè)內(nèi)人士指出,Intel 還是一個(gè)基因?qū)儆?CPU 的公司,而在 GPU 上的投入需要配合 CPU 的成長(zhǎng),因此處理好 CPU 和 GPU 之間的發(fā)展沖突將是一個(gè)很大的挑戰(zhàn)。

爭(zhēng)奪數(shù)據(jù)中心和更廣闊天地

2012 年,多倫多大學(xué) Alex Krizhevsky 創(chuàng)建了能夠從 100 萬(wàn)樣本中自動(dòng)學(xué)習(xí)識(shí)別圖像的深度神經(jīng)網(wǎng)絡(luò)。僅在兩塊 NVIDIA GTX580 GPU 上訓(xùn)練數(shù)天,“Alex Net”就贏得了當(dāng)年的 Image Net 競(jìng)賽,擊敗了磨練幾十年的所有人類(lèi)專(zhuān)家算法。認(rèn)識(shí)深度學(xué)習(xí)的強(qiáng)大后,斯坦福的 Andrew Ng 與 NVIDIA 研究室合作開(kāi)發(fā)了一種使用大規(guī)模 GPU 計(jì)算系統(tǒng)訓(xùn)練網(wǎng)絡(luò)的方法。深度神經(jīng)網(wǎng)絡(luò)技術(shù)從此迅速發(fā)展,也一舉奠定了 GPU 在 AI 領(lǐng)域的地位。

GPU 提供了多個(gè)并行計(jì)算的基礎(chǔ)結(jié)構(gòu),并且核心數(shù)較多,可以進(jìn)行海量數(shù)據(jù)的并行計(jì)算,還擁有更高的訪存速度和很高的浮點(diǎn)運(yùn)算能力。這一切都使得 GPU 完美契合了 AI 計(jì)算的需求。

當(dāng)前,GPU 是 AI“訓(xùn)練”階段較為適合的芯片。GPU 在 AI 時(shí)代的云端訓(xùn)練芯片中占據(jù)較大的份額,達(dá)到 64%。雖然后期由于 FPGA 以及 ASIC 技術(shù)的突破,GPU 的市場(chǎng)份額有所下降,但是仍然是云端訓(xùn)練市場(chǎng)份額最大的芯片,2019 年-2021 年年復(fù)合增長(zhǎng)率達(dá)到 40%。

這一切的起點(diǎn)就是 GPGPU 的應(yīng)用。用于通用計(jì)算的 GPU 被稱(chēng)為 GPGPU,可以與 CPU 協(xié)同工作,將一些大計(jì)算量的負(fù)載承接過(guò)來(lái),以加速應(yīng)用程序。

GPGPU 的概念始于學(xué)界,真正讓其發(fā)揚(yáng)光大的還是英偉達(dá)。2006 年,英偉達(dá)推出了 Tesla 架構(gòu),把 GPU 中的矢量計(jì)算單元拆成了多個(gè)標(biāo)量計(jì)算渲染單元,使其更適合通用計(jì)算。2007 年,英偉達(dá)又推出了 CUDA,專(zhuān)為 GPU 設(shè)計(jì)的并行計(jì)算平臺(tái)和編程模型。通過(guò) CUDA 可以大大降低用 GPU 做通用計(jì)算的難度,因此大大降低了 GPGPU 應(yīng)用的門(mén)檻。

當(dāng) CUDA 與深度學(xué)習(xí)相結(jié)合,更是釋放了 GPU 的巨大潛力,也讓 AI 從實(shí)驗(yàn)室走入了業(yè)界。同時(shí),GPU 也穩(wěn)固了自己在數(shù)據(jù)中心的地位。

憑借 GPU 在數(shù)據(jù)中心的表現(xiàn),英偉達(dá)的業(yè)績(jī)也一路走高。在 2021 年 Q1 財(cái)季,其數(shù)據(jù)中心業(yè)務(wù)營(yíng)收為 20.5 億美元,創(chuàng)下公司歷史上的新紀(jì)錄,與上年同期相比增長(zhǎng) 79%,與上一季度相比增長(zhǎng) 8%,占總營(yíng)收的比重已達(dá) 36%。

在此領(lǐng)域發(fā)力較晚的 AMD 現(xiàn)在也開(kāi)始奮起直追。根據(jù) AMD 首席執(zhí)行官 Lisa Su 的說(shuō)法,該公司第二季度數(shù)據(jù)中心 GPU 的銷(xiāo)售收入“同比增長(zhǎng)了一倍多”。Lisa Su 將該細(xì)分市場(chǎng)的出色表現(xiàn)歸功于該公司 Instinct 加速器部署的增加,其中還包括其基于 CDNA 2 架構(gòu)的最新數(shù)據(jù)中心顯卡的首次出貨。

現(xiàn)在,終于輪到 Intel 出手了。最新的面向數(shù)據(jù)中心的 GPU Ponte Vecchio 重磅出爐,擁有 1000 億顆晶體管的 SoC 也創(chuàng)下了 Intel 之最。

Ponte Vecchio 基于 Xe-HPC 微架構(gòu),由多個(gè)復(fù)雜的設(shè)計(jì)組成,這些設(shè)計(jì)以單元形式呈現(xiàn),然后通過(guò)嵌入式多芯片互連橋接(EMIB)單元進(jìn)行組裝,實(shí)現(xiàn)單元之間的低功耗、高速連接。這些設(shè)計(jì)均被集成于 Foveros 封裝中,為提高功率和互連密度形成有源芯片的 3D 堆疊。

“在 ASIC 和 FPGA 都在與 GPU 進(jìn)行競(jìng)爭(zhēng)的時(shí)刻,Intel 選擇了 GPU,說(shuō)明 GPU 可能還是通用 AI 的最好選擇?!毙袠I(yè)專(zhuān)家劉明(化名)這樣評(píng)論道。

這顆巨大的芯片也可以被看做是對(duì)英偉達(dá)推出數(shù)據(jù)中心 CPU 的反擊,雙方至此都形成了 CPU+GPU 的布局。

同時(shí),英特爾還在發(fā)展其 oneAPI 計(jì)劃,使其成為 Nvidia CUDA 的強(qiáng)大競(jìng)爭(zhēng)對(duì)手,因?yàn)樗姆秶粌H限于 GPU,而且涵蓋 CPU 和所有處理器。

盡管獨(dú)立 GPU 不能完全取代 CPU,但是其已經(jīng)成為數(shù)據(jù)中心中非常關(guān)鍵的一環(huán)。當(dāng)三大芯片廠商都匯聚于此時(shí),GPU 還會(huì)有更多精彩的故事。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知