三大芯片巨頭正面碰撞，燃起獨(dú)立 GPU 新戰(zhàn)火

2021/8/25 11:17:43 來(lái)源：愛(ài)集微作者：李延責(zé)編：遠(yuǎn)洋

評(píng)論：

在剛剛結(jié)束的 2021 年架構(gòu)日上，Intel 公布了全新的獨(dú)立顯卡架構(gòu) Xe HPG，基于該架構(gòu)的首批 GPU 將采用臺(tái)積電 N6 工藝，于 2022 年第一季度上市。這是 Intel 從 1998 年發(fā)布 i740 以來(lái)，二十多年之后再次踏入獨(dú)立 GPU 市場(chǎng)。

由于 Intel 的加入，獨(dú)立 GPU 的市場(chǎng)將再次變成“三國(guó)殺”的局面，從圖形圖像到 AI 和高性能計(jì)算，技術(shù)競(jìng)爭(zhēng)和市場(chǎng)爭(zhēng)奪將全面升級(jí)。

從專(zhuān)用到通用

GPU 市場(chǎng)行情大好。根據(jù)市場(chǎng)研究公司 Jon Peddie Research 的報(bào)告，2021 年第一季全球 GPU 出貨量達(dá) 1.19 億顆，同比增長(zhǎng) 38.78%，環(huán)比下降 3%。

雖然 Intel 在整體 GPU 出貨上占據(jù)了 68% 的市場(chǎng)份額，但是在獨(dú)立 GPU 方面，英偉達(dá)則以 81% 的份額占據(jù)絕對(duì)領(lǐng)先，而 AMD 以 19% 的占有率排名第二。據(jù) JPR 的分析師預(yù)測(cè)，獨(dú)立 GPU 的出貨量還將繼續(xù)提升，到 2025 年將占整體 GPU 市場(chǎng)的 26%。

無(wú)論是云端、邊緣側(cè)還是終端，各種電子系統(tǒng)都需要高性能的圖像處理能力，GPU 的發(fā)展因此進(jìn)入加速階段。獨(dú)立 GPU 因?yàn)橛猛緩V泛，更是成為了大芯片中的佼佼者，架構(gòu)和工藝都已達(dá)芯片業(yè)的頂峰。

英偉達(dá)在 2020 年發(fā)布的面向消費(fèi)市場(chǎng)的旗艦級(jí) GeForce RTX 30 系列 GPU，采用了三星 8nm 工藝，其中的 RTX3080 和 RTX3090，所包含的晶體管數(shù)目已經(jīng)達(dá)到了 280 億個(gè)。與之對(duì)應(yīng)，AMD 的 RX 6000 系列，采用了臺(tái)積電的 7nm 工藝，晶體管數(shù)目也達(dá)到了 268 億個(gè)。

頂尖的工藝和龐大的晶體管數(shù)目對(duì)應(yīng)了越來(lái)越復(fù)雜的芯片架構(gòu)。以目前最新的英偉達(dá)安培（Ampere）架構(gòu)為例，其運(yùn)算部份就包括了流處理器 (Stream Processor，SP)、紋理單元（Texture mapping unit, TMU)、張量單元（Tensor Core）、光線追蹤單元（RT Cores）、光柵化處理單元（ROPs）。

其中，在游戲中應(yīng)用越來(lái)越多的光線追蹤技術(shù)由光追單元來(lái)負(fù)責(zé)，而將 GPU 帶入 AI 領(lǐng)域的則是張量單元，可用于實(shí)時(shí)深度學(xué)習(xí)、大型矩陣運(yùn)算和深度學(xué)習(xí)超級(jí)采樣（DLSS）。這兩個(gè)單元的引入也將 GPU 的性能和作用完全提升，從圖形處理器升級(jí)成計(jì)算處理器。

為了追求性能的極致，獨(dú)立 GPU 之間的競(jìng)爭(zhēng)因此就演化了成了架構(gòu)之間的比拼。英偉達(dá)在 2020 年推出了安培架構(gòu)，AMD 則回應(yīng)了 RDNA 2 架構(gòu)，使得其 RX 6000 在性能上可以與 RTX 30 一較高下。

有人將 GPU 架構(gòu)的升級(jí)趨勢(shì)概括為“更多”、“更專(zhuān)”、“更智能”。晶體管數(shù)量和運(yùn)算單元的增加是為多，其中包括流處理器單元、紋理單元、光柵單元等數(shù)量上升。“更專(zhuān)”是指除了常規(guī)的計(jì)算單元，GPU 還會(huì)增加新的運(yùn)算單元。“更智能”是指 GPU 的 AI 運(yùn)算能力上升。

三大芯片巨頭正面碰撞，燃起獨(dú)立 GPU 新戰(zhàn)火

這次 Intel 加入戰(zhàn)局也是有備而來(lái)，Xe 架構(gòu)經(jīng)過(guò)多年打磨而出，不但具備了時(shí)下最流行的各種元素，還使用了臺(tái)積電的 6 納米工藝，完全有實(shí)力與英偉達(dá)和 AMD 一較高下。

不過(guò)，有業(yè)內(nèi)人士指出，Intel 還是一個(gè)基因?qū)儆?CPU 的公司，而在 GPU 上的投入需要配合 CPU 的成長(zhǎng)，因此處理好 CPU 和 GPU 之間的發(fā)展沖突將是一個(gè)很大的挑戰(zhàn)。

爭(zhēng)奪數(shù)據(jù)中心和更廣闊天地

三大芯片巨頭正面碰撞，燃起獨(dú)立 GPU 新戰(zhàn)火

2012 年，多倫多大學(xué) Alex Krizhevsky 創(chuàng)建了能夠從 100 萬(wàn)樣本中自動(dòng)學(xué)習(xí)識(shí)別圖像的深度神經(jīng)網(wǎng)絡(luò)。僅在兩塊 NVIDIA GTX580 GPU 上訓(xùn)練數(shù)天，“Alex Net”就贏得了當(dāng)年的 Image Net 競(jìng)賽，擊敗了磨練幾十年的所有人類(lèi)專(zhuān)家算法。認(rèn)識(shí)深度學(xué)習(xí)的強(qiáng)大后，斯坦福的 Andrew Ng 與 NVIDIA 研究室合作開(kāi)發(fā)了一種使用大規(guī)模 GPU 計(jì)算系統(tǒng)訓(xùn)練網(wǎng)絡(luò)的方法。深度神經(jīng)網(wǎng)絡(luò)技術(shù)從此迅速發(fā)展，也一舉奠定了 GPU 在 AI 領(lǐng)域的地位。

GPU 提供了多個(gè)并行計(jì)算的基礎(chǔ)結(jié)構(gòu)，并且核心數(shù)較多，可以進(jìn)行海量數(shù)據(jù)的并行計(jì)算，還擁有更高的訪存速度和很高的浮點(diǎn)運(yùn)算能力。這一切都使得 GPU 完美契合了 AI 計(jì)算的需求。

當(dāng)前，GPU 是 AI“訓(xùn)練”階段較為適合的芯片。GPU 在 AI 時(shí)代的云端訓(xùn)練芯片中占據(jù)較大的份額，達(dá)到 64%。雖然后期由于 FPGA 以及 ASIC 技術(shù)的突破，GPU 的市場(chǎng)份額有所下降，但是仍然是云端訓(xùn)練市場(chǎng)份額最大的芯片，2019 年-2021 年年復(fù)合增長(zhǎng)率達(dá)到 40%。

這一切的起點(diǎn)就是 GPGPU 的應(yīng)用。用于通用計(jì)算的 GPU 被稱(chēng)為 GPGPU，可以與 CPU 協(xié)同工作，將一些大計(jì)算量的負(fù)載承接過(guò)來(lái)，以加速應(yīng)用程序。

GPGPU 的概念始于學(xué)界，真正讓其發(fā)揚(yáng)光大的還是英偉達(dá)。2006 年，英偉達(dá)推出了 Tesla 架構(gòu)，把 GPU 中的矢量計(jì)算單元拆成了多個(gè)標(biāo)量計(jì)算渲染單元，使其更適合通用計(jì)算。2007 年，英偉達(dá)又推出了 CUDA，專(zhuān)為 GPU 設(shè)計(jì)的并行計(jì)算平臺(tái)和編程模型。通過(guò) CUDA 可以大大降低用 GPU 做通用計(jì)算的難度，因此大大降低了 GPGPU 應(yīng)用的門(mén)檻。

當(dāng) CUDA 與深度學(xué)習(xí)相結(jié)合，更是釋放了 GPU 的巨大潛力，也讓 AI 從實(shí)驗(yàn)室走入了業(yè)界。同時(shí)，GPU 也穩(wěn)固了自己在數(shù)據(jù)中心的地位。

憑借 GPU 在數(shù)據(jù)中心的表現(xiàn)，英偉達(dá)的業(yè)績(jī)也一路走高。在 2021 年 Q1 財(cái)季，其數(shù)據(jù)中心業(yè)務(wù)營(yíng)收為 20.5 億美元，創(chuàng)下公司歷史上的新紀(jì)錄，與上年同期相比增長(zhǎng) 79%，與上一季度相比增長(zhǎng) 8%，占總營(yíng)收的比重已達(dá) 36%。

在此領(lǐng)域發(fā)力較晚的 AMD 現(xiàn)在也開(kāi)始奮起直追。根據(jù) AMD 首席執(zhí)行官 Lisa Su 的說(shuō)法，該公司第二季度數(shù)據(jù)中心 GPU 的銷(xiāo)售收入“同比增長(zhǎng)了一倍多”。Lisa Su 將該細(xì)分市場(chǎng)的出色表現(xiàn)歸功于該公司 Instinct 加速器部署的增加，其中還包括其基于 CDNA 2 架構(gòu)的最新數(shù)據(jù)中心顯卡的首次出貨。

現(xiàn)在，終于輪到 Intel 出手了。最新的面向數(shù)據(jù)中心的 GPU Ponte Vecchio 重磅出爐，擁有 1000 億顆晶體管的 SoC 也創(chuàng)下了 Intel 之最。

Ponte Vecchio 基于 Xe-HPC 微架構(gòu)，由多個(gè)復(fù)雜的設(shè)計(jì)組成，這些設(shè)計(jì)以單元形式呈現(xiàn)，然后通過(guò)嵌入式多芯片互連橋接（EMIB）單元進(jìn)行組裝，實(shí)現(xiàn)單元之間的低功耗、高速連接。這些設(shè)計(jì)均被集成于 Foveros 封裝中，為提高功率和互連密度形成有源芯片的 3D 堆疊。

“在 ASIC 和 FPGA 都在與 GPU 進(jìn)行競(jìng)爭(zhēng)的時(shí)刻，Intel 選擇了 GPU，說(shuō)明 GPU 可能還是通用 AI 的最好選擇?！毙袠I(yè)專(zhuān)家劉明（化名）這樣評(píng)論道。

這顆巨大的芯片也可以被看做是對(duì)英偉達(dá)推出數(shù)據(jù)中心 CPU 的反擊，雙方至此都形成了 CPU+GPU 的布局。

同時(shí)，英特爾還在發(fā)展其 oneAPI 計(jì)劃，使其成為 Nvidia CUDA 的強(qiáng)大競(jìng)爭(zhēng)對(duì)手，因?yàn)樗姆秶粌H限于 GPU，而且涵蓋 CPU 和所有處理器。

盡管獨(dú)立 GPU 不能完全取代 CPU，但是其已經(jīng)成為數(shù)據(jù)中心中非常關(guān)鍵的一環(huán)。當(dāng)三大芯片廠商都匯聚于此時(shí)，GPU 還會(huì)有更多精彩的故事。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

三大芯片巨頭正面碰撞，燃起獨(dú)立 GPU 新戰(zhàn)火

從專(zhuān)用到通用

爭(zhēng)奪數(shù)據(jù)中心和更廣闊天地

三大芯片巨頭正面碰撞，燃起獨(dú)立 GPU 新戰(zhàn)火