20 年后重返獨顯戰(zhàn)場，深度分析英特爾 Xe GPU 戰(zhàn)略

芯東西 2020/12/26 16:46:11 責(zé)編：孤城

評論：

12月15日消息，近日，EETimes對英特爾的顯卡戰(zhàn)略和發(fā)展前景進(jìn)行了梳理分析。

在他們看來，英特爾新發(fā)的Xe架構(gòu)是為開發(fā)更多全場景適配顯卡做鋪墊。同時，英特爾近日發(fā)行的獨立顯卡“DG1”彌補了英特爾的技術(shù)短板，并將在市場上獲得一定反響。

英特爾在發(fā)布兩款Xe GPU后，成功躋身獨立顯卡制造商行列。然而，“參與”和“引領(lǐng)”之間有很大的區(qū)別。從休閑玩家的筆記本電腦到高端游戲臺式機(jī)，從入門級安卓游戲硬件到超級計算機(jī)，英特爾的顯卡戰(zhàn)略幾乎無所不包。很顯然，英特爾想成為顯卡領(lǐng)域的領(lǐng)導(dǎo)者，但是英特爾真的可以嗎？

過去，計算機(jī)顯卡主要有兩種用途：游戲和專業(yè)可視化（ProViz）。游戲硬件包括街機(jī)、游戲機(jī)和個人電腦。ProViz硬件主要用于計算機(jī)輔助設(shè)計（CAD）、數(shù)字內(nèi)容創(chuàng)建（DCC）、醫(yī)學(xué)成像和各種視覺模擬需求。在2005年后，GPU逐漸應(yīng)用于各類高性能計算（HPC）應(yīng)用。

如今，計算機(jī)顯卡的應(yīng)用場景不再局限于游戲、ProViz或HPC，但隨著新應(yīng)用場景的出現(xiàn)，適配問題愈發(fā)凸顯。比如，高并行的GPU能為人工智能、深度學(xué)習(xí)（DL）/機(jī)器學(xué)習(xí)（ ML）應(yīng)用程序提供支持，但往往需要在傳統(tǒng)的游戲和ProViz數(shù)據(jù)格式之外，獲取額外的數(shù)據(jù)格式支持。云端游戲顯卡和服務(wù)器端圖形渲染應(yīng)用專為游戲打造，但是這類顯卡并非數(shù)據(jù)中心的最佳選擇。

若想成為顯卡領(lǐng)跑者，英特爾必須開發(fā)全系列的顯卡，涵蓋傳統(tǒng)用途、HPC和新興應(yīng)用場景。而這項任務(wù)的艱巨性無需多言。

近幾個月，英特爾終于推出了近20年來第一款獨立顯卡，同時透露了更多的顯卡戰(zhàn)略細(xì)節(jié)。我們現(xiàn)在就來領(lǐng)略一下英特爾的雄圖大略，同時聽取專家的分析意見。

一、英特爾Xe架構(gòu)：高度平行、用途多樣

三年前，英特爾再次投身獨立顯卡研發(fā)，邀請業(yè)界大牛Raja Koduri加入英特爾，成立核心和視覺計算小組（Core and Visual Computing Group）來專攻獨立顯卡。

當(dāng)時，英特爾明確表示，將以客戶端、數(shù)據(jù)中心和高性能計算細(xì)分領(lǐng)域為服務(wù)對象，更好地處理人工智能、圖形處理（游戲、模擬、ProViz、AR/VR等）、機(jī)器學(xué)習(xí)等高性能需求任務(wù)。

為此，英特爾曾嘗試推出代號為“Larrabee”的多核處理器。按照設(shè)想，這款顯卡能夠在滿足圖像處理需求的同時，承擔(dān)高性能計算負(fù)載。然而，由于英特爾執(zhí)意想采用x86架構(gòu)，這次嘗試最終失敗了。

Koduri掌舵后，英特爾開始研發(fā)高度平行架構(gòu)“Xe”，Xe架構(gòu)能夠適應(yīng)不同的工作負(fù)載需要，算力在TFLOPS（每秒萬億次的浮點運算）到ExaFLOPS（每秒百億億次的浮點運算）區(qū)間不等，具有較強的場景適應(yīng)性。

截至目前，英特爾已推出Xe-LP低功耗系列，用于集成核顯、入門級獨顯。在未來幾年，英特爾還計劃發(fā)布三套Xe GPU架構(gòu)，以滿足不同工作負(fù)載需要。

此外，為了確保Xe GPU（以及AI加速器、GPU、FPGA等）簡單可用，英特爾面向軟件開發(fā)團(tuán)隊推出了oneAPI工具包（統(tǒng)一編程模型）以及零級接口規(guī)范（僅針對AI、GPU、FPGA產(chǎn)品）。

二、Xe-LP：96個EU，內(nèi)存帶寬提高2倍！

近20年來，英特爾盡管缺席獨顯市場，卻一直活躍在集成顯卡領(lǐng)域，針對低價、低能耗的電腦推出了Gen架構(gòu)。

Gen架構(gòu)能夠很好地適用于輕量級任務(wù)，但并不適用于數(shù)據(jù)中心等高性能要求任務(wù)。為此，英特爾推出了全新的Xe架構(gòu)。

針對入門級產(chǎn)品，英特爾推出了Xe-LP，主要用于集成核顯、入門級獨顯。

和去年推出的Gen 11架構(gòu)一樣，英特爾Xe-LP架構(gòu)也能全面支持DirectX 12_1 API。此外，新架構(gòu)帶來了明顯的性能優(yōu)勢，借助英特爾10nm Superfin制程工藝實現(xiàn)了更高的頻率潛力（最高可達(dá)1.7GHz，上一代僅為1.1GHz）。

英特爾Xe-LP iGPU率先應(yīng)用于第11代酷睿處理器“Tiger Lake”。Xe-LP iGPU的頂配版本具有96個執(zhí)行單元（EU），運行速度可達(dá)1536 FP16 FLOPS/clock，每周期Texel紋理、Pixel像素渲染能力也從32、16提升到48、24。

內(nèi)存子系統(tǒng)經(jīng)改進(jìn)，具有新的L1 Data Cache（數(shù)據(jù)高速緩存）、16 MB L3 Cache，同時支持端到端壓縮及新的Ringbus互連技術(shù)，與上一代產(chǎn)品相比，可將帶寬提高2倍。

和上一代架構(gòu)相比，Xe-LP架構(gòu)一大更新便是執(zhí)行單元（EU）。全新EU集成了8-wide FP/INT ALU8和2-wide extended math ALU。8-wide FP/INT ALU8運算速度可達(dá)1 FP32/INT32 ops/clock、2 FP16/INT16 ops/clock和4 INT8 ops/clock，以更好地處理AI工作負(fù)載產(chǎn)生的各類數(shù)據(jù)。同時，兩個EU共享線程控制（Thread Control），從而節(jié)省空間。

如若所有FP/INT ALU均以1.35GHZ的頻率工作，Tiger Lake的高端Xe-LP iGPU可提供約2.1 TFLOPS的FP32圖形處理性能，近乎是英特爾上一代Iris Plus G7顯卡（1.12 TFLOPS）的兩倍。此外，英特爾還提供了入門版本的Xe-LP iGPU，入門版本的EU等單元數(shù)量較少，性能也相對弱一些。

Xe-LP GPU還配備了英特爾最新的顯示引擎（Display Engine）和媒體引擎（Media Engine）。新款媒體引擎具有12-bit end-to-end video pipeline，可播放BT.2020等格式的視頻，同時能為最新編解碼器（例如AV1）提供硬件加速解碼功能。

由于集成顯卡主要用于辦公和媒體瀏覽，媒體引擎對集顯的重要性不言而喻，同時對各類流媒體應(yīng)用也有不可或缺的作用。

顯示引擎支持四個video pipeline以及eDP、DisplayPort 1.2、HDMI 2.0、Thunderbolt 4/USB4 Type-C輸出，足以滿足當(dāng)今的集成顯卡和入門級獨顯的需求。

三、英特爾集顯市占率達(dá)70%，Xe-LP市場潛力巨大

英特爾將Xe-LP集成顯卡和獨立顯卡的用戶群體定位為游戲玩家和創(chuàng)作者。

游戲方面，英特爾在提升硬件性能的同時，還努力優(yōu)化驅(qū)動程序等軟件表現(xiàn)。

例如，Xe-LP驅(qū)動程序支持硬件/軟件調(diào)度代碼簽名（hardware/software scheduling codesign），為基于DirectX 11的游戲增加了靈活性。此外，這一系列還支持VRS可變幀率渲染，根據(jù)渲染場景的不同來選擇降低或者提升渲染內(nèi)容，以免在次要場景上浪費過多算力。

同時，英特爾還增加了游戲銳化（GS）技術(shù)，該技術(shù)可在分辨率不變的情況下提高游戲圖像的清晰度，從而節(jié)省帶寬，不過有可能增加GPU的其他部分的負(fù)荷，用戶可以選擇自行啟用/禁用GS技術(shù)。

Jon Peddie Research的研究指出，全球近70％的PC搭載了英特爾的集成顯卡。因此，英特爾一旦過渡到其新的Xe-LP架構(gòu)，“吃”內(nèi)置顯卡的游戲必須相應(yīng)作出調(diào)整。此外，英特爾還可以定制驅(qū)動程序，保持產(chǎn)品競爭力。

“ Xe-LP是英特爾顯卡戰(zhàn)略的第一步，”英特爾發(fā)言人布魯斯·費恩伯格（Bruce Fienberg）說，“它是英特爾系列產(chǎn)品的節(jié)能基礎(chǔ)，同時讓英特爾20年來首款獨顯成為現(xiàn)實。Xe-LP面向的集顯市場相當(dāng)龐大，每年都有成千上萬的新用戶。Xe-LP將會支持全球大多數(shù)人的視覺體驗。”

值得注意的是，在所有英特爾Xe微架構(gòu)中，Xe-LP節(jié)能效果最佳、面積最優(yōu)。英特爾表示，Xe-LP架構(gòu)未來定將應(yīng)用于PC和各類可拆卸式平板電腦。

四、英特爾Xe DG1：英特爾二十年來首款獨顯

二十年來磨一劍。

英特爾二十年里推出的首款商用獨顯名為Iris Xe Max（以前被稱為代號DG1）。該GPU基于Xe-LP微架構(gòu)，其配置和Tiger Lake集成GPU頂配版相同。

這款顯卡包含96個EU，每周期Texel紋理、Pixel像素渲染能力也提升到48、24，支持多達(dá)4 GB LPDDR4X的128位內(nèi)存控制器以及PCIe 4.0 x4接口，可連接到筆記本電腦的CPU，沒有太多的備用PCIe通道。

英特爾Xe DG1采用10nm SuperFin工藝生產(chǎn)，和Tiger Lake CPU所使用的節(jié)點相同。

由于英特爾Xe DG1專為筆記本電腦設(shè)計，其時鐘頻率為1650 MHz，可提供高達(dá)2.46 FP32 TFLOPS的性能。這款獨顯雖然具有英特爾頂配集成GPU的同等配置（盡管頻率提高了22％），但更好的散熱設(shè)計（TDP）封裝結(jié)合128位內(nèi)存，為其帶來了更強勁的性能。

英特爾稱，英特爾Xe DG1不受Tiger Lake的TDP約束，總內(nèi)存帶寬為68 GB/s，可為全高清游戲以及附加的AI工作負(fù)載提供出色性能。顯然，英特爾的野心不止于入門級游戲，還希望利用DG1解決消費級應(yīng)用（通常計算需求高，如Topaz Labs的Gigapixel AI）的需求。

從游戲性能的角度來看，英特爾Xe DG1 GPU的主要競爭對手是AMD的Radeon RX 560（2016年GPU），英偉達(dá)的GeForce GTX 1050 Ti（2017年GPU）或低端MX350同類產(chǎn)品，但尚未能夠與英偉達(dá)基于Turing架構(gòu)的GeForce MX450匹敵。

在1080p分辨率下，2.46 FP32 TFLOPS的算力的確能夠能滿足很多游戲的需求，但還不足以滿足高分辨率大型游戲的需要。也正因于此，游戲玩家才對價格高昂的高性能獨顯趨之若鶩。

此外，2.46 FP32 TFLOPS也難以達(dá)到實時業(yè)務(wù)可視化（real-time business visualizations）對畫面的要求。顯然，DG1并非為此打造，但這也意味著，這類軟件的開發(fā)人員目前不會選擇英特爾的GPU。

Limestone Simulations首席執(zhí)行官Yaroslav Lyssenko提到：“對于開發(fā)人員而言，游戲和業(yè)務(wù)可視化代表了兩套完全不同的需求，游戲開發(fā)會主動適應(yīng)硬件情況，但VR模擬卻主動對硬件提出要求，以滿足商業(yè)應(yīng)用對畫面的超高要求。”

盡管英特爾Xe DG1難以滿足更高的工作負(fù)載需求，但它還可以用來加速由英特爾Deep Link、Addictive AI技術(shù)支撐的內(nèi)容創(chuàng)作應(yīng)用。

簡而言之，Deep Link是一種軟件和固件堆棧，可用于平衡英特爾Tiger Lake集成顯卡和英特爾Xe DG1獨顯之間的工作負(fù)載和熱設(shè)計功耗（TDP）。Addictive AI則能同時調(diào)用iGPU和dGPU的計算資源，以服務(wù)于某一應(yīng)用程序。

如今，HandBrake、Topaz Gigapixel AI、XSplit等應(yīng)用程序都支持Deep Link和Addictive AI技術(shù)。英特爾表示，未來將最終采用Blender以及訊連科技、Magix等公司研發(fā)的各類加速應(yīng)用。

五、英特爾Xe DG1：銷量未卜，謹(jǐn)慎觀望

盡管電腦制造商可能會采用低端iGPU和英特爾Xe DG1，從而為玩家提供不同價位的英特爾產(chǎn)品，但英特爾獨顯能否沖擊配有高端iGPU的CPU銷量？這仍是一個未知數(shù)。

而且，英特爾Xe DG1并未實現(xiàn)性能的實質(zhì)性躍升，英特爾的營銷重點仍放在CPU上（很大程度上是因為它將DG1定位為協(xié)處理器）。盡管如此，Jon Peddie Research的負(fù)責(zé)人喬恩·佩迪（Jon Peddie）相信英特爾Xe DG1終將在市場上找到自己的位置。

“DG1終將找到市場，OEM廠家也會投入相關(guān)生產(chǎn)，” Peddie說，“OEM廠商沒法拒絕英特爾這樣一個強大的品牌。像NVIDIA GeForce MX350這樣的老一代產(chǎn)品（NVIDIA近期發(fā)行了基于Turing架構(gòu)的MX450）可以期待英特爾新品帶來的推力。30%的性能提升背后的功耗和價格成本是多少，我們還尚在觀望之中。畢竟從照片來判斷，DG1尺寸并不小。”

結(jié)語：戰(zhàn)略意義比商業(yè)價值更值得重視

在高性能顯卡領(lǐng)域沉寂20年之后，英特爾終于又推出了“DG1”。盡管DG1的絕對性能談不上驚艷，但卻吹響了英特爾重回獨顯戰(zhàn)場的號角。

DG1所代表的Xe架構(gòu)解決了困擾英特爾多年的技術(shù)問題，為英特爾成為業(yè)界唯一一家能夠提供CPU、GPU、FPGA、AI芯片的全能型公司打下基礎(chǔ)。

結(jié)合英特爾的生態(tài)和產(chǎn)品體量，我們不難想見，英特爾獨顯入市后對顯卡市場產(chǎn)生的巨大攪動，以及對同類產(chǎn)品形成的強勁角力。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

20 年后重返獨顯戰(zhàn)場，深度分析英特爾 Xe GPU 戰(zhàn)略

一、英特爾Xe架構(gòu)：高度平行、用途多樣

二、Xe-LP：96個EU，內(nèi)存帶寬提高2倍！

三、英特爾集顯市占率達(dá)70%，Xe-LP市場潛力巨大

四、英特爾Xe DG1：英特爾二十年來首款獨顯

五、英特爾Xe DG1：銷量未卜，謹(jǐn)慎觀望