12月15日消息,近日,EETimes對英特爾的顯卡戰(zhàn)略和發(fā)展前景進(jìn)行了梳理分析。
在他們看來,英特爾新發(fā)的Xe架構(gòu)是為開發(fā)更多全場景適配顯卡做鋪墊。同時,英特爾近日發(fā)行的獨立顯卡“DG1”彌補了英特爾的技術(shù)短板,并將在市場上獲得一定反響。
英特爾在發(fā)布兩款Xe GPU后,成功躋身獨立顯卡制造商行列。然而,“參與”和“引領(lǐng)”之間有很大的區(qū)別。從休閑玩家的筆記本電腦到高端游戲臺式機(jī),從入門級安卓游戲硬件到超級計算機(jī),英特爾的顯卡戰(zhàn)略幾乎無所不包。很顯然,英特爾想成為顯卡領(lǐng)域的領(lǐng)導(dǎo)者,但是英特爾真的可以嗎?
過去,計算機(jī)顯卡主要有兩種用途:游戲和專業(yè)可視化(ProViz)。游戲硬件包括街機(jī)、游戲機(jī)和個人電腦。ProViz硬件主要用于計算機(jī)輔助設(shè)計(CAD)、數(shù)字內(nèi)容創(chuàng)建(DCC)、醫(yī)學(xué)成像和各種視覺模擬需求。在2005年后,GPU逐漸應(yīng)用于各類高性能計算(HPC)應(yīng)用。
如今,計算機(jī)顯卡的應(yīng)用場景不再局限于游戲、ProViz或HPC,但隨著新應(yīng)用場景的出現(xiàn),適配問題愈發(fā)凸顯。比如,高并行的GPU能為人工智能、深度學(xué)習(xí)(DL)/機(jī)器學(xué)習(xí)( ML)應(yīng)用程序提供支持,但往往需要在傳統(tǒng)的游戲和ProViz數(shù)據(jù)格式之外,獲取額外的數(shù)據(jù)格式支持。云端游戲顯卡和服務(wù)器端圖形渲染應(yīng)用專為游戲打造,但是這類顯卡并非數(shù)據(jù)中心的最佳選擇。
若想成為顯卡領(lǐng)跑者,英特爾必須開發(fā)全系列的顯卡,涵蓋傳統(tǒng)用途、HPC和新興應(yīng)用場景。而這項任務(wù)的艱巨性無需多言。
近幾個月,英特爾終于推出了近20年來第一款獨立顯卡,同時透露了更多的顯卡戰(zhàn)略細(xì)節(jié)。我們現(xiàn)在就來領(lǐng)略一下英特爾的雄圖大略,同時聽取專家的分析意見。
一、英特爾Xe架構(gòu):高度平行、用途多樣
三年前,英特爾再次投身獨立顯卡研發(fā),邀請業(yè)界大牛Raja Koduri加入英特爾,成立核心和視覺計算小組(Core and Visual Computing Group)來專攻獨立顯卡。
當(dāng)時,英特爾明確表示,將以客戶端、數(shù)據(jù)中心和高性能計算細(xì)分領(lǐng)域為服務(wù)對象,更好地處理人工智能、圖形處理(游戲、模擬、ProViz、AR/VR等)、機(jī)器學(xué)習(xí)等高性能需求任務(wù)。
為此,英特爾曾嘗試推出代號為“Larrabee”的多核處理器。按照設(shè)想,這款顯卡能夠在滿足圖像處理需求的同時,承擔(dān)高性能計算負(fù)載。然而,由于英特爾執(zhí)意想采用x86架構(gòu),這次嘗試最終失敗了。
Koduri掌舵后,英特爾開始研發(fā)高度平行架構(gòu)“Xe”,Xe架構(gòu)能夠適應(yīng)不同的工作負(fù)載需要,算力在TFLOPS(每秒萬億次的浮點運算)到ExaFLOPS(每秒百億億次的浮點運算)區(qū)間不等,具有較強的場景適應(yīng)性。
截至目前,英特爾已推出Xe-LP低功耗系列,用于集成核顯、入門級獨顯。在未來幾年,英特爾還計劃發(fā)布三套Xe GPU架構(gòu),以滿足不同工作負(fù)載需要。
此外,為了確保Xe GPU(以及AI加速器、GPU、FPGA等)簡單可用,英特爾面向軟件開發(fā)團(tuán)隊推出了oneAPI工具包(統(tǒng)一編程模型)以及零級接口規(guī)范(僅針對AI、GPU、FPGA產(chǎn)品)。
二、Xe-LP:96個EU,內(nèi)存帶寬提高2倍!
近20年來,英特爾盡管缺席獨顯市場,卻一直活躍在集成顯卡領(lǐng)域,針對低價、低能耗的電腦推出了Gen架構(gòu)。
Gen架構(gòu)能夠很好地適用于輕量級任務(wù),但并不適用于數(shù)據(jù)中心等高性能要求任務(wù)。為此,英特爾推出了全新的Xe架構(gòu)。
針對入門級產(chǎn)品,英特爾推出了Xe-LP,主要用于集成核顯、入門級獨顯。
和去年推出的Gen 11架構(gòu)一樣,英特爾Xe-LP架構(gòu)也能全面支持DirectX 12_1 API。此外,新架構(gòu)帶來了明顯的性能優(yōu)勢,借助英特爾10nm Superfin制程工藝實現(xiàn)了更高的頻率潛力(最高可達(dá)1.7GHz,上一代僅為1.1GHz)。
英特爾Xe-LP iGPU率先應(yīng)用于第11代酷睿處理器“Tiger Lake”。Xe-LP iGPU的頂配版本具有96個執(zhí)行單元(EU),運行速度可達(dá)1536 FP16 FLOPS/clock,每周期Texel紋理、Pixel像素渲染能力也從32、16提升到48、24。
內(nèi)存子系統(tǒng)經(jīng)改進(jìn),具有新的L1 Data Cache(數(shù)據(jù)高速緩存)、16 MB L3 Cache,同時支持端到端壓縮及新的Ringbus互連技術(shù),與上一代產(chǎn)品相比,可將帶寬提高2倍。
和上一代架構(gòu)相比,Xe-LP架構(gòu)一大更新便是執(zhí)行單元(EU)。全新EU集成了8-wide FP/INT ALU8和2-wide extended math ALU。8-wide FP/INT ALU8運算速度可達(dá)1 FP32/INT32 ops/clock、2 FP16/INT16 ops/clock和4 INT8 ops/clock,以更好地處理AI工作負(fù)載產(chǎn)生的各類數(shù)據(jù)。同時,兩個EU共享線程控制(Thread Control),從而節(jié)省空間。
如若所有FP/INT ALU均以1.35GHZ的頻率工作,Tiger Lake的高端Xe-LP iGPU可提供約2.1 TFLOPS的FP32圖形處理性能,近乎是英特爾上一代Iris Plus G7顯卡(1.12 TFLOPS)的兩倍。此外,英特爾還提供了入門版本的Xe-LP iGPU,入門版本的EU等單元數(shù)量較少,性能也相對弱一些。
Xe-LP GPU還配備了英特爾最新的顯示引擎(Display Engine)和媒體引擎(Media Engine)。新款媒體引擎具有12-bit end-to-end video pipeline,可播放BT.2020等格式的視頻,同時能為最新編解碼器(例如AV1)提供硬件加速解碼功能。
由于集成顯卡主要用于辦公和媒體瀏覽,媒體引擎對集顯的重要性不言而喻,同時對各類流媒體應(yīng)用也有不可或缺的作用。
顯示引擎支持四個video pipeline以及eDP、DisplayPort 1.2、HDMI 2.0、Thunderbolt 4/USB4 Type-C輸出,足以滿足當(dāng)今的集成顯卡和入門級獨顯的需求。
三、英特爾集顯市占率達(dá)70%,Xe-LP市場潛力巨大
英特爾將Xe-LP集成顯卡和獨立顯卡的用戶群體定位為游戲玩家和創(chuàng)作者。
游戲方面,英特爾在提升硬件性能的同時,還努力優(yōu)化驅(qū)動程序等軟件表現(xiàn)。
例如,Xe-LP驅(qū)動程序支持硬件/軟件調(diào)度代碼簽名(hardware/software scheduling codesign),為基于DirectX 11的游戲增加了靈活性。此外,這一系列還支持VRS可變幀率渲染,根據(jù)渲染場景的不同來選擇降低或者提升渲染內(nèi)容,以免在次要場景上浪費過多算力。
同時,英特爾還增加了游戲銳化(GS)技術(shù),該技術(shù)可在分辨率不變的情況下提高游戲圖像的清晰度,從而節(jié)省帶寬,不過有可能增加GPU的其他部分的負(fù)荷,用戶可以選擇自行啟用/禁用GS技術(shù)。
Jon Peddie Research的研究指出,全球近70%的PC搭載了英特爾的集成顯卡。因此,英特爾一旦過渡到其新的Xe-LP架構(gòu),“吃”內(nèi)置顯卡的游戲必須相應(yīng)作出調(diào)整。此外,英特爾還可以定制驅(qū)動程序,保持產(chǎn)品競爭力。
“ Xe-LP是英特爾顯卡戰(zhàn)略的第一步,”英特爾發(fā)言人布魯斯·費恩伯格(Bruce Fienberg)說,“它是英特爾系列產(chǎn)品的節(jié)能基礎(chǔ),同時讓英特爾20年來首款獨顯成為現(xiàn)實。Xe-LP面向的集顯市場相當(dāng)龐大,每年都有成千上萬的新用戶。Xe-LP將會支持全球大多數(shù)人的視覺體驗。”
值得注意的是,在所有英特爾Xe微架構(gòu)中,Xe-LP節(jié)能效果最佳、面積最優(yōu)。英特爾表示,Xe-LP架構(gòu)未來定將應(yīng)用于PC和各類可拆卸式平板電腦。
四、英特爾Xe DG1:英特爾二十年來首款獨顯
二十年來磨一劍。
英特爾二十年里推出的首款商用獨顯名為Iris Xe Max(以前被稱為代號DG1)。該GPU基于Xe-LP微架構(gòu),其配置和Tiger Lake集成GPU頂配版相同。
這款顯卡包含96個EU,每周期Texel紋理、Pixel像素渲染能力也提升到48、24,支持多達(dá)4 GB LPDDR4X的128位內(nèi)存控制器以及PCIe 4.0 x4接口,可連接到筆記本電腦的CPU,沒有太多的備用PCIe通道。
英特爾Xe DG1采用10nm SuperFin工藝生產(chǎn),和Tiger Lake CPU所使用的節(jié)點相同。
由于英特爾Xe DG1專為筆記本電腦設(shè)計,其時鐘頻率為1650 MHz,可提供高達(dá)2.46 FP32 TFLOPS的性能。這款獨顯雖然具有英特爾頂配集成GPU的同等配置(盡管頻率提高了22%),但更好的散熱設(shè)計(TDP)封裝結(jié)合128位內(nèi)存,為其帶來了更強勁的性能。
英特爾稱,英特爾Xe DG1不受Tiger Lake的TDP約束,總內(nèi)存帶寬為68 GB/s,可為全高清游戲以及附加的AI工作負(fù)載提供出色性能。顯然,英特爾的野心不止于入門級游戲,還希望利用DG1解決消費級應(yīng)用(通常計算需求高,如Topaz Labs的Gigapixel AI)的需求。
從游戲性能的角度來看,英特爾Xe DG1 GPU的主要競爭對手是AMD的Radeon RX 560(2016年GPU),英偉達(dá)的GeForce GTX 1050 Ti(2017年GPU)或低端MX350同類產(chǎn)品,但尚未能夠與英偉達(dá)基于Turing架構(gòu)的GeForce MX450匹敵。
在1080p分辨率下,2.46 FP32 TFLOPS的算力的確能夠能滿足很多游戲的需求,但還不足以滿足高分辨率大型游戲的需要。也正因于此,游戲玩家才對價格高昂的高性能獨顯趨之若鶩。
此外,2.46 FP32 TFLOPS也難以達(dá)到實時業(yè)務(wù)可視化(real-time business visualizations)對畫面的要求。顯然,DG1并非為此打造,但這也意味著,這類軟件的開發(fā)人員目前不會選擇英特爾的GPU。
Limestone Simulations首席執(zhí)行官Yaroslav Lyssenko提到:“對于開發(fā)人員而言,游戲和業(yè)務(wù)可視化代表了兩套完全不同的需求,游戲開發(fā)會主動適應(yīng)硬件情況,但VR模擬卻主動對硬件提出要求,以滿足商業(yè)應(yīng)用對畫面的超高要求。”
盡管英特爾Xe DG1難以滿足更高的工作負(fù)載需求,但它還可以用來加速由英特爾Deep Link、Addictive AI技術(shù)支撐的內(nèi)容創(chuàng)作應(yīng)用。
簡而言之,Deep Link是一種軟件和固件堆棧,可用于平衡英特爾Tiger Lake集成顯卡和英特爾Xe DG1獨顯之間的工作負(fù)載和熱設(shè)計功耗(TDP)。Addictive AI則能同時調(diào)用iGPU和dGPU的計算資源,以服務(wù)于某一應(yīng)用程序。
如今,HandBrake、Topaz Gigapixel AI、XSplit等應(yīng)用程序都支持Deep Link和Addictive AI技術(shù)。英特爾表示,未來將最終采用Blender以及訊連科技、Magix等公司研發(fā)的各類加速應(yīng)用。
五、英特爾Xe DG1:銷量未卜,謹(jǐn)慎觀望
盡管電腦制造商可能會采用低端iGPU和英特爾Xe DG1,從而為玩家提供不同價位的英特爾產(chǎn)品,但英特爾獨顯能否沖擊配有高端iGPU的CPU銷量?這仍是一個未知數(shù)。
而且,英特爾Xe DG1并未實現(xiàn)性能的實質(zhì)性躍升,英特爾的營銷重點仍放在CPU上(很大程度上是因為它將DG1定位為協(xié)處理器)。盡管如此,Jon Peddie Research的負(fù)責(zé)人喬恩·佩迪(Jon Peddie)相信英特爾Xe DG1終將在市場上找到自己的位置。
“DG1終將找到市場,OEM廠家也會投入相關(guān)生產(chǎn),” Peddie說,“OEM廠商沒法拒絕英特爾這樣一個強大的品牌。像NVIDIA GeForce MX350這樣的老一代產(chǎn)品(NVIDIA近期發(fā)行了基于Turing架構(gòu)的MX450)可以期待英特爾新品帶來的推力。30%的性能提升背后的功耗和價格成本是多少,我們還尚在觀望之中。畢竟從照片來判斷,DG1尺寸并不小。”
結(jié)語:戰(zhàn)略意義比商業(yè)價值更值得重視
在高性能顯卡領(lǐng)域沉寂20年之后,英特爾終于又推出了“DG1”。盡管DG1的絕對性能談不上驚艷,但卻吹響了英特爾重回獨顯戰(zhàn)場的號角。
DG1所代表的Xe架構(gòu)解決了困擾英特爾多年的技術(shù)問題,為英特爾成為業(yè)界唯一一家能夠提供CPU、GPU、FPGA、AI芯片的全能型公司打下基礎(chǔ)。
結(jié)合英特爾的生態(tài)和產(chǎn)品體量,我們不難想見,英特爾獨顯入市后對顯卡市場產(chǎn)生的巨大攪動,以及對同類產(chǎn)品形成的強勁角力。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。