從游戲、短視頻到人工智能、工業(yè)仿真再到元宇宙,這些當(dāng)下風(fēng)口都離不開(kāi)同一種芯片 ——GPU。
根據(jù) IDC 數(shù)據(jù),2019 年時(shí)我國(guó) AI 市場(chǎng)每臺(tái)服務(wù)器配置 1-20 個(gè) GPU,加權(quán)計(jì)算平均每臺(tái) AI 服務(wù)器配置 8.02 個(gè) GPU 加速卡。另外 GPU 在所有加速卡類型里市場(chǎng)份額占 91.9%。
這樣的行業(yè)趨勢(shì)下,除了 GPU 創(chuàng)業(yè)公司受資本熱捧以外,CPU 傳統(tǒng)巨頭英特爾也加速了在 GPU 上的布局。今年以來(lái),英特爾在 GPU 上的動(dòng)作密度之高和力度之大不斷刺激著業(yè)界的神經(jīng)。2 月先是調(diào)整組織架構(gòu),正式成立加速計(jì)算系統(tǒng)與圖形事業(yè)部(AXG)。同時(shí)公布獨(dú)立顯卡 Arc 系列出貨時(shí)間表,并放話今年要賣上 400 萬(wàn)張。
到 4 月,AXG 部門負(fù)責(zé)人 Raja Koduri 升任執(zhí)行副總裁,隨后成立新的圖形實(shí)驗(yàn)室。5 月初收購(gòu)芬蘭老牌 GPU 技術(shù)供應(yīng)商 Siru Innovations,吸收大批圖形 IP 開(kāi)發(fā)人才。
緊接著,在 5 月中旬的 2022 英特爾 On 產(chǎn)業(yè)創(chuàng)新峰會(huì)上,一款面向數(shù)據(jù)中心的多用途 GPU 全新發(fā)布。
這款代號(hào) Arctic Sound-M(簡(jiǎn)稱 ATS-M)的數(shù)據(jù)中心 GPU 已獲得超過(guò) 15 款來(lái)自戴爾、Supermicro、思科、HPE、浪潮和新華三等合作伙伴的系統(tǒng)設(shè)計(jì),讓本就火爆的 GPU 市場(chǎng)競(jìng)爭(zhēng)再次升級(jí)。
英特爾 CEO 帕特基辛格對(duì) GPU 業(yè)務(wù)寄予厚望,稱圖形和加速計(jì)算將成為英特爾未來(lái)的主要增長(zhǎng)點(diǎn),預(yù)計(jì) 2022 年帶來(lái)超過(guò) 10 億美元的營(yíng)收。
如何做到?
英特爾 GPU,靠什么贏市場(chǎng)?
要回答這個(gè)問(wèn)題,要從 GPU 本身的特點(diǎn)與時(shí)下行業(yè)趨勢(shì)入手。
GPU 與 CPU 相比更擅長(zhǎng)并行計(jì)算,適合解決大規(guī)模加速、算力密集型問(wèn)題,在萬(wàn)物數(shù)字化的浪潮中,大規(guī)模加速正是 GPU 行業(yè)火爆的關(guān)鍵。
橫向看功能,圖形計(jì)算(游戲、3D 渲染)、數(shù)據(jù)處理(人工智能、工業(yè)仿真)、視頻編碼(直播、短視頻)給 GPU 提出不同工作負(fù)載需求。
縱向看場(chǎng)景,云端、桌面 PC、移動(dòng)端手機(jī)、智能汽車、機(jī)器人和更多物聯(lián)網(wǎng)設(shè)備對(duì)異構(gòu) GPU 的需求都在激增。兩個(gè)維度一交叉就產(chǎn)生大量細(xì)分需求,被不同產(chǎn)品分別占據(jù),生態(tài)分散。
英特爾這次殺入 GPU 市場(chǎng)的思路很清晰,就是提供多用途融合的統(tǒng)一解決方案,通過(guò)降低異構(gòu)開(kāi)發(fā)成本、提升協(xié)作效率來(lái)重構(gòu)生態(tài)。
芯片設(shè)計(jì)最核心的要看架構(gòu),英特爾于 2020 年架構(gòu)日活動(dòng)上首次公開(kāi)了英特爾銳炬 ? Xe 圖形架構(gòu)。
在 Xe 架構(gòu)立項(xiàng)研發(fā)之初,英特爾就強(qiáng)調(diào)要在一種架構(gòu)下實(shí)現(xiàn) 4 種微架構(gòu),同時(shí)面向集成顯卡 / 入門級(jí)顯卡、中端和發(fā)燒級(jí)顯卡,數(shù)據(jù)中心 GPU 和超算 GPU 四個(gè)細(xì)分市場(chǎng)。
以最新發(fā)布的 ATS-M 數(shù)據(jù)中心 GPU 為例,可以更具體地看出這些設(shè)計(jì)思路和技術(shù)特色如何為行業(yè)提供統(tǒng)一的解決方案。
ATS-M 的定位是一款專注于智能視覺(jué)云場(chǎng)景的多用途數(shù)據(jù)中心 GPU,面向云游戲、媒體處理和傳輸、虛擬桌面基礎(chǔ)設(shè)施和 AI 視覺(jué)推理四個(gè)場(chǎng)景。
英特爾預(yù)計(jì)智能視覺(jué)云市場(chǎng)規(guī)模到 2026 年將達(dá)到 150 億美元。
ATS-M 提供 150W 功率和 75W 功率兩種版本,分別應(yīng)對(duì)峰值性能和高密度需求。
比如在云游戲上,150W 功率版可以更好運(yùn)行 3A 大作,而 75W 版本通過(guò)一個(gè)平臺(tái)滿足跨智能手機(jī)和 PC 游戲的融合云游戲解決方案。
對(duì)于多媒體處理與傳輸,一個(gè)殺手锏是為該 GPU 配備了英特爾首款基于硬件加速的 AV1 編碼器,速度上比軟件編碼要快上 50 倍。
而 AV1 編碼與常見(jiàn)的 H.264 編碼相比,同畫(huà)質(zhì)下壓縮率又要高出 30%。對(duì)于 4K 加速普及、8K 也在路上的今天來(lái)說(shuō),編碼速度和高壓縮率節(jié)省的流量都極為關(guān)鍵。
對(duì)于擁有 10 萬(wàn)用戶的媒體服務(wù)器,僅提高壓縮率這一項(xiàng)每年就能減少 2300 萬(wàn)美元的運(yùn)營(yíng)成本。
虛擬桌面市場(chǎng)也隨著遠(yuǎn)程辦公需求的增加迎來(lái)了快速增長(zhǎng)。
英特爾的這款數(shù)據(jù)中心 GPU 提供了靈活的虛擬 GPU(vGPU)調(diào)度策略,讓管理員能夠單獨(dú)微調(diào) GPU 上每個(gè)虛擬機(jī)的運(yùn)行指令。
并且,英特爾不會(huì)針對(duì)基于硬件的可擴(kuò)展 I / O 虛擬化(SIOV)額外收取任何軟件授權(quán)費(fèi),大大減少了相關(guān)提供商總體部署成本。
最后,AI 視覺(jué)推理任務(wù)往往需要先對(duì)大量攝像頭拍攝的視頻做解碼和預(yù)處理,再把數(shù)據(jù)傳給 AI 模型進(jìn)行下一步動(dòng)作。無(wú)論是工廠流水線上的零部件缺陷檢測(cè)還是公共場(chǎng)合的人流管理都需要快速分析、快速?zèng)Q策。
戴爾在 PowerEdge 服務(wù)器上使用了集成兩顆 GPU 的 75W 功率版本 ATS-M。以經(jīng)典的 ResNet-50 模型的圖像分類和目標(biāo)檢測(cè)任務(wù)為例,能夠在計(jì)算和解碼能力上實(shí)現(xiàn)很好的平衡。
一款 GPU 能否走入廣泛的市場(chǎng),除了硬件性能強(qiáng)大以外還離不開(kāi)配套軟件生態(tài)的支持。
英特爾的開(kāi)源、基于標(biāo)準(zhǔn)的統(tǒng)一編程模型 oneAPI,通過(guò)一套完整、可靠的工具包來(lái)完善現(xiàn)有編程語(yǔ)言和并行計(jì)算模型,讓開(kāi)發(fā)者設(shè)計(jì)出開(kāi)放、可移植的代碼,更大限度地利用多種 CPU 和 GPU 的組合,降低開(kāi)發(fā)難度同時(shí)釋放硬件的全部性能。
CPU 與 GPU 通過(guò) oneAPI 統(tǒng)一編程模型深度整合這一思路,還體現(xiàn)在超級(jí)計(jì)算機(jī)上。
美國(guó)阿貢國(guó)家實(shí)驗(yàn)室的下一代超算極光(Aurora)的安裝情況也在英特爾峰會(huì)上首次展示。
極光超算將采用代號(hào)為 Sapphire Rapids 的英特爾至強(qiáng) CPU,和代號(hào)為 Ponte Vecchio 的英特爾數(shù)據(jù)中心 GPU,雙精度峰值計(jì)算性能超過(guò)每秒兩百億億次,能支持更準(zhǔn)確地進(jìn)行氣候預(yù)測(cè)以及發(fā)現(xiàn)應(yīng)對(duì)癌癥的新療法等研發(fā)創(chuàng)新活動(dòng)。
元宇宙、沉浸式體驗(yàn),以及大規(guī)模的人工智能部署,都離不開(kāi)對(duì)高性能 GPU 的依賴,也對(duì)未來(lái)圖形處理產(chǎn)品提出了要求:高度視覺(jué)保真、優(yōu)化人工智能、實(shí)現(xiàn)連續(xù)計(jì)算。
對(duì)于光線追蹤和人工智能相信大家都很熟悉了,那么什么是持續(xù)計(jì)算?
英特爾現(xiàn)場(chǎng)演示的下一代云游戲方案 Project Endgame 就是一個(gè)很好的例子。
不同于以往的云游戲產(chǎn)品中本地硬件僅接收串流數(shù)據(jù)、充當(dāng)顯示器作用,而是云端和本地硬件協(xié)同工作。
這樣應(yīng)用程序可以充分利用軟件基礎(chǔ)設(shè)施層,使設(shè)備能利用網(wǎng)絡(luò)中其他設(shè)備的計(jì)算資源,從而提供始終可用、低時(shí)延、連續(xù)的計(jì)算服務(wù),降低對(duì)網(wǎng)絡(luò)環(huán)境的需求,讓云游戲進(jìn)一步走向?qū)嵱谩?/p>
通過(guò)持續(xù)計(jì)算,用戶可以在隨身攜帶的小型設(shè)備上隨時(shí)借用云端算力來(lái)運(yùn)行復(fù)雜應(yīng)用。
英特爾認(rèn)為能理想地運(yùn)行元宇宙至少還需要提高 1000 倍算力,在能制造出如此強(qiáng)大的個(gè)人設(shè)備之前,持續(xù)計(jì)算就是進(jìn)入元宇宙的敲門磚。
英特爾第二次轉(zhuǎn)型
從前面的介紹可以看出,英特爾現(xiàn)在已不僅是一家芯片巨頭企業(yè)。
英特爾在 2016 年提出向“以數(shù)據(jù)為中心”轉(zhuǎn)型,之后進(jìn)一步明確了驅(qū)動(dòng)數(shù)字化轉(zhuǎn)型的四大超級(jí)技術(shù)力量方向,分別是:
人工智能
無(wú)所不在的計(jì)算
無(wú)處不在的連接
從云到邊緣的基礎(chǔ)設(shè)施
四大超級(jí)力量不僅會(huì)帶來(lái)對(duì)芯片的空前需求,它們之間的協(xié)作、相互增強(qiáng)更在各行業(yè)催生出多樣的芯片應(yīng)用場(chǎng)景。
英特爾將如何應(yīng)對(duì)新一輪數(shù)字化轉(zhuǎn)型這個(gè)關(guān)鍵時(shí)刻,在這次峰會(huì)上也給出了答案:
PC 是數(shù)字活動(dòng)的基礎(chǔ),至強(qiáng)處理器是計(jì)算和基礎(chǔ)設(shè)施的基礎(chǔ),XPU 戰(zhàn)略和各種加速處理器,以及全棧軟件優(yōu)化方案,讓 4 大超級(jí)力量具備高性能,易于部署,安全可靠,可擴(kuò)展并持續(xù)創(chuàng)新,幫助客戶解決當(dāng)前問(wèn)題,并保證未來(lái)可持續(xù)發(fā)展。
XPU 戰(zhàn)略指英特爾將重心從單獨(dú)的 CPU 轉(zhuǎn)移到跨 CPU、GPU、FPGA 和其他加速器的廣泛產(chǎn)品組合。
其意義不僅在于英特爾自身拓展更多市場(chǎng),還在于產(chǎn)品組合下不同架構(gòu)芯片的協(xié)作能給用戶帶來(lái)更好的體驗(yàn)。
在這次峰會(huì)上,英特爾分享了更具體的做法和思考:打破組件的邊界。
拿游戲來(lái)說(shuō),大型 3D 游戲存在這樣一個(gè)現(xiàn)象:有的游戲更吃顯卡,如更重畫(huà)面效果的動(dòng)作游戲。而有的游戲更吃 CPU,如同屏角色很多的策略游戲。
英特爾通過(guò) DeepLink 技術(shù)就可以打破組件的邊界,根據(jù)實(shí)時(shí)運(yùn)行情況在 CPU 與 GPU 之間動(dòng)態(tài)分配功率,解決性能瓶頸,讓同一臺(tái) PC 可以適應(yīng)多種任務(wù)。
Deep Link 技術(shù)的核心思想就是提升芯片之間、芯片內(nèi)部各 IP 之間的深度協(xié)作。除了動(dòng)態(tài)功率共享外還有超級(jí)編碼和超級(jí)算力兩項(xiàng)特性。超級(jí)編碼讓獨(dú)立顯卡與 CPU 中的核顯配合,編碼速度提升 60%。超級(jí)算力的原理也是如此,統(tǒng)一調(diào)度整個(gè)系統(tǒng)中所有 AI 引擎,性能提升 24%。
個(gè)人 PC 上,僅 CPU 與 GPU 之間的配合就能帶來(lái)如此收益。
那么數(shù)據(jù)中心服務(wù)器上搭載的更多類型芯片,在同一架構(gòu)下協(xié)作將展示更多威力。
這次峰會(huì)上,英特爾除了 GPU 還發(fā)布了 AI 訓(xùn)練芯片 Gaudi2、AI 推理芯片 Greco,以及公布了基于 FPGA 和 ASIC 的 IPU(基礎(chǔ)設(shè)施處理器)產(chǎn)品路線圖都是 XPU 戰(zhàn)略的體現(xiàn)。
作為芯片領(lǐng)域的元老級(jí)公司,英特爾十分看重構(gòu)建開(kāi)放生態(tài),引領(lǐng)行業(yè)標(biāo)準(zhǔn)。
除了前面提到的 oneAPI 開(kāi)源編程和 AV1 視頻編碼標(biāo)準(zhǔn),還領(lǐng)導(dǎo)了芯片制造領(lǐng)域的高速通用芯?;ヂ?lián)標(biāo)準(zhǔn) UCIe。
UCIe 意圖推動(dòng)芯粒(Chiplet)之間的互連標(biāo)準(zhǔn),使未來(lái)異構(gòu)的芯片 IP 封裝能夠封裝在一起,延續(xù)摩爾定律。
為了這一愿景,英特爾還計(jì)劃開(kāi)放 x86 架構(gòu)的 IP 授權(quán),使客戶能夠在英特爾制造的定制設(shè)計(jì)芯片中混合 x86、Arm 和 RISC-V 等不同的 CPU IP 核。
……
這已經(jīng)不是英特爾第一次轉(zhuǎn)型了。英特爾 CEO 帕特基辛格指出整個(gè)產(chǎn)業(yè)又到了“戰(zhàn)略轉(zhuǎn)折點(diǎn)”的時(shí)候,這個(gè)轉(zhuǎn)折點(diǎn)決定了未來(lái)可能更好或者更壞,企業(yè)需要在一個(gè)比較短的時(shí)間內(nèi)做出明智的決策。
實(shí)際上“戰(zhàn)略轉(zhuǎn)折點(diǎn)”這個(gè)概念,就是英特爾第三任 CEO 安迪葛洛夫提出的,當(dāng)時(shí),他帶領(lǐng)英特爾在混亂與危機(jī)中完成了從存儲(chǔ)芯片向處理器的轉(zhuǎn)型,才有了后來(lái)的引領(lǐng)半導(dǎo)體行業(yè)數(shù)十年。
如今事實(shí)證明了隨著技術(shù)的飛速發(fā)展,以及對(duì)人類的影響更加深遠(yuǎn),人類交互的方方面面都朝著以技術(shù)為中心的方向演進(jìn),“計(jì)算已成為我們與世界互動(dòng)的方式”。
英特爾通過(guò)拓展智能芯片的深度與廣度,構(gòu)建更加開(kāi)放的生態(tài)系統(tǒng)和軟件解決方案,IDM2.0 戰(zhàn)略再一次找到了新的領(lǐng)跑點(diǎn)。
不得不說(shuō),這種識(shí)別變化的洞察力、以變應(yīng)變的行動(dòng)力,是最值得學(xué)習(xí)和借鑒的。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。