設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

算力大提升:英特爾正式推出 Gaudi 3 AI 加速器及全新至強 6 處理器

2024/4/9 19:45:04 來源:IT之家 作者:阿迷 責(zé)編:阿迷

當(dāng)?shù)貢r間 4 月 9 日,英特爾在 Vision 2024 客戶和合作伙伴大會上正式推出 Gaudi 3 AI 加速卡及全新 至強 6 處理器,并通過 AI 領(lǐng)域的客戶、合作伙伴共同推動開放和更安全的企業(yè) AI。另外,英特爾還公布了針對邊緣平臺新品發(fā)布計劃和 AI 優(yōu)化企業(yè) AI 工作負(fù)載鏈接相關(guān)計劃。

會上,英特爾簡述了其開放可擴(kuò)展 AI 系統(tǒng)的戰(zhàn)略,包括硬件、軟件、框架和工具。其中 Gaudi 3 是本次活動的重磅產(chǎn)品。

英特爾全新 Gaudi 3 AI 加速器采用 5 納米工藝打造,Gaudi 3 的 FP8 AI 計算性能是上一代產(chǎn)品的 2 倍,BF16 AI 計算性能是上一代產(chǎn)品的 4 倍,網(wǎng)絡(luò)帶寬是上一代的 2 倍,內(nèi)存帶寬是上一代的 1.5 倍,并提供 Mezz 卡、板載和 PCIe 三種形態(tài)。

Gaudi 3 提供 64 個第五代張量處理核心和 8 個矩陣計算引擎,并搭載 128GB 速率達(dá) 3.7TB / s 的 HBM 內(nèi)存和 96MB 速率達(dá) 12.8TB / s 的 SRAM。連接方面支持 24 條的 200GbE 符合 RoCE 標(biāo)準(zhǔn)的以太網(wǎng)總線以及最高 16 條 PCIe 5.0 總線。

板載版本 Gaudi 3 型號為 HLB-325,由八顆 Gaudi 3 Mezz 卡組成,提供 14.6PFLOPS FP8 性能,1TB 帶寬速率達(dá) 29.6TB / s 的 HBM2e 內(nèi)存,64 個線性計算引擎,192 條 200GbE 網(wǎng)絡(luò)總線,9.6TB / s 吞吐能力。

PCIe 版本型號為 HL-338,提供單卡 1835TFLOPS FP8 峰值性能,128GB HBM2e 內(nèi)存,8 個線性計算引擎,24 條 200GbE 網(wǎng)絡(luò)總線,600W TDP,整張卡占據(jù)兩卡槽高度。

Gaudi 3 單個節(jié)點(8 個 Gaudi 3 AI 加速器)可以提供 14.7PF FP8 計算性能,128GB 內(nèi)存及 8.4TB / s 網(wǎng)絡(luò)讀寫速度;64 節(jié)點集群(512 個 Gaudi 3 AI 加速器)提供 940 PF FP8 計算性能,65.5TB 內(nèi)存及 76.8TB / s 的網(wǎng)絡(luò)讀寫能力;512 節(jié)點集群(4096 個 Gaudi 3 AI 加速器)提供 7.52EF FP8 計算性能,525.3TB 內(nèi)存及 614TB / s 網(wǎng)絡(luò)讀寫速度;1024 節(jié)點集群(8192 個 Gaudi 3 加速器)則提供 15EF FP8 計算性能,1PB 內(nèi)存及 1.229PB/s網(wǎng)絡(luò)讀寫能力。

具體來看,英特爾 Gaudi 3 與主要的競品英偉達(dá) H100 在相同節(jié)點數(shù)量下,相關(guān)大模型訓(xùn)練時間對比上至高有 1.7 倍優(yōu)勢,其中,LLAMA2 70 億參數(shù)對比有 1.5 倍于 H100 的優(yōu)勢,LLAMA2 130 億參數(shù)最高有 1.7 倍的優(yōu)勢,GPT 3 1750 億參數(shù)有 1.4 倍優(yōu)勢。推理速度和能效表現(xiàn)上,Gaudi 3 相比于 H100 也有較大幅度提升。

軟件生態(tài)方面,英特爾 Gaudi 3 針對生成式 AI 提供端到端全棧 AI 軟件解決方案,包括嵌入式軟件、軟件套件、AI 軟件、AI 應(yīng)用。

通過 Gaudi 3 可以支持基于還支持多模態(tài)、大語言模型、增強檢索生成核心能力的 3D 生成、文本生成、視頻圖片生成、內(nèi)容總結(jié)、翻譯、問答、分級等常見 AI 功能。依靠豐富的 AI 軟件生態(tài),Gaudi 3 也支持常見的 AI 框架庫、使用場景和工具,并對有代表性的模型進(jìn)行支持。英特爾還提供 Gaudi 軟件套件,提供對底層硬件的支持。

英特爾在 Vision 2024 上也公布了 Gaudi 3 生產(chǎn)節(jié)點,2024 年一季度將率先推出風(fēng)冷版樣品,二季度推出液冷版樣品,并在今年第三、第四季度分別批量交付風(fēng)冷版和液冷版。Gaudi 3 將由戴爾、惠與、聯(lián)想和超微四家 OEM 提供。

在此基礎(chǔ)上,英特爾也宣布 Gaudi 3 今年下半年可在英特爾 Developer Cloud 獲得。除了英特爾 Gaudi 3 加速器之外,英特爾還提供了關(guān)于其在企業(yè) AI 各個領(lǐng)域的下一代產(chǎn)品和服務(wù)的更新。

全新英特爾 至強 6 處理器作為英特爾全新品牌首次亮相,它主要針對生成式 AI 計算,至強 6 處理器包含高效核心 E-core 和性能核心 P-core。至強 6  E-core 代號 Sierra Forest,相比第二代英特爾 至強 處理器,性能每瓦提高 2.4 倍,并且機(jī)架密度提高 2.7 倍。對于英特爾的客戶而言,可以以接近 3 比 1 的比例替換老舊系統(tǒng),大幅降低能耗,推動實現(xiàn)可持續(xù)發(fā)展目標(biāo)。至強 6  P-core,代號 Granite Rapids,支持 MXFP4。

PC、邊緣端和連接方面,英特爾酷睿 Ultra 處理器 AI PC 產(chǎn)品作為生產(chǎn)力、安全性和內(nèi)容創(chuàng)作的工具,預(yù)計今年將發(fā)貨 4000 萬臺 AI PC。除此之外,英特爾宣布了一系列新的邊緣芯片,涵蓋了英特爾酷睿 Ultra、英特爾酷睿、英特爾凌動處理器和英特爾 Arc GPU,目標(biāo)市場包括零售、工業(yè)制造和醫(yī)療保健。這些新品將在本季度推出。

通過超以太網(wǎng)聯(lián)盟(UEC),英特爾正在驅(qū)動面向 AI 高速互聯(lián)技術(shù)(AI Fabrics)的開放式以太網(wǎng)網(wǎng)絡(luò)創(chuàng)新,并推出一系列針對 AI 優(yōu)化的以太網(wǎng)解決方案。這些創(chuàng)新旨在革新可大規(guī)??v向(scale-up)和橫向(scale-out)擴(kuò)展的 AI 高速互聯(lián)技術(shù),以支持 AI 模型的訓(xùn)練和推理,這些模型的規(guī)模日益龐大,每一代都會增長一個數(shù)量級。英特爾的產(chǎn)品組合包括英特爾 AI 網(wǎng)絡(luò)連接卡(AI NIC)、集成到 XPU 的 AI 連接芯粒、基于 Gaudi 加速器的系統(tǒng),以及一系列面向英特爾代工的 AI 互聯(lián)軟硬件參考設(shè)計。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:英特爾AI,英特爾酷睿至強Gaudi

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知