設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

英特爾發(fā)布 Gaudi 3 AI 芯片:性能超越英偉達 H100,第三季度上市

2024/4/9 23:49:53 來源:IT之家 作者:問舟 責編:問舟
感謝IT之家網友 HH_KK 的線索投遞!

IT之家 4 月 9 日消息,在今晚的 Vision 2024 活動中,英特爾發(fā)布了新一代 Gaudi 3 AI 芯片,并將于 2024 年第三季度通過 OEM 系統(tǒng)大批量上市。

據(jù)介紹,新款 Gaudi 3 與英偉達 H100 相比訓練性能提高了 170%,推理能力提高了 50%,效率提高了 40%,但成本卻低得多(IT之家注:H100 已經是英偉達上一代產品,英特爾并未與最新的 Blackwell 系列產品進行對比)。

此外,英特爾還為其數(shù)據(jù)中心 CPU 產品組合推出了全新品牌命名:原代號為 Granite Rapids 和 Sierra Forest 的芯片現(xiàn)在將被稱為 “Xeon 6” 系列。這些芯片計劃于今年上市,并將支持全新性能提升的標準化 MXFP4 數(shù)據(jù)格式。

英特爾同時宣布正在開發(fā)用于以太網網絡的 AI NIC ASIC 以及 AI NIC 小芯片。這些小芯片將用于其未來 XPU 和 Guadi 3 處理器,并將通過英特爾代工廠提供給外部客戶,不過英特爾并未透露更多關于這些網絡產品的細節(jié)。

英特爾全新 Gaudi 3 AI 加速器采用 5nm 工藝打造,F(xiàn)P8 性能是上一代產品的兩倍,BF16 性能是上一代產品的四倍,網絡帶寬是上一代產品的 2 倍,內存帶寬是上一代產品的 1.5 倍,并提供 Mezz 卡、板載和 PCIe 三種形態(tài)。

Gaudi 3 提供 64 個第五代張量處理核心和 8 個矩陣計算引擎,并搭載 128GB 速率達 3.7TB / s 的 HBM 內存和 96MB 速率達 12.8TB / s 的 SRAM。連接方面支持 24 條的 200GbE 符合 RoCE 標準的以太網總線以及最高 16 條 PCIe 5.0 總線。

板載版本 Gaudi 3 型號為 HLB-325,由八顆 Gaudi 3 Mezz 卡組成,提供 14.6PFLOPS FP8 性能,1TB 帶寬速率達 29.6TB / s 的 HBM2e 內存,64 個線性計算引擎,192 條 200GbE 網絡總線,9.6TB / s 吞吐能力。

PCIe 版本型號為 HL-338,提供單卡 1835TFLOPS FP8 峰值性能,128GB HBM2e 內存,8 個線性計算引擎,24 條 200GbE 網絡總線,600W TDP,整張卡占據(jù)兩卡槽高度。

Gaudi 3 單個節(jié)點(8 個 Gaudi 3 AI 加速器)可以提供 14.7PF FP8 計算性能,128GB 內存及 8.4TB / s 網絡讀寫速度;64 節(jié)點集群(512 個 Gaudi 3 AI 加速器)提供 940 PF FP8 計算性能,65.5TB 內存及 76.8TB / s 的網絡讀寫能力;512 節(jié)點集群(4096 個 Gaudi 3 AI 加速器)提供 7.52EF FP8 計算性能,525.3TB 內存及 614TB / s 網絡讀寫速度;1024 節(jié)點集群(8192 個 Gaudi 3 加速器)則提供 15EF FP8 計算性能,1PB 內存及 1.229PB/s網絡讀寫能力。

具體來看,英特爾 Gaudi 3 與主要的競品英偉達 H100 在相同節(jié)點數(shù)量下,相關大模型訓練時間對比上至高有 1.7 倍優(yōu)勢,其中,LLAMA2 70 億參數(shù)對比有 1.5 倍于 H100 的優(yōu)勢,LLAMA2 130 億參數(shù)最高有 1.7 倍的優(yōu)勢,GPT 3 1750 億參數(shù)有 1.4 倍優(yōu)勢。推理速度和能效表現(xiàn)上,Gaudi 3 相比于 H100 也有較大幅度提升。

軟件生態(tài)方面,英特爾 Gaudi 3 針對生成式 AI 提供端到端全棧 AI 軟件解決方案,包括嵌入式軟件、軟件套件、AI 軟件、AI 應用。

通過 Gaudi 3 可以支持基于還支持多模態(tài)、大語言模型、增強檢索生成核心能力的 3D 生成、文本生成、視頻圖片生成、內容總結、翻譯、問答、分級等常見 AI 功能。依靠豐富的 AI 軟件生態(tài),Gaudi 3 也支持常見的 AI 框架庫、使用場景和工具,并對有代表性的模型進行支持。英特爾還提供 Gaudi 軟件套件,提供對底層硬件的支持。

英特爾在 Vision 2024 上也公布了 Gaudi 3 生產節(jié)點,2024 年一季度將率先推出風冷版樣品,二季度推出液冷版樣品,并在今年第三、第四季度分別批量交付風冷版和液冷版。Gaudi 3 將由戴爾、惠與、聯(lián)想和超微四家 OEM 提供。

在此基礎上,英特爾也宣布 Gaudi 3 今年下半年可在英特爾 Developer Cloud 獲得。除了英特爾 Gaudi 3 加速器之外,英特爾還提供了關于其在企業(yè) AI 各個領域的下一代產品和服務的更新。

全新英特爾 Xeon 6 處理器作為英特爾全新品牌首次亮相,它主要針對生成式 AI 計算,Xeon 6 處理器包含高效核心 E-core 和性能核心 P-core。Xeon 6  E-core 代號 Sierra Forest,相比第二代英特爾 Xeon 處理器,性能每瓦提高 2.4 倍,并且機架密度提高 2.7 倍。對于英特爾的客戶而言,可以以接近 3 比 1 的比例替換老舊系統(tǒng),大幅降低能耗,推動實現(xiàn)可持續(xù)發(fā)展目標。Xeon 6  P-core,代號 Granite Rapids,支持 MXFP4。

PC、邊緣端和連接方面,英特爾酷睿 Ultra 處理器 AI PC 產品作為生產力、安全性和內容創(chuàng)作的工具,預計今年將發(fā)貨 4000 萬臺 AI PC。除此之外,英特爾宣布了一系列新的邊緣芯片,涵蓋了英特爾酷睿 Ultra、英特爾酷睿、英特爾凌動處理器和英特爾 Arc GPU,目標市場包括零售、工業(yè)制造和醫(yī)療保健。這些新品將在本季度推出。

另外,英特爾計劃與 Ultra Ethernet Consortium 合作推出 AI 以太網解決方案,解決龐大數(shù)據(jù)量下 AI 大模型網絡問題。這一產品計劃將在 2026 年推出。

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:芯片,英特爾

軟媒旗下網站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知