IT之家 1 月 9 日消息,據(jù)路透社,英偉達計劃于 2024 年第二季度開始量產(chǎn)中國特供的 AI 芯片,以遵守美國出口管制新規(guī),其中最強的型號就是 H20。英偉達對此拒絕置評。
除了 HGX H20 之外,英偉達還計劃推出另外兩款符合美國限制的 PCIe 芯片 ——L20 和 L2,但具體信息不詳。
消息人士透露,H20 原定于去年 11 月推出,但該計劃由于“服務(wù)器制造商在集成該芯片時遇到了問題”而被推遲。其中一位知情人士表示,初期產(chǎn)能十分有限,英偉達需要首先滿足主流客戶的訂單。
根據(jù) SemiAnalysis 分析,H20、L20 和 L2 包含英偉達大部分用于 AI 工作的功能特性,但為了遵守新規(guī)則,這三款新品在算力方面有所削減;不過在 LLM 推理中依然要比 H100 快 20% 以上。
IT之家查詢公開資料獲悉,NVIDIA H100 Tensor Core GPU 采用全新 Hopper 架構(gòu),基于臺積電 N4 工藝,集成了 800 億個晶體管。與上一代產(chǎn)品相比,可為多專家 (MoE) 模型提供高 9 倍的訓(xùn)練速度。
它配備第四代 Tensor Core 和 Transformer 引擎(FP8 精度),還具有高度可擴展的 NVLink 互連技術(shù)(最多可連接達 256 個 H100 GPU,相較于上一代采用 HDR Quantum InfiniBand 網(wǎng)絡(luò),帶寬高出 9 倍,帶寬速度為 900GB/s)等功能。
相關(guān)閱讀:
《消息稱中國特供版英偉達 H20 AI 芯片推遲到明年一季度發(fā)布》
《采用 CoWoS 封裝,消息稱英偉達中國特供版 H20 在 LLM 推理中比 H100 更快》
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。