設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

英偉達發(fā)布集成 256 個 GH200 芯片的 DGX GH200 超級計算機,Grace Hopper 超級芯片已投產(chǎn)

2023/5/29 13:05:22 來源:IT之家 作者:遠洋 責(zé)編:遠洋
感謝IT之家網(wǎng)友 肖戰(zhàn)割割、西窗舊事 的線索投遞!

IT之家 5 月 29 日消息,英偉達今日在 2023 臺北電腦展大會上發(fā)布了多項重磅消息,其中最引人注目的是其 Grace Hopper 超級芯片已經(jīng)全面投產(chǎn)。這些芯片是英偉達新推出的 DGX GH200 人工智能超級計算平臺和 MGX 系統(tǒng)的核心組件,它們專為處理海量的生成型人工智能任務(wù)而設(shè)計。英偉達還宣布了其新的 Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺,專為人工智能服務(wù)器和超級計算集群而優(yōu)化。

Grace Hopper 超級芯片是英偉達開發(fā)的基于 Arm 架構(gòu)的 CPU+GPU 集成方案,它將 72 核的 Grace CPU、Hopper GPU、96GB 的 HBM3 和 512 GB 的 LPDDR5X 集成在同一個封裝中,共有 2000 億個晶體管。這種組合提供了 CPU 和 GPU 之間驚人的數(shù)據(jù)帶寬,高達 1 TB / s,為某些內(nèi)存受限的工作負載提供了巨大的優(yōu)勢。

DGX GH200 人工智能超級計算平臺是英偉達針對最高端的人工智能和高性能計算工作負載而設(shè)計的系統(tǒng)和參考架構(gòu),目前的 DGX A100 系統(tǒng)只能將八個 A100 GPU 聯(lián)合起來作為一個單元,考慮到生成型人工智能的爆炸式增長,英偉達的客戶迫切需要更大、更強大的系統(tǒng),DGX GH200 就是為了提供最大的吞吐量和可擴展性而設(shè)計的,它通過使用英偉達的定制 NVLink Switch 芯片來避免標(biāo)準集群連接選項(如 InfiniBand 和以太網(wǎng))的限制。

DGX GH200 的細節(jié)還不太清楚,但已確認英偉達使用了一種新的 NVLink Switch 系統(tǒng),包含 36 個 NVLink 開關(guān),將 256 個 GH200 Grace Hopper 芯片和 144TB 的共享內(nèi)存連接成一個單元,英偉達 CEO 黃仁勛表示,GH200 芯片為“巨型 GPU”。這是英偉達第一次使用 NVLink Switch 拓撲結(jié)構(gòu)來構(gòu)建整個超級計算機集群,英偉達稱這種結(jié)構(gòu)提供了比前一代系統(tǒng)高出 10 倍的 GPU 到 GPU 和 7 倍的 CPU 到 GPU 的帶寬。它還設(shè)計了提供比競爭對手高出 5 倍的互連功耗效率和高達 128 TB / s 的對分帶寬。該系統(tǒng)有 150 英里(IT之家備注:約 241.4 公里)的光纖,并且重達 4 萬磅,但是呈現(xiàn)出來就像一個單一的 GPU。英偉達表示,256 顆 Grace Hopper 超級芯片將 DGX GH200 的“AI 性能”提升到了 exaflop(一百萬萬億次)。

英偉達將把 DGX GH200 的參考藍圖提供給其主要客戶谷歌、Meta 和微軟,并且還將把該系統(tǒng)作為云服務(wù)提供商和超大規(guī)模數(shù)據(jù)中心的參考架構(gòu)設(shè)計。英偉達自己也將部署一個新的英偉達 Helios 超級計算機,由四個 DGX GH200 系統(tǒng)組成,用于自家的研發(fā)工作。這四個系統(tǒng)共有 1024 個 Grace Hopper 芯片,并且用英偉達的 Quantum-2 InfiniBand 400 Gb / s 網(wǎng)絡(luò)連接起來。

英偉達 DGX 面向最高端的系統(tǒng),HGX 系統(tǒng)面向超大規(guī)模數(shù)據(jù)中心,而新的 MGX 系統(tǒng)則處于這兩者之間,而且 DGX 和 HGX 將與新的 MGX 系統(tǒng)共存。英偉達的 OEM 合作伙伴在設(shè)計人工智能中心的服務(wù)器時面臨著新的挑戰(zhàn),會降低設(shè)計和部署的速度。英偉達的新 MGX 參考架構(gòu)旨在加快這一過程,提供了 100 多種參考設(shè)計。

MGX 系統(tǒng)由模塊化設(shè)計組成,涵蓋了英偉達的 CPU 和 GPU、DPU 和網(wǎng)絡(luò)系統(tǒng)的各個方面,但也包括了基于常見的 x86 和 Arm 處理器的設(shè)計。英偉達還提供了空冷和液冷的設(shè)計選項,以適應(yīng)各種應(yīng)用場景。華碩、技嘉、永擎和和碩都將使用 MGX 參考架構(gòu)來開發(fā)將在今年晚些時候到明年初推出的系統(tǒng)。

至于新的 Spectrum-X 網(wǎng)絡(luò)平臺,英偉達稱它為“專為人工智能而打造的高性能以太網(wǎng)”網(wǎng)絡(luò)平臺。Spectrum-X 設(shè)計采用了英偉達的 51 Tb / s Spectrum-4 400 GbE 以太網(wǎng)交換機和英偉達 Bulefield-3 DPU,搭配軟件和 SDK,使開發(fā)人員能夠根據(jù) AI 工作負載的獨特需求調(diào)整系統(tǒng)。

與其他基于以太網(wǎng)的系統(tǒng)相比,英偉達稱 Spectrum-X 是無損的,從而提供了更好的 QoS 和延遲。它還具有新的自適應(yīng)路由技術(shù),這在多租戶環(huán)境中特別有用。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:英偉達,DGX GH200,Grace Hopper

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知