IT之家 7 月 30 日消息,英偉達(dá)官網(wǎng)公告顯示,亞馬遜云正式推出了由英偉達(dá) H100 Tensor Core GPU 驅(qū)動(dòng)的新的 Amazon Elastic Compute Cloud(EC2)P5 實(shí)例。
據(jù)介紹,該服務(wù)允許用戶(hù)通過(guò)瀏覽器輕松擴(kuò)展生成式 AI、高性能計(jì)算(HPC)和其他應(yīng)用。
NVIDIA H100 GPU 的一個(gè)重要特點(diǎn)是其對(duì) Transformer 的優(yōu)化,這是許多最新的先進(jìn) AI 應(yīng)用所使用的關(guān)鍵技術(shù),可確保 H100 在這些應(yīng)用中提供更高的性能和效率。
IT之家查詢(xún)發(fā)現(xiàn),雖然 AWS 尚未就集成 AMD MI300 芯片到其云服務(wù)中作出任何公開(kāi)承諾,但亞馬遜彈性計(jì)算云副總裁 Dave Brown 證實(shí) AWS 正在積極考慮這一方案。
英偉達(dá)表示,開(kāi)發(fā)人員和研究人員幾乎每天都在借助大型語(yǔ)言模型 (LLMs) 發(fā)掘 AI 的新應(yīng)用,而將這些新用例推向市場(chǎng)需要加速計(jì)算的效率。
NVIDIA H100 GPU 通過(guò)架構(gòu)創(chuàng)新提供超級(jí)計(jì)算級(jí)性能,包括第四代 Tensor Cores、用于加速 LLMs 的新 Transformer 引擎以及最新的 NVLink 技術(shù),可以帶極其可觀的性能。
據(jù)介紹,EC2 P5 實(shí)例非常適合訓(xùn)練和運(yùn)行復(fù)雜 LLMs 和計(jì)算機(jī)視覺(jué)模型的推理。這些神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)著最復(fù)雜和計(jì)算密集型的生成式人工智能應(yīng)用程序,包括問(wèn)答、代碼生成、視頻和圖像生成、語(yǔ)音識(shí)別等。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。