IT之家 12 月 10 日消息,英偉達(NVIDIA)公司于近日發(fā)布了 CUDA 12.0 開發(fā)工具更新。本次更新帶來了非常多的改變,包括支持最新的 Hopper 和 Ada Lovelace GPU 架構(gòu)、升級 C++ 方言(Dialects)、正式支持 JIT LTO、改善和引入新的 API 等等。
IT之家了解到,CUDA 12.0 主要功能介紹如下
CUDA 12.0 為 NVIDIA 的 Hopper 和 Ada Lovelace 架構(gòu)提供可編程功能。CUDA 12 為 Hopper 和 Ada 架構(gòu)提供了很多張量操作(tensor operation)選項,這些選項很多都支持公共 PTX 中間表示法。合作網(wǎng)格陣列(CGA)支持 C 內(nèi)置函數(shù),用于 SM 多投的編程式二級緩存,基因組學(xué) / DPX 指令,以及其它新增功能。
支持對標記為 CUDA_VISIBLE_DEVICES 的 GPU 使用虛擬內(nèi)存管理 API。
應(yīng)用程序和庫開發(fā)人員可以以編程方式更新 CUDA 流的優(yōu)先級。
改良后的 CUDA 動態(tài)平行化 API,與之前的 API 相比,性能有了 "實質(zhì)性" 的提高。
現(xiàn)在通過 nvJitLink 庫正式支持即時鏈接優(yōu)化(JIT LTO)。
支持 GCC 12.1 主機編譯器。
NVCC 和 NVRTC 對 C++20 方言的支持。
NVRTC 將其默認的 C++ 方言從 C++14 更新為 C++17。
更多關(guān)于 CUDA 12.0 變化的細節(jié)請參見發(fā)布說明。用戶和開發(fā)者可以從 developer.nvidia.com 下載適用于所有主要平臺的 CUDA 12.0。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。