Nvidia Pascal旗艦核心GP100揭秘：完整的“核彈”

2016/4/12 20:30:50 來源：IT之家作者：白貓責(zé)編：白貓

評(píng)論：

前幾天，Nvidia發(fā)布了采用Pascal架構(gòu)旗艦版GP100核心的Tesla P100，而且隨著Nvidia與AMD即將在臺(tái)北電腦展上發(fā)布新一代的游戲顯卡，相信新一輪的顯卡軍備競(jìng)賽即將展開。

目前外媒TechPowerUp拿到了GP100核心的完整結(jié)構(gòu)圖，讓我們來一起解析一下這顆完整版的Pascal GP100核心。

本篇文章較為專業(yè)，請(qǐng)大家有選擇地進(jìn)行閱讀。

可以看到，Nvidia在Pascal架構(gòu)上的總體思路與Kepler與Maxwell基本類似，但是相比較之前的架構(gòu)而言還是有所進(jìn)步，而且CUDA的數(shù)目也明顯多了許多，晶體管數(shù)目也大幅度增加至恐怖的170億個(gè)。但是核心面積卻大幅度地縮小，很大程度的原因是制程從之前的28nm提升到16nmFinFET。

整個(gè)核心被分成了6組GPC(圖形處理簇)，這是具備高度獨(dú)立性的GPU單元，擁有自己的渲染前端和后端。這種架構(gòu)組成在Maxwell架構(gòu)的完整核心GM200上就已經(jīng)見過，這樣的結(jié)構(gòu)，使得Maxwell相對(duì)于Kepler的效率大大提升，并且大幅度地降低了功耗。

我們來看具體的GPC。每一個(gè)GPC都包含10組SM(流多處理器單元)，而每個(gè)SM含有64個(gè)CUDA核心，也就是說整個(gè)GPU單元（完整版的Pascal核心）擁有60組SM、3840個(gè)CUDA核心，同時(shí)還有240個(gè)TMUs（紋理單元）。

值得注意的是，Nvidia在GP100上并不是完整版的Pascal架構(gòu)，因?yàn)槔宵S為此關(guān)閉了8組SM，而CUDA自然而然地減少到了3584個(gè)，不過還是比Maxwell的旗艦核心GM200的3072個(gè)CUDA還是高了六分之一。

從GP100的CUDA數(shù)可以看出，我們完全有理由相信新Titan并不會(huì)是Pascal的頂級(jí)產(chǎn)品，未來Nvidia還將推出更為高端的Pascal顯卡，到時(shí)候才是展現(xiàn)Pascal架構(gòu)的完整威力。之前的Kepler架構(gòu)的顯卡就是這種形式，白色的GTX Titan的CUDA為2688個(gè)，而之后發(fā)布的GTX 780Ti和GTX Titan Black為完整版的2880個(gè)CUDA?；蛟S在明年年末或者后年，完整版也就是搭載著3840個(gè)CUDA的Titan將會(huì)橫空出世，與AMD的Vega顯卡一決高下，到時(shí)候?qū)?huì)是火星撞地球的激烈場(chǎng)面！不過或許不久之后我們又要等待Nvidia新一代Volta顯卡的降臨了。

在圖片的邊緣我們可以看到八組顯存控制器，也就是SK Hynix或者Samsung制造的HBM2顯存，總位寬達(dá)到了4096Bits，一共為GP100核心提供高達(dá)720GB/S的超高帶寬。值得注意的是，GP100核心并沒有讓顯存帶寬達(dá)到理論值的1TB/S，我們相信這是為了迎接GP110（假設(shè)代號(hào)）而準(zhǔn)備的。當(dāng)然八組HBM2顯存共同為新Titan組成了16GB的超高速顯存，為迎接4K分辨率的3A級(jí)大作做了最好的準(zhǔn)備。

我們還可以在圖中看到新的“High-speed Hub”(高速控制中心)，并且衍生出四個(gè)NV-Link總線端口，Nvidia號(hào)稱NV-link端口單項(xiàng)能夠提供高達(dá)80GB/S的帶寬。

NV-Link是一項(xiàng)全新概念的技術(shù)，甚至可以說是一項(xiàng)新理念。它并不是一個(gè)真的Link，而是一個(gè)能橫跨在GPU和CPU之間，或者是GPU和GPU之間的快速互聯(lián)機(jī)制，同時(shí)可以提供恐怖的高速帶寬實(shí)現(xiàn)交互通訊。與此作類比就是Intel QPI與AMD HT。也就是說，未來的GPU將和CPU一樣，通過這種橋梁使得CPU和GPU之間的聯(lián)系更加緊密。

之后我們來看下Pascal的功耗，雖然CUDA數(shù)量是如此的恐怖，但是Tesla P100卻依然運(yùn)行在超高的頻率之上，基礎(chǔ)頻率為1328Mhz，而Boost頻率為1480Mhz，TDP為300W，這是由于16nmFinFET制程的加持才能讓Nvidia獲得如此高大的效率提升。

其實(shí)這些都不是重點(diǎn)，Pascal與之前的Maxwell與Kepler架構(gòu)所不一樣的是其中的FP32計(jì)算單元與FP64計(jì)算單元的大小完全一樣！也就是說，Nvidia能夠通過改變其中的某些FP64計(jì)算單元而大幅度提高單精度運(yùn)算來讓未來新的顯卡在游戲性能上更加地強(qiáng)大，因?yàn)镚P100的單精度運(yùn)算性能的10.6TFlops相比較于前一代的提升幅度還是不夠看，而5.3TFlops的雙精度運(yùn)算性能對(duì)于游戲來說幾乎毫無用處，我們完全有理由相信未來的新Titan搭載的GP102核心將會(huì)通過轉(zhuǎn)換FP64計(jì)算單元至FP32計(jì)算單元來大幅度地增加單精度運(yùn)算性能，IT之家推測(cè)明年一月發(fā)布的GP102核心，也就是新Titan與GTX 1080Ti的單精度運(yùn)算性能至少在12TFlops到14TFlops之間，到時(shí)候單卡60幀挑戰(zhàn)4K分辨率游戲?qū)⒉辉偈菈?mèng)想！

當(dāng)然距離搭載GP102核心的GTX 1080Ti與新Titan將于明年一月份首發(fā)，之前我們還是先看看次旗艦GTX 1070和GTX 1080的表現(xiàn)吧，如果說單路新Titan能夠單抗4K分辨率的話，那么GTX 1080面對(duì)未來2K分辨率的游戲還是毫無壓力的。

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮