前幾天,Nvidia發(fā)布了采用Pascal架構(gòu)旗艦版GP100核心的Tesla P100,而且隨著Nvidia與AMD即將在臺(tái)北電腦展上發(fā)布新一代的游戲顯卡,相信新一輪的顯卡軍備競(jìng)賽即將展開。
目前外媒TechPowerUp拿到了GP100核心的完整結(jié)構(gòu)圖,讓我們來一起解析一下這顆完整版的Pascal GP100核心。
本篇文章較為專業(yè),請(qǐng)大家有選擇地進(jìn)行閱讀。
可以看到,Nvidia在Pascal架構(gòu)上的總體思路與Kepler與Maxwell基本類似,但是相比較之前的架構(gòu)而言還是有所進(jìn)步,而且CUDA的數(shù)目也明顯多了許多,晶體管數(shù)目也大幅度增加至恐怖的170億個(gè)。但是核心面積卻大幅度地縮小,很大程度的原因是制程從之前的28nm提升到16nmFinFET。
整個(gè)核心被分成了6組GPC(圖形處理簇),這是具備高度獨(dú)立性的GPU單元,擁有自己的渲染前端和后端。這種架構(gòu)組成在Maxwell架構(gòu)的完整核心GM200上就已經(jīng)見過,這樣的結(jié)構(gòu),使得Maxwell相對(duì)于Kepler的效率大大提升,并且大幅度地降低了功耗。
我們來看具體的GPC。每一個(gè)GPC都包含10組SM(流多處理器單元),而每個(gè)SM含有64個(gè)CUDA核心,也就是說整個(gè)GPU單元(完整版的Pascal核心)擁有60組SM、3840個(gè)CUDA核心,同時(shí)還有240個(gè)TMUs(紋理單元)。
值得注意的是,Nvidia在GP100上并不是完整版的Pascal架構(gòu),因?yàn)槔宵S為此關(guān)閉了8組SM,而CUDA自然而然地減少到了3584個(gè),不過還是比Maxwell的旗艦核心GM200的3072個(gè)CUDA還是高了六分之一。
從GP100的CUDA數(shù)可以看出,我們完全有理由相信新Titan并不會(huì)是Pascal的頂級(jí)產(chǎn)品,未來Nvidia還將推出更為高端的Pascal顯卡,到時(shí)候才是展現(xiàn)Pascal架構(gòu)的完整威力。之前的Kepler架構(gòu)的顯卡就是這種形式,白色的GTX Titan的CUDA為2688個(gè),而之后發(fā)布的GTX 780Ti和GTX Titan Black為完整版的2880個(gè)CUDA?;蛟S在明年年末或者后年,完整版也就是搭載著3840個(gè)CUDA的Titan將會(huì)橫空出世,與AMD的Vega顯卡一決高下,到時(shí)候?qū)?huì)是火星撞地球的激烈場(chǎng)面!不過或許不久之后我們又要等待Nvidia新一代Volta顯卡的降臨了。
在圖片的邊緣我們可以看到八組顯存控制器,也就是SK Hynix或者Samsung制造的HBM2顯存,總位寬達(dá)到了4096Bits,一共為GP100核心提供高達(dá)720GB/S的超高帶寬。值得注意的是,GP100核心并沒有讓顯存帶寬達(dá)到理論值的1TB/S,我們相信這是為了迎接GP110(假設(shè)代號(hào))而準(zhǔn)備的。當(dāng)然八組HBM2顯存共同為新Titan組成了16GB的超高速顯存,為迎接4K分辨率的3A級(jí)大作做了最好的準(zhǔn)備。
我們還可以在圖中看到新的“High-speed Hub”(高速控制中心),并且衍生出四個(gè)NV-Link總線端口,Nvidia號(hào)稱NV-link端口單項(xiàng)能夠提供高達(dá)80GB/S的帶寬。
NV-Link是一項(xiàng)全新概念的技術(shù),甚至可以說是一項(xiàng)新理念。它并不是一個(gè)真的Link,而是一個(gè)能橫跨在GPU和CPU之間,或者是GPU和GPU之間的快速互聯(lián)機(jī)制,同時(shí)可以提供恐怖的高速帶寬實(shí)現(xiàn)交互通訊。與此作類比就是Intel QPI與AMD HT。也就是說,未來的GPU將和CPU一樣,通過這種橋梁使得CPU和GPU之間的聯(lián)系更加緊密。
之后我們來看下Pascal的功耗,雖然CUDA數(shù)量是如此的恐怖,但是Tesla P100卻依然運(yùn)行在超高的頻率之上,基礎(chǔ)頻率為1328Mhz,而Boost頻率為1480Mhz,TDP為300W,這是由于16nmFinFET制程的加持才能讓Nvidia獲得如此高大的效率提升。
其實(shí)這些都不是重點(diǎn),Pascal與之前的Maxwell與Kepler架構(gòu)所不一樣的是其中的FP32計(jì)算單元與FP64計(jì)算單元的大小完全一樣!也就是說,Nvidia能夠通過改變其中的某些FP64計(jì)算單元而大幅度提高單精度運(yùn)算來讓未來新的顯卡在游戲性能上更加地強(qiáng)大,因?yàn)镚P100的單精度運(yùn)算性能的10.6TFlops相比較于前一代的提升幅度還是不夠看,而5.3TFlops的雙精度運(yùn)算性能對(duì)于游戲來說幾乎毫無用處,我們完全有理由相信未來的新Titan搭載的GP102核心將會(huì)通過轉(zhuǎn)換FP64計(jì)算單元至FP32計(jì)算單元來大幅度地增加單精度運(yùn)算性能,IT之家推測(cè)明年一月發(fā)布的GP102核心,也就是新Titan與GTX 1080Ti的單精度運(yùn)算性能至少在12TFlops到14TFlops之間,到時(shí)候單卡60幀挑戰(zhàn)4K分辨率游戲?qū)⒉辉偈菈?mèng)想!
當(dāng)然距離搭載GP102核心的GTX 1080Ti與新Titan將于明年一月份首發(fā),之前我們還是先看看次旗艦GTX 1070和GTX 1080的表現(xiàn)吧,如果說單路新Titan能夠單抗4K分辨率的話,那么GTX 1080面對(duì)未來2K分辨率的游戲還是毫無壓力的。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。