IT之家 11 月 4 日消息,預(yù)熱大半年之后,AMD 終于揭開了它 RDNA 3 架構(gòu)的面紗,隨著比上一代便宜的 Radeon RX 7900 XTX(999 美元)和 Radeon RX 7900 XT 顯卡(899 美元)的到來,A 卡似乎再次擁有了與 N 卡爭(zhēng)一爭(zhēng)的機(jī)會(huì)。
首先,大多數(shù)細(xì)節(jié)與我們此前爆料過的 AMD RDNA 3 架構(gòu)和 RX 7000 系列預(yù)期內(nèi)存一致。RDNA 3 將使用臺(tái)積電 5nm 芯片,內(nèi)含一個(gè)主 GCD (圖形計(jì)算模塊) 以及 6 個(gè) MCD (內(nèi)存緩存模塊)。
此外,RDNA 3 在架構(gòu)上也有著很多底層的改進(jìn),例如更多的計(jì)算單元和更多的 GPU 著色器。
從 AMD 給出的資料來看,這一代顯卡繼續(xù)專注于功率和能效方面,據(jù)稱 RDNA 3 的每瓦性能相比 RDNA 2 可提高 50%。這一點(diǎn)與抬高功耗壓榨性能的英偉達(dá) RTX 4090 有點(diǎn)不一樣。外媒認(rèn)為 AMD 應(yīng)該是覺得沒有必要在默認(rèn)情況下將耗電量提到那種高度。
讓我們先來快速瀏覽一下核心規(guī)格,并將其規(guī)格與上一代 RDNA 2 和英偉達(dá) RTX 4090 橫向進(jìn)行一下對(duì)比。
顯卡 | RX 7900 XTX | RX 7900 XT | RX 6950 XT | RTX 4090 | RTX 4080 | RTX 3090Ti |
---|---|---|---|---|---|---|
架構(gòu) | Navi 31 | 31 | 21 | AD102 | AD103 | GA102 |
工藝 | 臺(tái)積電 N5 + N6 | 臺(tái)積電 N5 + N6 | 臺(tái)積電 N7 | 臺(tái)積電 4N | 臺(tái)積電 4N | 三星 8N |
晶體管數(shù)量(億) | 580 | 580 - 1MCD | 268 | 763 | 459 | 283 |
尺寸 (mm2) | 300 + 222 | 300 + 185 | 519 | 608.4 | 378.6 | 628.4 |
SM / CU / Xe | 96 | 84 | 80 | 128 | 76 | 84 |
GPU 內(nèi)核(著色器) | 12288 | 10752 | 5120 | 16384 | 9728 | 10752 |
Tensor 核心 | / | / | / | 512 | 304 | 336 |
光線追蹤核心 | 96 | 84 | 80 | 128 | 76 | 84 |
加速頻率 (MHz) | 2300 | 2000 | 2310 | 2520 | 2505 | 1860 |
顯存速度 (Gbps) | 20? | 20? | 18 | 21 | 22.4 | 21 |
顯存大小 (GB) | 24 | 20 | 16 | 24 | 16 | 24 |
顯存總線位寬 | 384 | 320 | 256 | 384 | 256 | 384 |
L2 / 無限緩存 | 96 | 80 | 128 | 72 | 64 | 6 |
ROPs | 192 | 192 | 128 | 176 | 112 | 112 |
TMU | 384 | 336 | 320 | 512 | 304 | 336 |
TFLOPS FP32(Boost) | 56.5 | 43.0 | 23.7 | 82.6 | 48.7 | 40.0 |
TFLOPS FP16 (FP8) | 113 | 86 | 47.4 | 661 (1321) | 390 (780) | 160 (320) |
帶寬 (GBps) | 960? | 800? | 576 | 1008 | 717 | 1008 |
TDP(瓦) | 355 | 300 | 335 | 450 | 320 | 450 |
日期 | 2022 年 12 月 | 2022 年 12 月 | 2022 年 5 月 | 2022 年 10 月 | 2022 年 11 月 | 2022 年 3 月 |
指導(dǎo)價(jià) | 999 美元 | 899 美元 | 1099 美元 | 1599 美元 | 1199 美元 | 1999 美元 |
國(guó)行價(jià) | 換算約 7293 元人民幣 | 約 6563 元人民幣 | 8399(7099) | 12999 元 | 9499 元 | 14999 元 |
IT之家了解到,AMD RX 7900 XTX 沒有學(xué)英偉達(dá),還是傳統(tǒng) 8Pin 接口,功耗 355W 只需兩個(gè) 8Pin,而 RX 7900 XT 300W 同樣是 2 個(gè) 8Pin。
AMD 有兩個(gè)版本的 Navi 31 GPU,其中更高規(guī)格的型號(hào)命名為 RX 7900 XTX ,這張卡啟用了完整的 GCD 和 6 個(gè) MCD,而 RX 7900 XT 則只啟用了 96 個(gè)計(jì)算單元中的 84 個(gè)以及 5 個(gè) MCD。
從技術(shù)上講, RX 7900 XT 第六個(gè) MCD 可能只是物理屏蔽掉了,但不管怎樣它都沒辦法自行啟用,而且這張卡本身也沒有額外的 4GB GDDR6 顯存給它用,所以開核什么的就別想了。
與競(jìng)爭(zhēng)對(duì)手相比,RX 7900 XTX 在算力方面仍落后于 RTX 4090,畢竟英偉達(dá)還有 Tensor 加持,可實(shí)現(xiàn)更強(qiáng)的 AI 處理能力。
外媒認(rèn)為,考慮到 RX 6950 XT 在 1080p 和 1440p 上已經(jīng)幾乎趕上 RTX 3090 Ti(4K 則落后 5% 左右),但它理論上卻少了 40% 的原始計(jì)算性能。因此,紙面上 RX 7900 XTX 比 RTX 4090 少 32% 的計(jì)算量可能無法代表什么。
至于另一款,RX 7900 XT 應(yīng)該不是用來對(duì)標(biāo) RTX 4090 的,我們只需要考慮它將如何與 RTX 4080 競(jìng)爭(zhēng)就夠了。
從參數(shù)方面來看,它有著更多的顯存和更高的帶寬,再加上 16% 的計(jì)算能力優(yōu)勢(shì)。因此,即使 RDNA 3 著色器的性能有所下降 (后續(xù)介紹),AMD 這一代卡看起來也應(yīng)該非常有競(jìng)爭(zhēng)力,至少紙面上可以與英偉達(dá)次旗艦碰一碰,何況它還低了 200 美元。
在過去兩代的 RDNA 架構(gòu)上,AMD 已多次強(qiáng)調(diào)其能效方面的優(yōu)勢(shì),而 RDNA 3 則延續(xù)了這一重點(diǎn)。
AMD 聲稱,與 RDNA 2 相比,新一代 GPU 每瓦性能提高了 54%,而 RDNA 2 的 PPW 比 RDNA 提高了 54%。在過去的三代中,AMD 的效率幾乎可以說是指數(shù)型上升。
我們以上一代 RX 6900 XT 為例,它的性能基本上是上一代 RX 5700 XT 的兩倍(1440p 超分辨率),而外媒實(shí)測(cè)功耗大約在 308W,而 5700 XT 則為 214W,所以效率應(yīng)該是提高了 38%。
那么面對(duì) RTX 40 系列的進(jìn)逼,AMD 該如何繼續(xù)提高效率?這可能在很大程度上都要?dú)w功于臺(tái)積電 N7 到 N5 (7nm 到 5nm) 的迭代演變,但架構(gòu)上的更新肯定也有那么一些幫助。
新一代 RDNA 3 統(tǒng)一了計(jì)算單元,各個(gè)都有 64 個(gè)雙發(fā)流處理器 (GPU 著色器)。,相當(dāng)于 RDNA 2 的兩倍,而且 AMD 可以向每個(gè) SIMD 單元發(fā)送不同的工作負(fù)載,又或者它可以讓兩者在同一類型的指令上協(xié)同工作,進(jìn)而提高效率。
值得注意的是,最新的 AMD、Intel 和 Nvidia GPU 現(xiàn)在全都是 128 著色器設(shè)計(jì) ——AMD 的計(jì)算單元 (CU),Nvidia 的流媒體多處理器 (SM),Intel 的 Xe 矢量引擎 (XVE)。
不單單是 CU 中 GPU 著色器數(shù)量翻倍,AMD 的 CU 總數(shù)也從 80 增加到 96 個(gè)。相比之下,AMD 的 Navi 31 的著色器數(shù)量可達(dá) Navi 21 的 2.4 倍,而功耗只增加了 18%。
此外,AMD 還提高了它的 AI 加速器的性能,而之前該公司很少談?wù)撨@一被英偉達(dá)碾壓的領(lǐng)域。我們無法確定新款算力如何,但 AMD 稱其 AI 加速器支持 INT8 和 BF16 (腦浮點(diǎn) 16 位) 操作。因此,它們可能至少擁有部分類似于 Nvidia 的 Tensor 核心,但支持的指令集總數(shù)并不相同。
但不管怎么說,AMD 表示其新的 AI 加速器相比上一代提供了 2.7 倍的改進(jìn) —— 兩倍的數(shù)量,更多的處理器,以及略高的吞吐量。
最后,AMD 表示他們已經(jīng)優(yōu)化了光線追蹤加速器,RDNA 3 版本可帶來 1.5 倍的光線追蹤性能,還擁有新的專用指令和改進(jìn)的 BVH (光追 / 盒) 排序和遍歷,這個(gè)詞具體指什么還沒完全搞清楚,但我們肯定新卡在光線跟蹤和改進(jìn)的光柵化性能上有一個(gè)巨大的飛躍,至于相比 4090 如何還需要等后續(xù)評(píng)測(cè)。
除了計(jì)算單元,RDNA 3 還對(duì)許多其他領(lǐng)域進(jìn)行了大升級(jí),例如 AMD Radiance 顯示引擎,或基本的視頻輸出支持。
此外,AMD 還升級(jí)了 RDNA 3,支持 DisplayPort 2.1 (英偉達(dá) (*^_^*)),這也意味著 AMD 從此成為第二家支持 DP2.x 的 GPU 公司(英特爾 Arc 是首款)。
不過英特爾僅支持每通道 10 Gbps 或總共 40 Gbps 的帶寬,而 DP2.1 實(shí)際上可支持單通道 20 Gbps 或總共 80 Gbps 的帶寬。
不過目前來看 AMD 也不支持 20 Gbps,而是選擇了 13.5 Gbps 這一中間級(jí)別,因此 AMD 新一代 GPU 可實(shí)現(xiàn) 54Gbps 的總帶寬,這基本上是 DP1.4a 的兩倍。
得益于 DSC (顯示流壓縮) 技術(shù),AMD 可以在 4K 分辨率上支持高達(dá) 480Hz 的刷新率,或在使用其 DisplayPort 2.1 接口的 8K 顯示器上支持高達(dá) 165Hz 的刷新率。值得一提的是,預(yù)計(jì)首批 DisplayPort 2.1 顯示器和電視將在 2023 年初上市,名單見圖。
AMD 還通過 RDNA 3 大幅改進(jìn)了媒體引擎。這一點(diǎn)已經(jīng)或多或少地得到了曝光,但 Navi 31 驚喜的地方在于擁有雙媒體引擎,完全能夠支持兩個(gè)同時(shí)運(yùn)行的 8K60 流 —— 可以是編碼、解碼,也可以并聯(lián) / 組合起來以提高編碼單個(gè)流媒體的性能。
視頻引擎的另一個(gè)更新之處在于對(duì) AV1 的支持,這意味著所有三家 GPU 廠商從此都已經(jīng)對(duì) AV1 提供完整的硬件編碼 / 解碼支持。希望我們后續(xù)能看到更多的軟件解決方案和流媒體服務(wù)支持 AV1 而不是 H.264。
此外,視頻引擎的頻率比以前更高 (我們不確定高多少),AMD 還指出它有 AI 增強(qiáng)的視頻編碼能力,不過具體的也同樣需要等后續(xù)硬件評(píng)測(cè)時(shí)再去做一些視頻編碼測(cè)試,敬請(qǐng)期待。
與此同時(shí),AMD 也給出了一些 Radeon RX 7900 XTX 的初始性能數(shù)據(jù),例如使命召喚、賽博朋克 2077、看門狗、生化危機(jī) 8 等等,相對(duì)于上一代 RX 6950 XT 大約有 50% 到 70% 的提升。
我們不能保證上述性能聲明的準(zhǔn)確性,但 AMD 選擇這些游戲肯定是有原因的。
還有,AMD 又一次介紹了其 FidelityFX 超級(jí)分辨率 (FSR) 技術(shù)。這是老生常談的內(nèi)容了,我們直接略過。
據(jù)介紹,AMD 目前已擁有超過 216 款游戲和應(yīng)用支持 FSR,但大多數(shù)都是 FSR 1.X,畢竟它是開源的,所以很容易集成,而且已經(jīng)有一年多的時(shí)間了,給開發(fā)者準(zhǔn)備的時(shí)間也更長(zhǎng),而 FSR 2.0 則年輕得多,在今年 5 月才發(fā)布,目前只在少數(shù)游戲中才能看到。
展望未來,AMD 的 FSR 將繼續(xù)“充滿吸引力”。我們當(dāng)然也希望 FSR2 的普及率能夠超過 FSR1.x,畢竟它能夠?yàn)橛脩魩砀玫捏w驗(yàn),不管是什么平臺(tái),而且游戲也能夠同時(shí)支持這兩種技術(shù),可能在部分場(chǎng)景中 (如低端顯卡和集成顯卡上) FSR1 對(duì)某些用戶更適合。
據(jù)稱,F(xiàn)SR3 技術(shù)將在明年的某個(gè)時(shí)候發(fā)布,它將尋求某種形式的補(bǔ)幀或插幀,有點(diǎn)類似于英偉達(dá)的 DLSS 3 所做的方向。AMD 沒有透露太多細(xì)節(jié),部分原因可能是 FSR3 還沒有完全想好后續(xù)怎么做,但在早期測(cè)試中它可以將部分游戲的幀數(shù)提高兩倍。
兩款顯卡均將在 12 月 13 日發(fā)售,其中 RADEON RX 7900 XTX 售價(jià) 999 美元,而 RADEON RX 7900 XT 售價(jià) 899 美元。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。