眾所周知,NVIDIA GeForce RTX 40 系列 GPU 由于升級(jí)了架構(gòu)和制程,所以能效比有了不小的提升。但由于之前發(fā)布的高端卡,普遍性能也提升了不少,所以功耗相對(duì)來(lái)說也是不低的。而真正讓筆者直觀的感受到 Ada 架構(gòu)帶來(lái)的能效比飛躍的,正是我們今天的主角 GeForce RTX 4070,不僅體積更小,性能也有了突飛猛進(jìn)的提高。2K 分辨率下可滿足 100 幀以上暢玩光追游戲。
IT之家也是提前收到了公版的 NVIDIA GeForce RTX 40 系列 GPU,在本次測(cè)試中,我們將使用一套高配 intel 配置來(lái)測(cè)試,盡量避免顯卡瓶頸。具體配置如下:
外觀設(shè)計(jì)
NVIDIA GeForce RTX 4070 的包裝沿用了之前高端顯卡的設(shè)計(jì),給人一種“速度穿越”的感覺,但巨大的包裝內(nèi),顯卡卻變得相當(dāng)小巧。
顯卡本體為標(biāo)準(zhǔn)的 2 槽設(shè)計(jì),長(zhǎng)度也只有 24cm 左右,整體設(shè)計(jì)方正緊湊。即便是 A4 結(jié)構(gòu)的 ITX 機(jī)箱也可以輕松裝下。
顯卡的背板設(shè)計(jì)依舊延續(xù)了公版顯卡的 X 型設(shè)計(jì),金屬風(fēng)滿滿,低調(diào)不失炫酷。
正面則是厚實(shí)的散熱鰭片,整張顯卡全金屬的設(shè)計(jì)也有利于散熱。
顯卡風(fēng)扇采用一左一右一上一下的獨(dú)特排布方式,能形成垂直風(fēng)道,更好地帶走鰭片上的熱量。
顯卡外圍環(huán)繞著一層銀灰色的全金屬包邊,上方印有醒目的 GeForce RTX 標(biāo)識(shí)。
螺絲接口被設(shè)計(jì)在了右側(cè),整卡的一體感很強(qiáng)。
供電方面,它采用最新的 ATX3.0 規(guī)范的 16Pin 供電接口,隨包裝內(nèi)附贈(zèng)了 2*8Pin 轉(zhuǎn) 16Pin 的轉(zhuǎn)接頭,事實(shí)上,它的 TGP 功耗僅 200W 左右,理論上單 8Pin 的供電也能帶動(dòng)。我們?cè)谘b機(jī)時(shí),最好使用支持 ATX 3.0 規(guī)范的電源,這樣可以讓機(jī)箱內(nèi)更美觀。如果一定要用轉(zhuǎn)接線的話,用一根一分二 8Pin 的線就可以了。
I / O 接口擋板采用深灰配色,接口方面配備了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K60Hz 輸出。
接口方面,NVIDIA GeForce RTX 4070 依舊是 PCIe 4.0 的接口,搭配主流主板均可釋放全部性能。
核心解析
RTX 4070 與 RTX 4070Ti 相似,都是基于 AD104 核心打造的,但細(xì)節(jié)有所不同。具體的核心代號(hào)為 AD104-250。里面完整的 GPC 從 5 組變成了 4 組,內(nèi)部共有 5888 個(gè) CUDA 核心、184 個(gè) Tensor 核心、46 個(gè)第三代 RT 核心和 64 個(gè) ROP 單元,基本上可以理解為保留了 RTX 4070 Ti 80% 的核心規(guī)模。不過招牌的 NVENC 單元從兩個(gè)變成了一個(gè)。這意味著它的視頻編碼能力是不如 RTX 4070 Ti 及以上的顯卡的,但相比于上一代 RTX 3070 和 RTX 3070 Ti 則要強(qiáng)非常多。
RTX 4070 的 BOOST 頻率是 2475MHz,默認(rèn)頻率為 1920MHz。顯存方面與 RTX 4070 Ti 保持一致。都是 192-bit 位寬的 12GB GDDR6X,帶寬也都是 21Gbps。從上述定位中我們可以看出,RTX 4070 與 RTX 4070 Ti 一樣,都是一張定位 2K 高幀率游戲的中高端顯卡。
當(dāng)然,GeForce RTX 4070 依舊采用了最新的 NVIDIA Ada 架構(gòu),基于 TSMC 4N NVIDIA 定制工藝打造,從而實(shí)現(xiàn)了高達(dá) 2 倍的性能功耗比飛躍。它的流式多處理器吞吐量超過上一代產(chǎn)品的 2 倍,第三代 RT Cores 的光線追蹤計(jì)算能力更是提升了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具備高達(dá) 1.32 petaflops 的 Tensor 處理性能,超過上一代的 5 倍。而 SER 技術(shù)為光線追蹤帶來(lái)了最高可達(dá) 3 倍的性能提升,整體游戲性能也可高達(dá) 25% 的提升。
新的 Ada 架構(gòu)在具體功能上帶來(lái)了許多新的特性:引入了光流加速器使得 DLSS 3 能夠預(yù)測(cè)場(chǎng)景中幀與幀之間的運(yùn)動(dòng)變化,從而通過 AI 實(shí)現(xiàn)了幀生成技術(shù),提高了幀率的同時(shí)保持圖像質(zhì)量。此外,新架構(gòu)還支持 AV1 編碼器的應(yīng)用,從而降低了視頻的體積,并獲得更好的畫質(zhì)。同時(shí),RTX VSR 功能的應(yīng)用也使得實(shí)時(shí)視頻超分辨率成為可能。
理論性能
我們?cè)跇?biāo)題就有說到,RTX 4070 的功耗非常低。具體能有多低呢?我們單烤甜甜圈測(cè)試一下就知道了??緳C(jī) 15 分鐘后,核心溫度穩(wěn)定在 66.4℃左右,顯存溫度約 80℃。整卡功耗僅僅 198W,甚至比 RTX 3070 還更低。如果電源不虛標(biāo),CPU 配個(gè) i5、R5 之類的百瓦 CPU,只要 450W 的電源都能帶動(dòng)整機(jī)了。最關(guān)鍵的是,它僅需單根 8Pin 一分二輸出線就可以正常使用(一些非公顯卡甚至有單 8Pin 版本),這意味著有升級(jí)想法的玩家們,完全不需要換電源。由于顯卡體積特別小,機(jī)箱也不用換了。
接下來(lái)進(jìn)行 3DMark 壓力測(cè)試,這個(gè)測(cè)試可以檢測(cè)連續(xù)跑分下顯卡性能有沒有發(fā)生下降,一般 97% 以上才算合格的顯卡。實(shí)測(cè) NVIDIA GeForce RTX 4070 的得分為 99.6%,性能釋放極其穩(wěn)定。
在 3DMark TimeSpy DX12 測(cè)試中,顯卡分?jǐn)?shù)達(dá)到了 18140 分,這個(gè)成績(jī)已經(jīng)超越了 RTX 3080 10G,與 RTX 3080 12G 是基本相當(dāng)?shù)?,可以說 RTX 4070 的 DX12 性能約等于 RTX 30 系列的高端顯卡了,而功耗卻僅僅只有一半。
在 3DMark FireStrike Extreme DX11 測(cè)試中,NVIDIA GeForce RTX 4070 顯卡分?jǐn)?shù)達(dá)到了 21497 分,同樣與 RTX 3080 12G 相近,而功耗卻小了 50%。
而在 3DMark Portal Royal 光追測(cè)試中,NVIDIA GeForce RTX 4070 獲得了 11116 分,說明其光追能力約等于 RTX 3080 10G,也是能暢玩光追 2K 游戲的水平。
游戲?qū)崪y(cè)
接下來(lái),我們就進(jìn)行一下游戲?qū)崪y(cè)。值得一提的是,目前十大主流競(jìng)技射擊游戲中隨著《反恐精英 2》的加入,現(xiàn)已有九款支持 NVIDIA Reflex,這些游戲包括:《Apex 英雄》,《使命召喚: 戰(zhàn)區(qū) 2》,《命運(yùn) 2》,《逃離塔科夫》,《堡壘之夜》,《守望先鋒》”歸來(lái)”,《彩虹六號(hào):圍攻》和《無(wú)畏契約》,NVIDIA Reflex 能縮減操作延遲,提高響應(yīng)速度,讓跟槍更靈敏。筆者希望即將更新起源 2 版本的 CS2,也能支持 NVIDIA Reflex 技術(shù)。
接下來(lái)筆者測(cè)試了兩款經(jīng)典 3A 大作。《荒野大鏢客 2: 救贖》在不開啟 DLSS 的情況下,GeForce RTX 4070 能達(dá)到平均 103.6 幀,已經(jīng)能滿足 2K 100 幀以上高幀暢玩了,這個(gè)體驗(yàn)無(wú)疑是非常出色的。
如果我們開啟質(zhì)量檔的 DLSS,幀數(shù)會(huì)進(jìn)一步提升到平均 119 幀,并且此時(shí)畫質(zhì)幾乎沒有損失,體驗(yàn)很出色。
在另一款經(jīng)典的 3A 大作《古墓麗影: 暗影》中,我們也得到了類似的答案。在 2K 最高畫質(zhì)下運(yùn)行自帶的 BenchMark,已經(jīng)能達(dá)到平均 174 幀,滿足 2K165Hz 屏幕的暢玩。
在開啟 DLSS 后,幀數(shù)表現(xiàn)更佳,能達(dá)到平均 206 幀,幀數(shù)提升了 30 多幀。總的來(lái)說,RTX 4070 在傳統(tǒng) 3A 大作中的表現(xiàn)是很接近 RTX 3080 的。更別說前代同級(jí)的 RTX 3070 Ti、RTX 3070 了。
以上這些只是開胃小菜,而 RTX 4070 的最吸引人之處在于其 DLSS 3 技術(shù),可進(jìn)一步提升幀率。DLSS 3 是一款由 AI 驅(qū)動(dòng)的性能倍增技術(shù),采用了全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驅(qū)動(dòng),是 NVIDIA 廣受好評(píng)的深度學(xué)習(xí)超級(jí)采樣技術(shù)的最新版本,同時(shí)具備開創(chuàng)性的光學(xué)多幀生成功能,將為 NVIDIA RTX 神經(jīng)網(wǎng)絡(luò)渲染游戲和應(yīng)用開啟新的時(shí)代。
簡(jiǎn)單來(lái)說,過去的 DLSS 2 技術(shù)是通過渲染一個(gè)低分辨率圖像,然后通過 AI 放大至高分辨率,從而提升畫質(zhì)和幀率。而全新的 DLSS 3 技術(shù)在兼容 DLSS 2 的基礎(chǔ)上,新增了幀生成功能,可以在兩個(gè)真實(shí)幀之間插入 AI 推算出的全新幀,從而實(shí)現(xiàn)幀率的倍增。同時(shí),結(jié)合 DLSS 2 的超分辨率功能,AI 能夠重建多達(dá)八分之七的顯示像素,與沒有 DLSS 相比,游戲性能最高可提升 4 倍!
目前已經(jīng)有超過 280 款 DLSS 游戲和應(yīng)用發(fā)布。其中共有 30 款已發(fā)布的 DLSS 3 游戲。從發(fā)布進(jìn)度來(lái)看,在 DLSS 2 和 DLSS 3 各自發(fā)布的前六個(gè)月中,DLSS 3 的采用速度比 DLSS 2 快 7 倍??磥?lái)適配難度是相當(dāng)?shù)偷?,相信將?lái)有越來(lái)越多的游戲適配 DLSS 技術(shù)。
我們先來(lái)看看壓力最大的《賽博朋克 2077》在光追 + 2K 分辨率下的幀數(shù)情況,在默認(rèn)狀態(tài)下,RTX 4070 還是沒有辦法暢玩的,平均幀數(shù)約 38 幀。如果開啟 DLSS 2 質(zhì)量,幀數(shù)就可以達(dá)到平均 69 幀暢玩了。而如果開啟 RTX 40 系列專享的黑科技 DLSS 3,瞬間暴漲到了平均 103 幀,同時(shí)能滿足觀感和流暢。
傳奇 3A 大作《巫師 3:狂獵》最近也更新了次世代版,配置要求大大提高,當(dāng)然畫質(zhì)也跟上了潮流,放在如今也毫不落伍。同時(shí)它也提供了 DLSS 3 技術(shù)的支持,這對(duì)于 RTX 40 系列顯卡無(wú)疑是一個(gè)好消息。
《巫師 3:狂獵》次世代版在 2K 分辨率不開啟 DLSS 的情況下,GeForce RTX 4070 平均僅有 38 幀,如果開啟質(zhì)量檔 DLSS 2,就可以達(dá)到平均 64 幀。如果開啟 AI 加持的 DLSS 3 技術(shù),幀數(shù)就能暴漲到平均 95 幀,大部分場(chǎng)景可以實(shí)現(xiàn) 2K 百幀暢玩了。
在另一款畫質(zhì)爆炸的次世代 3A 大作《瘟疫傳說:安魂曲》中,優(yōu)化相對(duì)來(lái)說就要好不少了。即便不開啟任何 AI 技術(shù),也可以滿足 2K 60 幀流暢游玩,而在 DLSS 3 加持后更是可以以電競(jìng)幀數(shù)暢玩。
實(shí)測(cè) RTX 4070 在 2K 分辨率就已經(jīng)能滿足 71.2 幀暢玩了。如果開啟 DLSS 2 質(zhì)量檔,就能達(dá)到平均 104.5 幀,如果開啟 DLSS 3 插幀后,幀數(shù)更是會(huì)暴漲到平均 147.2 幀,滿足 2K144 高刷顯示器的需求。
那么,代與代之間的 GPU 會(huì)有多大的提升呢?筆者這套配置換上 RTX 3070 Ti 測(cè)試了一套數(shù)據(jù),看看隔代之間性能會(huì)有多少提升,在 DLSS 3 技術(shù)的加持下又會(huì)有多少提升。實(shí)測(cè)不開啟 DLSS 3 的情況下,RTX 4070 大約有 10% 的幀數(shù)優(yōu)勢(shì)。如果開啟 RTX 4070 系列獨(dú)占的 DLSS 3 技術(shù),幀數(shù)則領(lǐng)先了約 70%,這就是 AI 技術(shù)的魅力呀。
前面我們有提到過,RTX 4070 的功耗是相當(dāng)?shù)偷?,?shí)際上一根 8Pin 供電就能帶動(dòng)。因此我們還使用英偉達(dá)官方的 FrameView 工具統(tǒng)計(jì)了一下各個(gè) 3A 大作中的平均功耗。可以看出,大部分 3A 大作中 RTX 4070 的實(shí)際功耗都在 160-190W 左右,如此低的功耗,意味著電源的選擇上就很寬裕了,預(yù)算又可以省下一大筆,或許會(huì)成為萬(wàn)元機(jī)器的新選擇。而 ITX 愛好者們或許可以期待一下單風(fēng)扇的 RTX 4070 小卡了。
創(chuàng)意生產(chǎn)
顯存規(guī)模上,NVIDIA GeForce RTX 4070 與 RTX 4070Ti 的規(guī)格完全一致,都擁有 12G 的大顯存,速度也達(dá)到了 21Gbps。因此也被賦予了一定的創(chuàng)意生產(chǎn)能力。因此該顯卡還支持安裝 NVIDIA Studio 驅(qū)動(dòng),以加速 110 多款最受歡迎的創(chuàng)意應(yīng)用。專有的 SDK 能使這些應(yīng)用的運(yùn)行速度更快,并提供獨(dú)家功能,如 Optix、DLSS 和 Maxine。NVIDIA Studio 全套創(chuàng)意應(yīng)用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。同時(shí)大顯存的加持也讓它具備了一定的生成式人工智能的運(yùn)算能力,拿來(lái)進(jìn)行簡(jiǎn)單的 AI 繪畫訓(xùn)練也是沒有問題的。
在建模和渲染類軟件中,NVIDIA GeForce RTX 4070 的 5888 個(gè) CUDA 核心可以提供硬件加速,使得工作效率得以提高。幾乎所有的建模軟件都會(huì)對(duì) NVIDIA 的 GPU 進(jìn)行優(yōu)化,因此在效率、穩(wěn)定性和兼容性方面都能夠兼顧。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光線追蹤功能,實(shí)現(xiàn)高性能的最終幀渲染。此外,搭載了 AI 降噪功能的 GPU 還可以進(jìn)一步加速交互式渲染,提供更加流暢的工作體驗(yàn)。
我們也實(shí)測(cè)了一下 V-Ray Benchmark 的性能表現(xiàn),GeForce RTX 4070 獲得了 1847 分,可以應(yīng)對(duì)大部分中等規(guī)模的建模渲染需求。
得益于光追性能的提升,GeForce RTX 4070 在 V-Ray GPU RTX 中的分?jǐn)?shù)也提高到了 2631 分,也能應(yīng)付一些中等負(fù)載的光追建模渲染需求。
在視頻后期這一塊,GeForce RTX 4070 同樣配備了 NVENC 編碼器。并且 RTX 4070 也支持下一代視頻編碼技術(shù) AV1,AV1 能夠在占用相同空間情況下,提供更加快速的視頻編碼和更高質(zhì)量的流媒體傳輸性能。隨著各大視頻平臺(tái)希望節(jié)約服務(wù)器流量費(fèi)用,AV1 編碼必將成為未來(lái)的主流編碼方式。
NVIDIA 與多家行業(yè)合作伙伴密切合作,確保其 GPU 能夠充分支持當(dāng)今主流的多媒體應(yīng)用。目前,國(guó)內(nèi)的剪映專業(yè)版已經(jīng)實(shí)現(xiàn)了對(duì) NVIDIA AV1 視頻編碼器的加速支持。而常用的視頻調(diào)色剪輯軟件 DaVinci 也提供了 AV1 編碼的支持。這意味著 NVIDIA GPU 將來(lái)一定可以在處理視頻編輯和渲染任務(wù)時(shí)充分發(fā)揮其 AV1 加速功能,提供更高效的性能和更流暢的工作體驗(yàn)。
IT之家還為大家測(cè)試了 PugetBench For Adobe 全家桶,看看它能否勝任視頻剪輯工作。實(shí)測(cè) GeForce RTX 4070 在創(chuàng)意工作者們常用的 Adobe Premiere 中,我們開啟 GPU Cuda 加速,然后使用 PugetBenchmark 進(jìn)行測(cè)試。最終得分為 1475 分,瀏覽時(shí)間線上的 4K 視頻毫無(wú)壓力。
另外一款壓力更大的視頻特效軟件 Adobe Effects 中,我們同樣使用 PugetBenchmark 進(jìn)行測(cè)試。最終得分為 1640 分,能用來(lái)制作一些比較復(fù)雜的視效。
除了內(nèi)容生產(chǎn)以外,在內(nèi)容消費(fèi)領(lǐng)域 RTX 4070 也有新功能。那就是 RTX VSR 技術(shù)。全稱為 RTX Video Super Resolution(RTX 視頻超分辨率技術(shù))。它可以通過 GPU 的 AI 計(jì)算,至多將在線 1080P 視頻提升到 4K 分辨率,實(shí)現(xiàn)提高清晰度的效果,目前這一技術(shù)已經(jīng)適配了 Chrome 瀏覽器和 Edge 瀏覽器,后續(xù)也會(huì)適配以 VLC 為首的本地播放器。
RTX 視頻超分辨率的使用非常簡(jiǎn)單,只要將 RTX 30 系列 / 40 系列的驅(qū)動(dòng)程序更新到 531.14 以上版本,并將 Chrome / Edge 瀏覽器也更新到最新版本便可以啟用。啟用路徑為:NVIDIA 控制面板 —— 視頻 —— 調(diào)整視頻圖像設(shè)置。此選項(xiàng)框下有四個(gè)檔位可選。檔位越高超分辨率效果更明顯,但也會(huì)消耗更多的 GPU 資源。目前它已支持國(guó)內(nèi)的主流視頻平臺(tái)(嗶哩嗶哩、愛奇藝、斗魚和虎牙等平臺(tái)),以及一些國(guó)外的視頻平臺(tái)(Youtube、Twitch、Netflix、Hulu 和 Disney+)。
在下面的測(cè)試中,我們播放一條IT之家在嗶哩嗶哩發(fā)布的視頻,分辨率調(diào)整為 480P,從最左邊的原生 480P 分辨率超分后,后面的 1-4 檔能看出更加清晰了,實(shí)際觀感媲美 4K。
↑ 從左至右依次為 480P、VSR1、VSR2、VSR3、VSR4
除了 Edge 和 Chrome 瀏覽器以外,知名的 VLC 本地播放器也在 Beta 版中提供了 RTX VSR 技術(shù)的適配。和網(wǎng)頁(yè)一樣,只要在驅(qū)動(dòng)控制面版中打開就可以了。我們用一個(gè) 480P 的本地視頻做演示,明顯感覺右邊更清晰了,后面大家欣賞本地電影時(shí),也可以用這個(gè)技術(shù)進(jìn)一步優(yōu)化畫質(zhì)。
在最近大火的 AI 繪畫(生成式 AI)中,RTX 4070 也有一戰(zhàn)之地。例如我們運(yùn)用 stable-diffusion 的 v2-1_768-ema-pruned.ckpt 模型,嘗試?yán)L制 20 張 AI 老黃的圖像,RTX 4070 共計(jì)用時(shí) 2 分 18 秒。
而 RTX 3070 Ti 這邊,則用時(shí) 2 分 57 秒,相比于 RTX 4070 的出圖速度差距是相當(dāng)明顯的。如果平時(shí)只是想簡(jiǎn)單玩玩 AI 的話,RTX 4070 就足以勝任了。當(dāng)然如果要復(fù)雜的研究的話,那還是上 RTX 4090 或更高的 GPU 吧。
總結(jié)
筆者對(duì)于小而強(qiáng)大的東西一直沒有抵抗力,而 NVIDIA GeForce RTX 4070 正是這樣一張如此小,又如此強(qiáng)大的小鋼炮。它的體積和功耗都比 RTX 3080 低 50% 左右,但性能卻非常接近。同時(shí) DLSS 3、RTX VSR 等一系列 AI 技術(shù)的加持,能滿足 2K 100+ 幀的暢玩,是一張很適合 RTX 3070、RTX 2070Super 這個(gè)檔位的玩家升級(jí)的一張卡。
如果你打算裝一臺(tái)緊湊型主機(jī)的話,那么公版的 NVIDIA GeForce RTX 4070 幾乎是現(xiàn)在最好的選擇,首發(fā)的其它非公版 RTX 4070 都沒有體積這么小的。這張顯卡將于 4 月 12 日晚發(fā)售,建議零售價(jià) 4799 元,感興趣的話可以關(guān)注一下。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。