在本次測試的 RTX 4070 新卡中,大部分卡的 TGP 功耗都被設定在了 200W,導致性能幾乎沒有差別。而有這么一張卡,憑借越級的散熱器設計,性能釋放力壓其它非公顯卡一頭,達到了 215W。它就是影馳 GeForce RTX 4070 星曜 OC。
IT之家也是提前收到了影馳 GeForce RTX 4070 星曜 OC,在本次測試中,我們將使用一套高配 intel 配置來測試,盡量避免顯卡瓶頸。具體配置如下:
外觀設計
?影馳旗下的星曜系列顯卡一直是高端炫光顯卡的代名詞。因此尺寸也特別大。這是一張標準的 3 槽的大型顯卡,三圍尺寸為含擋板:?351*154*56mm?。整體設計采用鉆石風切割設計,內部則是無瑕的純白。?
?GEFORCE RTX 4070 星曜 OC 依舊采用三風扇設計,這個散熱模組被稱為星卓 III 散熱器。每個風扇有 11 片白色扇葉組成,透明的風扇設計可以讓光線自由彌散到每一個葉片。?
?伴隨著便捷燈控設置,當燈光亮起時,整張卡的外殼都會亮起,觀感晶瑩璀璨。?
?GEFORCE RTX 4070 星曜 OC 顯卡的背板以白色為主,同時多處有星光設計,右側有一處巨大的鏤空,可以讓風直接吹透,增強散熱表現(xiàn)。?
?顯卡背板最外圈是一層透明的包邊,這個包邊是可以自行拆卸的,玩家可以自定義出自己喜歡的方案。?
?比如影馳這次就提供了星曜娘校服新裝的背板和外殼用來替換,這樣一換整張卡瞬間變得二次元風格滿滿。?
?右上方印有 Ge??F??orce RTX 的標識,中間的 ARGB 燈光區(qū)域做了銀色的鏡面處理,點亮后會有星曜系列的 LOGO 會與風扇一起亮起。這個燈光也是具備實用性的,當出現(xiàn)供電不足或者安裝問題時,它會閃黃燈或紅燈來警告,被稱為“負能量”檢測系統(tǒng)。?
?供電方面,它采用最新的 ATX3.0 規(guī)范的 16Pin 供電接口,隨包裝內附贈了 2*8Pin 轉 16Pin 的轉接頭。?如果電源不虛標,CPU 配個 i5、R5 之類的百瓦 CPU,只要 450W 的電源都能帶動整機了。最關鍵的是,它僅需單根 8Pin 一分二輸出線就可以正常使用,這意味著有升級想法的玩家們,完全不需要換電源。
?本次測試我們采用的電源是威剛的 XPG 魔核金牌全模組 750W 冰雪白電源,它通過了 80PLUS 金牌認證,14CM 的長度很適合小體積機箱,純白模組線有與星曜顯卡特別配,750W 的足額輸出帶 i9 + RTX 4070 綽綽有余。?
?I / O 接口擋板采用深灰配色,接口方面配備了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K 60 幀輸出。?
?包裝內除了轉接線外,還附贈了一個顯卡支架,這個顯卡支架也是支持 ARGB 燈光的,可以與顯卡實現(xiàn)燈光同步。?
核心解析
RTX 4070 與 RTX 4070Ti 相似,都是基于 AD104 核心打造的,但核心規(guī)模上有所削減,因此核心代號為 AD104-250。具體削減的地方是 GPC 從 5 組變成了 4 組,內部共有 5888 個 CUDA 核心、184 個 Tensor 核心、46 個第三代 RT 核心和 64 個 ROP 單元,基本上可以理解為保留了 RTX 4070 Ti 80% 的核心規(guī)模。不過招牌的 NVENC 單元從兩個變成了一個,這一點略有遺憾。
RTX 4070 的公版 BOOST 頻率是 2475MHz,而影馳 RTX 4070 星曜 OC 由于越級的供電,默認頻率就高達 2610MHz。顯存方面則與 RTX 4070 Ti 保持一致。都是 192-bit 位寬的 12GB GDDR6X,帶寬也都是 21Gbps。適合進行 2K 高幀率游戲。
影馳 RTX 4070 星曜 OC 依然采用了最新的 NVIDIA Ada 架構,并基于 TSMC 4N 定制工藝進行打造,從而實現(xiàn)了高達 2 倍的性能功耗比的巨大飛躍。它搭載的流式多處理器吞吐量超過了上一代產(chǎn)品的 2 倍,第三代 RT Cores 的光線追蹤計算能力提升了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具備高達 1.32 petaflops 的 Tensor 處理性能,超過上一代的 5 倍。同時,采用了 SER 技術,為光線追蹤帶來了最高可達 3 倍的性能提升,整體游戲性能也可以高達 25% 的提升。無論是在游戲還是在其他計算任務中,都能夠帶來卓越的性能表現(xiàn)。
新的 Ada 架構在具體功能上帶來了許多新的特性:引入了光流加速器使得 DLSS 3 能夠預測場景中幀與幀之間的運動變化,從而通過 AI 實現(xiàn)了幀生成技術,提高了幀率的同時保持圖像質量。此外,新架構還支持 AV1 編碼器的應用,從而降低了視頻的體積,并獲得更好的畫質。在 AI 繪畫、GPT 訓練等生成式人工智能場景下能帶來更強勁的算力。同時,RTX VSR 功能的應用也使得實時視頻超分辨率成為可能。
理論性能
我們在開頭就有說到,影馳 RTX 4070 星曜 OC 是首發(fā)所有顯卡中性能的天花板。因為它突破了 200W 的功耗墻。實測烤機 15 分鐘后,核心溫度穩(wěn)定在 59℃左右,顯存溫度約 73.2℃。整卡功耗達到了 215W,不僅性能釋放比其他家高,溫度還比其他家低,足可見堆料之足。
接下來進行 3DMark 壓力測試,這個測試可以檢測連續(xù)跑分下顯卡性能有沒有發(fā)生下降,一般 97% 以上才算合格的顯卡。實測影馳 GeForce RTX 4070 星曜 OC 的得分為 99.6%,性能釋放極其穩(wěn)定。
在 3DMark TimeSpy DX12 測試中,顯卡分數(shù)達到了 19048 分,作為對比,公版 RTX 4070 的成績是 18148 分。影馳 GeForce RTX 4070 星曜 OC 的確有不小的性能優(yōu)勢。這個成績已經(jīng)超越了 RTX 3080 10G,與 RTX 3080 12G 是基本相當?shù)摹?/p>
在 3DMark FireStrike Extreme DX11 測試中,影馳 GeForce RTX 4070 星曜 OC 的顯卡分數(shù)達到了 22387 分,同樣與 RTX 3080 12G 相近,也同樣超越了所有同期的非公版顯卡。
而在 3DMark Portal Royal 光追測試中,影馳 GeForce RTX 4070 星曜 OC 獲得了 11116 分,比公版高了大約 500 分,也是能暢玩光追 2K 游戲的水平。
游戲實測
接下來,我們就進行一下游戲實測,分辨率調整為 2560*1440,畫質統(tǒng)一調整為最高。首先是競技游戲《CS:GO》,這款游戲可以展現(xiàn) RTX 4070 在高幀下的表現(xiàn)。運行自帶的 BenchMark 后,平均幀達到了 486 幀,可以滿足 2K 高幀暢玩的需求,完全能跑滿各種電競屏了。
值得一提的是,目前十大主流競技射擊游戲中現(xiàn)已有八款支持 NVIDIA Reflex,這些游戲包括:《Apex 英雄》,《使命召喚: 戰(zhàn)區(qū) 2》,《命運 2》,《逃離塔科夫》,《堡壘之夜》,《守望先鋒》”歸來”,《彩虹六號:圍攻》和《無畏契約》,NVIDIA Reflex 能縮減操作延遲,提高響應速度,讓跟槍更靈敏。筆者希望即將更新起源 2 版本的 CS2,也能支持 NVIDIA Reflex 技術。
接下來筆者還測試了兩款經(jīng)典 3A 大作?!痘囊按箸S客 2: 救贖》在不開啟 DLSS 的情況下,GeForce RTX 4070 能達到平均 107 幀,已經(jīng)能滿足 2K 100 幀以上高幀暢玩了,這個體驗無疑是非常出色的。
如果我們開啟質量檔的 DLSS,幀數(shù)會進一步提升到平均 124 幀,并且此時畫質幾乎沒有損失,體驗很出色。
在另一款經(jīng)典的 3A 大作《古墓麗影: 暗影》中,幀數(shù)也比其他家的 RTX 4070 更高。在 2K 最高畫質下運行自帶的 BenchMark,已經(jīng)能達到平均 182 幀,完全滿足 2K165Hz 屏幕的暢玩。
在開啟 DLSS 后,幀數(shù)表現(xiàn)更佳,能達到平均 214 幀,幀數(shù)提升了 30 多幀??偟膩碚f,RTX 4070 在傳統(tǒng) 3A 大作中的表現(xiàn)是很接近 RTX 3080 的。更是遠超前代同級的 RTX 3070 Ti、RTX 3070、RTX2070Super。
以上這些只是開胃小菜,RTX 4070 的最吸引人之處在于其 DLSS 3 技術,可進一步提升幀率。DLSS 3 是一款由 AI 驅動的性能倍增技術,采用了全新第四代 Tensor Core 和 GeForce RTX 40 系列 GPU 的全新光流加速器驅動,是 NVIDIA 廣受好評的深度學習超級采樣技術的最新版本,同時具備開創(chuàng)性的光學多幀生成功能,將為 NVIDIA RTX 神經(jīng)網(wǎng)絡渲染游戲和應用開啟新的時代。
簡單來說,過去的 DLSS 2 技術是通過渲染一個低分辨率圖像,然后通過 AI 放大至高分辨率,從而提升畫質和幀率。而全新的 DLSS 3 技術在兼容 DLSS 2 的基礎上,新增了幀生成功能,可以在兩個真實幀之間插入 AI 推算出的全新幀,從而實現(xiàn)幀率的倍增。同時,結合 DLSS 2 的超分辨率功能,AI 能夠重建多達八分之七的顯示像素,與沒有 DLSS 相比,游戲性能最高可提升 4 倍!
目前已經(jīng)有超過 280 款 DLSS 游戲和應用發(fā)布。其中共有 30 款已發(fā)布的 DLSS 3 游戲。從發(fā)布進度來看,在 DLSS 2 和 DLSS 3 各自發(fā)布的前六個月中,DLSS 3 的采用速度比 DLSS 2 快 7 倍。看來適配難度是相當?shù)偷?,相信將來有越來越多的游戲適配 DLSS 技術。
我們先來看看壓力最大的《賽博朋克 2077》在光追 + 2K 分辨率下的幀數(shù)情況,在默認狀態(tài)下,RTX 4070 還是沒有辦法暢玩的,平均幀數(shù)約 40 幀。如果開啟 DLSS 2 質量,幀數(shù)就可以達到平均 71 幀暢玩了。而如果開啟 RTX 40 系列專享的黑科技 DLSS 3,瞬間暴漲到了平均 107 幀,得益于更高的頻率,影馳 GeForce RTX 4070 星曜 OC 的幀數(shù)總是比公版要高兩三幀。
傳奇 3A 大作《巫師 3:狂獵》最近也更新了次世代版,配置要求大大提高,當然畫質也跟上了潮流,放在如今也毫不落伍。同時它也提供了 DLSS 3 技術的支持,這對于 RTX 40 系列顯卡無疑是一個好消息。
《巫師 3:狂獵》次世代版在 2K 分辨率不開啟 DLSS 的情況下,GeForce RTX 4070 平均僅有 44 幀,如果開啟質量檔 DLSS 2,就可以達到平均 65 幀。如果開啟 AI 加持的 DLSS 3 技術,幀數(shù)就能暴漲到平均 100 幀,大部分場景可以實現(xiàn) 2K 百幀暢玩了。
在另一款畫質爆炸的次世代 3A 大作《瘟疫傳說:安魂曲》中,優(yōu)化相對來說就要好不少了。即便不開啟任何 AI 技術,也可以滿足 2K 60 幀流暢游玩,而在 DLSS 3 加持后更是可以以電競幀數(shù)暢玩。
實測 RTX 4070 在 2K 分辨率就已經(jīng)能滿足 76.7 幀暢玩了。如果開啟 DLSS 2 質量檔,就能達到平均 116.8 幀,如果開啟 DLSS 3 插幀后,幀數(shù)更是會暴漲到平均 157.5 幀,滿足 2K 144 高刷顯示器暢玩。
那么隔代之間的顯卡,性能會有多少提升呢?在 DLSS 3 技術的加持下又會有多少提升?筆者也順便用這套配置換上 RTX 3070 Ti 測試了一套數(shù)據(jù)。在不開啟 DLSS 3 的情況下,影馳 RTX 4070 星曜 OC 大約有 10% 的幀數(shù)優(yōu)勢。如果開啟 RTX 4070 系列獨占的 DLSS 3 技術,幀數(shù)幾乎實現(xiàn)了 2-2.5 倍的增長,與 RTX 3070 Ti 實現(xiàn)了質的差距。
此外,我們還使用英偉達官方的 FrameView 工具統(tǒng)計了一下各個 3A 大作中的平均功耗??梢钥闯龃蟛糠?3A 大作中影馳 RTX 4070 星曜 OC 的實際功耗都在 200W 左右,散熱壓力很低,對電源的需求也會非常低。
創(chuàng)意生產(chǎn)
影馳 GeForce RTX 4070 星曜 OC 還支持安裝 NVIDIA Studio 驅動,以加速 110 多款最受歡迎的創(chuàng)意應用,因此也具備了一定的生產(chǎn)力。專有的 SDK 能使這些應用的運行速度更快,并提供獨家功能,如 Optix、DLSS 和 Maxine。NVIDIA Studio 全套創(chuàng)意應用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。同時大顯存的加持也讓它具備了一定的生成式人工智能的運算能力,拿來進行簡單的 AI 繪畫訓練也是沒有問題的。
在建模和渲染類軟件中,影馳 GeForce RTX 4070 星曜 OC 的 5888 個 CUDA 核心可以提供硬件加速,使得工作效率得以提高。幾乎所有的建模軟件都會對 NVIDIA 的 GPU 進行優(yōu)化,因此在效率、穩(wěn)定性和兼容性方面都能夠兼顧。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光線追蹤功能,實現(xiàn)高性能的最終幀渲染。此外,搭載了 AI 降噪功能的 GPU 還可以進一步加速交互式渲染,提供更加流暢的工作體驗。
我們也實測了一下 V-Ray Benchmark 的性能表現(xiàn),影馳 GeForce RTX 4070 星曜 OC 獲得了 1902 分,作為對比,公版 RTX 4070 的得分為 1842 分,完全可以應對大部分中等規(guī)模的建模渲染需求。
得益于光追性能的提升,GeForce RTX 4070 在 V-Ray GPU RTX 中的分數(shù)也提高到了 2699 分,同樣高于公版的成績,也能應付一些中等負載的光追建模渲染需求。
在視頻后期這一塊,RTX 4070 配備了 NVENC 編碼器。并且也支持下一代視頻編碼技術 AV1,AV1 能夠在占用相同空間情況下,提供更加快速的視頻編碼和更高質量的流媒體傳輸性能。隨著各大視頻平臺希望節(jié)約服務器流量費用,AV1 編碼必將成為未來的主流編碼方式。
NVIDIA 與多家行業(yè)合作伙伴密切合作,確保其 GPU 能夠充分支持當今主流的多媒體應用。目前,國內的剪映專業(yè)版已經(jīng)實現(xiàn)了對 NVIDIA AV1 視頻編碼器的加速支持。而常用的視頻調色剪輯軟件 DaVinci 也提供了 AV1 編碼的支持。這意味著 NVIDIA GPU 將來一定可以在處理視頻編輯和渲染任務時充分發(fā)揮其 AV1 加速功能,提供更高效的性能和更流暢的工作體驗。
IT之家還為大家測試了 PugetBench For Adobe 全家桶,看看它能否勝任視頻剪輯工作。實測 GeForce RTX 4070 在創(chuàng)意工作者們常用的 Adobe Premiere 中,我們開啟 GPU Cuda 加速,然后使用 PugetBenchmark 進行測試。最終得分為 1513 分,回看 4K 視頻毫無壓力。
另外一款壓力更大的視頻特效軟件 Adobe Effects 中,我們同樣使用 PugetBenchmark 進行測試。最終得分為 1637 分,能用來制作一些比較復雜的視效。
除了內容生產(chǎn)以外,在內容消費領域 RTX 4070 也有新功能。那就是 RTX VSR 技術。全稱為 RTX Video Super Resolution(RTX 視頻超分辨率技術)。它可以通過 GPU 的 AI 計算,至多將在線 1080P 視頻提升到 4K 分辨率,實現(xiàn)提高清晰度的效果,目前這一技術已經(jīng)適配了 Chrome 瀏覽器和 Edge 瀏覽器,后續(xù)也會適配以 VLC 為首的本地播放器。
只要將 RTX 30 系列 / 40 系列的驅動程序更新到 531.14 以上版本,并將 Chrome / Edge 瀏覽器也更新到最新版本便可以啟用。啟用路徑為:NVIDIA 控制面板 —— 視頻 —— 調整視頻圖像設置。此選項框下有四個檔位可選。檔位越高超分辨率效果更明顯,但也會消耗更多的 GPU 資源。
目前它已支持一些國外的視頻平臺(Youtube、Twitch、Netflix、Hulu 和 Disney+)以及國內的主流視頻平臺(嗶哩嗶哩、斗魚和虎牙)。后續(xù)也會支持 VLC 本地視頻超分辨率。在下面的測試中,從最左邊的原生 480P 分辨率超分后,后面的 1-4 檔能看出更加清晰了,實際觀感媲美 4K。
↑ 從左至右依次為 480P、VSR1、VSR2、VSR3、VSR4
除了 Edge 和 Chrome 瀏覽器以外,知名的 VLC 本地播放器也在 Beta 版中提供了 RTX VSR 技術的適配。和網(wǎng)頁一樣,只要在驅動控制面板中打開就可以了。我們用一個 480P 的本地視頻做演示,明顯感覺右邊更清晰了,后面大家欣賞本地電影時,也可以用這個技術進一步優(yōu)化畫質。
總結
筆者這次首發(fā)測試了 3 張 RTX 4070 新卡,影馳 GeForce RTX 4070 星曜 OC 毫無疑問是其中性能最強的存在。與旗艦卡同款的散熱器設計風格,也讓觀感更為霸氣。而在實際性能上,它僅需 RTX 3080 65% 左右的功耗,就可以實現(xiàn)更強的性能,在 DLSS 3 技術的加持下,游戲體驗又被進一步提升了。
目前看來,RTX 4070 會是 RTX 3070\3070Ti\2070Super 這個檔位的用戶升級的好選擇。影馳 GeForce RTX 4070 星曜 OC 將于 4 月 13 日晚 9 點發(fā)售,感興趣的話可以關注一下。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。