去年的 RTX 3060 Ti 由于其強悍的性能,一時間成為了主流游戲玩家們的好選擇。因此今年發(fā)布的基于全新 Ada 架構打造的 RTX 4060 Ti 也同樣引人注目。大家關心下一代 RTX 4060 Ti 能否延續(xù) RTX 3060 Ti 的優(yōu)秀表現(xiàn)、能否繼續(xù)延續(xù) 60 Ti 系列的高性價比。
而 NVIDIA 方面交出的答卷是 NVIDIA GeForce RTX 4060 Ti 8G 和 NVIDIA GeForce RTX 4060 Ti 16G 這兩張新卡。它們的性能幾乎相同,也都擁有 32MB 的 L2 大緩存,帶來更高的讀取命中率。兩者的區(qū)別在于 16G 大顯存版更適合加速 AI 內(nèi)容創(chuàng)作,8G 版則擁有更高的性價比適合 1080P 高幀游戲。它們相比于 RTX 3060Ti GDDR6 都擁有 15%-70% 的性能提升,相比于 2060 SUPER 更是有著 60%-160% 的性能提升。能帶來 1080P 分辨率下的高幀率低延遲游戲體驗。
IT之家也是提前收到了公版的 NVIDIA GeForce RTX 4060 Ti 8G,在本次測試中,我們將使用一套高配 intel 配置來測試,分辨率也都調(diào)整到 1080P,以避免顯卡瓶頸。具體配置如下:
外觀設計
NVIDIA GeForce RTX 4060 Ti 8G 的外觀設計與我們之前測試的 NVIDIA GeForce RTX 4070 非常相似,顯卡本體都為標準的 2 槽設計,長度也只有 24cm 左右,整體設計方正緊湊。即便是 A4 結構的 ITX 機箱也可以輕松裝下。
整個散熱器和 NVIDIA GeForce RTX 4070 唯一的區(qū)別在于,旁邊的金屬包邊從槍灰色變成了銀灰色,觀感更靈動一些。
正面則是厚實的散熱鰭片,整張顯卡全金屬的設計也有利于散熱。
顯卡風扇采用一左一右一上一下的獨特排布方式,能形成垂直風道,更好地帶走鰭片上的熱量。
顯卡外圍環(huán)繞著一層銀灰色的全金屬包邊,上方印有醒目的 GeForce RTX 標識。
螺絲接口被設計在了右側,整卡的一體感很強。
供電方面,它采用最新的 ATX3.0 規(guī)范的 16Pin 供電接口,隨包裝內(nèi)附贈了 1*8Pin 轉 16Pin 的轉接頭,這個設計還是比較幽默的,可以看出 NVIDIA 推廣 ATX3.0 標準的決心。
事實上,它的 TGP 功耗僅 160W 左右,單 8Pin 的供電完全能帶動。因此絕大多數(shù)非公版 RTX 4060 Ti 都選擇單 8Pin 的供電設計。
I / O 接口擋板采用 RTX 4070 同款的深灰配色,接口方面配備了 3*DP1.4a 接口和 1*HDMI2.1 接口,最高支持 8K60Hz 輸出。
核心解析
RTX 4060 Ti 基于 AD106 核心打造。整體架構和我們之前測試的 RTX 4070 是差不多的,不過里面的 GPC 從 4 組變成了 3 組,內(nèi)部共有 4352 個 CUDA 核心、136 個 Tensor 核心、34 個第三代 RT 核心和 51 個 ROP 單元,基本上可以理解為保留了 RTX 4070 75% 的核心規(guī)模。招牌的 NVENC 視頻編碼單元和 NVDNC 視頻解碼單元也依舊存在,這意味著它也是很適合用來進行內(nèi)容創(chuàng)作的。
RTX 4060 Ti 的 BOOST 頻率是 2535MHz,默認頻率為 2250MHz。顯存方面是 128-bit 位寬的 8GB GDDR6 海力士顯存,功耗和發(fā)熱都極大的降低了。
至于為什么會選擇 128-bit 的閃存,NVIDIA 官方也做出了解釋,主要原因在于,全新 NVIDIA Ada Lovelace 架構的存儲子系統(tǒng)將 L2 緩存的大小增加了 16 倍,極大提高了緩存命中率。英偉達稱,從歷史上看,顯存位寬一直被用作確定新 GPU 的速度和性能等級的重要指標。然而,顯存位寬本身并不能充分表明存儲子系統(tǒng)的性能。相反,更全面地了解存儲子系統(tǒng)設計及其對游戲性能的整體影響是有幫助的。
如上圖所示,Ada GPU 中的 L2 緩存帶寬已顯著增加。這使得在處理核心和 L2 緩存之間傳輸更多數(shù)據(jù)成為可能。在各種游戲和綜合基準測試中,與 2 MB 二級緩存的性能相比,32 MB 二級緩存將顯存總線流量平均降低了 50% 以上。這種 50% 的流量減少使 GPU 能夠更有效地使用其顯存帶寬,效率提升可達近 2 倍。因此,在這種情況下,隔離顯存性能,具有 288 GB / 秒峰值顯存帶寬的 Ada GPU 的性能與具有 554 GB / 秒峰值顯存帶寬的 Ampere GPU 的性能相似。在一系列游戲和綜合測試中,大大提高的緩存命中率將游戲幀率提高了高達 34%。
以上這些顯存利用效率的提高,都要得益于最新的 NVIDIA Ada 架構,NVIDIA Ada 架構是 NVIDIA 的最新架構,它基于 TSMC 4N NVIDIA 定制工藝打造,從而實現(xiàn)了高達 2 倍的性能功耗比飛躍。它的流式多處理器吞吐量超過上一代產(chǎn)品的 2 倍,第三代 RT Cores 的光線追蹤計算能力更是提升了 2.8 倍。此外,第四代 Tensor Cores 新增了 FP8 引擎,具備高達 1.32 petaflops 的 Tensor 處理性能,超過上一代的 5 倍。而 SER 技術為光線追蹤帶來了最高可達 3 倍的性能提升,整體游戲性能也可高達 25% 的提升。
新的 Ada 架構為各種專業(yè)圖形、視頻、AI 和計算工作負載提供了驚人的性能和能效,也帶來了許多創(chuàng)新的特性,例如:
1.新增了光流加速器,能夠利用 AI 預測場景中的運動變化,實現(xiàn)了 DLSS 3 的幀生成技術,大幅提升了幀率和圖像質(zhì)量。
2.支持了 AV1 編碼器,能夠有效壓縮視頻文件的大小,同時保證更高的畫質(zhì)。這對于視頻轉碼、流媒體、視頻會議、增強現(xiàn)實和虛擬現(xiàn)實等應用場景非常有用。
3.引入了 RTX VSR 功能,能夠?qū)崿F(xiàn)實時視頻超分辨率,讓低分辨率的視頻在高分辨率的屏幕上也能呈現(xiàn)出清晰的細節(jié)。
值得一提的是,本次 RTX 4060 Ti 8G 采用的接口也發(fā)生了變化,從 PCIe 4.0*16,變成了 PCIe 4.0*8,這對于采用新主板的玩家們是不會帶來任何影響的。但如果你的主板只支持 PCIe 3.0 的話,那么實際使用中就是以 PCIe3.0*8 運行的,帶寬會受到一定影響,建議搭配比較新的平臺來裝機。
理論性能
我們在導語就有說到,NVIDIA GeForce RTX 4060 Ti 8G 的功耗非常低。具體能有多低呢?我們接下來就進行烤機測試??緳C 15 分鐘后,核心溫度穩(wěn)定在 66.8℃左右,顯存溫度約 78.2℃。整卡功耗僅僅 160W,不僅遠低于 RTX 3060 Ti,甚至比 RTX 3060 還更低。如果電源不虛標,CPU 配個 i5、R5 之類的百瓦 CPU,只要 450W 的電源都能帶動整機了,不得不說 Ada 架構和 TSMC 4N 定制工藝的能效比真的非常高,RTX 4060 系列也將會是 ITX 玩家們的福音。
接下來進行 3DMark 壓力測試,這個測試可以檢測連續(xù)跑分下顯卡性能有沒有發(fā)生下降,一般 97% 以上才算合格的顯卡。實測 NVIDIA GeForce RTX 4060 Ti 8G 的得分為 99.5%,性能釋放極其穩(wěn)定。
在 3DMark TimeSpy DX12 測試中,顯卡分數(shù)達到了 13653 分,作為對比,RTX 3060Ti 的成績?yōu)?12277 分,提升大約在 10% 左右,而功耗卻低了非常多。
在 3DMark FireStrike Extreme DX11 測試中,NVIDIAGeForce RTX 4060 Ti 8G 顯卡分數(shù)達到了 16194 分,作為對比,RTX 3060 Ti 的分數(shù)為 14553,提升幅度也是在 10% 左右。
而在 3DMark Portal Royal 光追測試中,NVIDIAGeForce RTX 4060 Ti 8G 獲得了 8056 分,作為對比,RTX 3060 Ti 的分數(shù)為 7158 分,看來 RTX 4060 Ti 8G 的理論性能相比于 RTX 3060 Ti 就是在 10% 左右了。
游戲?qū)崪y
接下來,我們就進行一下游戲?qū)崪y,分辨率調(diào)整為 1920*1080,畫質(zhì)統(tǒng)一調(diào)整為最高,有光追則打開最高檔的光追,有 DLSS 就開啟到質(zhì)量檔。首先是競技游戲《CS:GO》,這款游戲可以展現(xiàn) RTX 4060 Ti 8G 在高幀下的表現(xiàn)。運行自帶的 BenchMark 后,平均幀達到了 537 幀,可以滿足高幀暢玩的需求,完全能跑滿各種電競屏了。
值得一提的是,目前已有 70 款游戲已支持 NVIDIA Reflex 低延遲技術,其中有 8 款主流競技射擊游戲支持 NVIDIA Reflex,包括:《Apex 英雄》,《使命召喚: 戰(zhàn)區(qū) 2》,《命運 2》,《逃離塔科夫》,《堡壘之夜》,《守望先鋒》”歸來”,《彩虹六號:圍攻》和《無畏契約》。筆者期待 CS2 能夠在更新起源 2 版本后,也能加入 NVIDIA Reflex 的支持,讓所有熱門的 FPS 游戲都能享受低延遲的優(yōu)勢。
接下來筆者還測試了兩款經(jīng)典 3A 大作。《荒野大鏢客 2: 救贖》在開啟質(zhì)量 DLSS 的情況下,能達到平均 115 幀,已經(jīng)能滿足百幀暢玩高畫質(zhì)了,這個 1080P 下的體驗無疑是非常出色的。
在另一款經(jīng)典的 3A 大作《古墓麗影: 暗影》中,我們也得到了類似的答案。在 1080P 最高畫質(zhì)下運行自帶的 BenchMark,已經(jīng)能達到平均 212 幀,如此高的幀數(shù)意味著征服 2K 分辨率也不在話下了。
在光追大作《控制》中,開啟最高光追的情況下甚至能達到 144 幀,以電競幀數(shù)暢玩光追 3A 大作再也不是夢了。
真正讓 RTX 4060 Ti 和 RTX 3060Ti 拉開差距的,是其 DLSS 3 技術,它能夠利用 AI 和 GeForce RTX 40 系列 GPU 上的第四代 Tensor Core 和光流加速器,生成更多的高質(zhì)量幀,從而大幅提升幀數(shù)。DLSS 3 是 NVIDIA 深度學習超采樣技術的最新版本,也是神經(jīng)圖形技術的革命性突破,能夠在保持畫質(zhì)和反應速度的同時,將性能提升高達 4 倍。
簡單來說,過去的 DLSS 2 技術是通過渲染一個低分辨率圖像,然后通過 AI 放大至高分辨率,從而提升畫質(zhì)和幀率。而全新的 DLSS 3 技術在兼容 DLSS 2 的基礎上,新增了幀生成功能,可以在兩個真實幀之間插入 AI 推算出的全新幀,從而實現(xiàn)幀率的倍增。同時,結合 DLSS 2 的超分辨率功能,AI 能夠重建多達八分之七的顯示像素,與沒有 DLSS 相比,游戲性能最高可提升 4 倍!
目前已經(jīng)有超過 300 款 DLSS 游戲和應用發(fā)布。其中已有超 30 款已發(fā)布的 DLSS 3 游戲。從發(fā)布進度來看,在 DLSS 2 和 DLSS 3 各自發(fā)布的前六個月中,DLSS 3 的采用速度比 DLSS 2 快 7 倍??磥磉m配難度是相當?shù)偷?,相信將來有越來越多的游戲適配 DLSS 技術。
我們先來看看壓力最大的《賽博朋克 2077》在光追 + 1080P 分辨率下的幀數(shù)情況,在默認狀態(tài)下,RTX 4060 Ti 8G 還是沒有辦法暢玩的,平均幀數(shù)約 45 幀。如果開啟 DLSS 2 質(zhì)量,幀數(shù)就可以達到平均 79 幀暢玩了。而如果開啟 RTX 40 系列專享的黑科技 DLSS 3,瞬間暴漲到了平均 119 幀,百幀暢玩光追不在話下。
傳奇 3A 大作《巫師 3:狂獵》最近也更新了次世代版,配置要求大大提高,當然畫質(zhì)也跟上了潮流,放在如今也毫不落伍。同時它也提供了 DLSS 3 技術的支持,這對于 RTX 40 系列顯卡無疑是一個好消息。
《巫師 3:狂獵》次世代版在 1080P 分辨率不開啟 DLSS 的情況下,GeForce RTX 4060 Ti 8G 平均僅有 43 幀,如果開啟質(zhì)量檔 DLSS 2,就可以達到平均 65 幀流暢游玩。如果開啟 AI 加持的 DLSS 3 技術,幀數(shù)就能暴漲到平均 102 幀,大部分場景可以實現(xiàn) 1080P 最高特效百幀暢玩了。
在另一款畫質(zhì)爆炸的次世代 3A 大作《瘟疫傳說:安魂曲》中,優(yōu)化相對來說就要好不少了。即便不開啟任何 AI 技術,也可以滿足 1080P 60 幀流暢游玩,而在 DLSS 3 加持后更是可以以電競幀數(shù)暢玩。
實測 RTX 4060 Ti 8G 在不開啟 DLSS 技術時就已經(jīng)能滿足 60 幀暢玩了。如果開啟 DLSS 2 質(zhì)量檔,就能達到平均 84 幀,如果開啟 DLSS 3 插幀后,幀數(shù)更是會暴漲到平均 110 幀,滿足高刷顯示器的需求。
那么,60 Ti 系列在”代與代之間”的 GPU 會有多大的提升呢?筆者這套配置換上 RTX 3060 Ti GDDR6 (OC) 測試了一套數(shù)據(jù),看看隔代之間性能會有多少提升,在 DLSS 3 技術的加持下又會有多少提升。實測不開啟 DLSS 3 的情況下,RTX 4060 Ti 8G 大約有 15% 的幀數(shù)優(yōu)勢。如果開啟 RTX 40 系列獨占的 DLSS 3 技術,幀數(shù)則普遍相比上代實現(xiàn)了近乎翻倍的提升,效果真是相當出彩。
前面我們有提到過,RTX 4060 Ti 8G 的功耗是相當?shù)偷?,實際上一根 8Pin 供電就能帶動。因此我們還使用英偉達官方的 FrameView 工具統(tǒng)計了一下各個 3A 大作中的平均功耗。測出來的數(shù)據(jù)令筆者十分驚訝,大部分 3A 大作中實際功耗都在 130-140W 左右,甚至比很多筆記本分配給 GPU 的功耗都低了。如此 DIY 玩家們完全不需要買大電源了,ITX 玩家們也可以期待大批單風扇 RTX 4060 Ti 上市。
創(chuàng)意生產(chǎn)
NVIDIA GeForce RTX 4060 Ti 系列也被賦予了一定的創(chuàng)意生產(chǎn)能力,該顯卡支持安裝 NVIDIA Studio 驅(qū)動,以加速 110 多款最受歡迎的創(chuàng)意應用。專有的 SDK 能使這些應用的運行速度更快,并提供獨家功能,如 Optix、DLSS 和 Maxine。NVIDIA Studio 全套創(chuàng)意應用,包括 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。如果選購 16G 大顯存版本的話,也讓它具備了一定的生成式人工智能的運算能力,拿來進行簡單的 AI 繪畫訓練也是沒有問題的。不過 16G 大顯存版尚未發(fā)售,我們接下來還是用 8G 版做一下簡單的測試。
NVIDIA GeForce RTX 4060 Ti 8G 的 CUDA 核心可以提供硬件加速,使得工作效率得以提高。幾乎所有的建模軟件都會對 NVIDIA 的 GPU 進行優(yōu)化,因此在效率、穩(wěn)定性和兼容性方面都能夠兼顧。例如,在常用的渲染工具 V-Ray 中,可以利用 RTX 加速的光線追蹤功能,實現(xiàn)高性能的最終幀渲染。此外,搭載了 AI 降噪功能的 GPU 還可以進一步加速交互式渲染,提供更加流暢的工作體驗。
我們也實測了一下 V-Ray Benchmark 的性能表現(xiàn),GeForce RTX 4060 Ti 8G 獲得了 1360 分,可以應對一些中等規(guī)模的建模渲染需求。
得益于光追性能的提升,GeForce RTX 4060 Ti 8G 在 V-Ray GPU RTX 中的分數(shù)也提高到了 1919 分,也能應付一些中等負載的光追建模渲染需求。
我們還測試了一下 GeForce RTX 4060 Ti 8G 在 Blender 中的性能,實測結果如下,能看出 GeForce RTX 4060 Ti 8G 對于這種建模工作有非常好的加速效果。
在視頻后期這一塊,GeForce RTX 4060 Ti 8G 同樣配備了 NVENC 編碼器。并且 RTX 4060 Ti 8G 也支持下一代視頻編碼技術 AV1,AV1 能夠在占用相同空間情況下,提供更加快速的視頻編碼和更高質(zhì)量的流媒體傳輸性能。隨著各大視頻平臺希望節(jié)約服務器流量費用,AV1 編碼必將成為未來的主流編碼方式。
我們做了一個小實驗。在剪映專業(yè)版中,導出一個相同分辨率相同碼率的視頻,一個編碼協(xié)議選擇傳統(tǒng)的 H264, 一個選擇下一代的 AV1 編碼,結果 H264 編碼的體積為 140M,AV1 編碼的體積僅 106M,在保證畫質(zhì)的前提下體積小了非常多。
并且筆者還發(fā)現(xiàn),支持 AV1 編解碼的 GeForce RTX 4060 Ti 8G 導出這個視頻可以通過顯卡加速,僅需 8 秒即可完成壓制。
而 GeForce RTX 3060 Ti 就不支持 AV1 編碼硬解了,只能用 CPU 軟解,導出時間長達 1 分 26 秒,花費時間長了幾十倍。可以說,RTX 40 系列 GPU 是視頻工作者們“戰(zhàn)未來”的利器。
IT之家還為大家測試了 PugetBench For Adobe 全家桶,看看它能否勝任視頻剪輯工作。實測 GeForce RTX 4060 Ti 8G 在創(chuàng)意工作者們常用的 Adobe Premiere 中,我們開啟 GPU Cuda 加速,然后使用 PugetBenchmark 進行測試。最終得分為 1188 分,瀏覽時間線上的 4K 視頻毫無壓力。
另外一款壓力更大的視頻特效軟件 Adobe Effects 中,我們同樣使用 PugetBenchmark 進行測試。最終得分為 1504 分,能用來制作一些比較復雜的視效。
除了視頻內(nèi)容生產(chǎn)以外,在視頻內(nèi)容消費領域 RTX 4060 Ti 8G 也提供了 RTX VSR 技術。全稱為 RTX Video Super Resolution(RTX 視頻超分辨率技術)。它可以通過 GPU 的 AI 計算,至多將在線 1080P 視頻提升到 4K 分辨率,實現(xiàn)提高清晰度的效果,目前這一技術已經(jīng)適配了 Chrome 瀏覽器和 Edge 瀏覽器,以及本地播放器 VLC。
RTX 視頻超分辨率的使用非常簡單,只要將 RTX 30 系列 / 40 系列的驅(qū)動程序更新到最新版本,并將 Chrome / Edge 瀏覽器也更新到最新版本便可以啟用。啟用路徑為:NVIDIA 控制面板 —— 視頻 —— 調(diào)整視頻圖像設置。此選項框下有四個檔位可選。檔位越高超分辨率效果更明顯,但也會消耗更多的 GPU 資源。
目前它已支持國內(nèi)的主流視頻平臺(嗶哩嗶哩、斗魚和虎牙),以及一些國外的視頻平臺(Youtube、Twitch、Netflix、Hulu 和 Disney+)。同時它也支持本地視頻超分辨率。在下面的測試中,從最左邊的原生 480P 分辨率超分后,后面的 1-4 檔能看出更加清晰了,實際觀感媲美 4K。
↑ 從左至右依次為 480P、VSR1、VSR2、VSR3、VSR4
總結
在純理論性能上,NVIDIA GeForce RTX 4060 Ti 8G 相比于上一代的提升大概在 10% 左右。當然了,AI 時代正洶涌而來,在 DLSS 3 技術的幫助下,3A 大作的幀數(shù)可輕松實現(xiàn)翻倍的提升。雖然現(xiàn)在 DLSS 3 覆蓋的游戲只有數(shù)十款,但從 DLSS 2 適配的速度來看,我們離 DLSS 3 普及也不是很遠了。在我們的實際體驗中,RTX 4060 Ti 8G 能滿足 1080P 最高畫質(zhì)下百幀暢玩 3A 大作,電競游戲更是能以極高畫質(zhì)超低延遲運行,適合整機預算在 5000-7000 左右的玩家們裝機,也適合還在用 RTX 20 系及之前的老卡的玩家們升級。
價格方面,NVIDIA GeForce RTX 4060 Ti 8G FE 版的價格定在了 3199 元,預計非公版第三方的價格能來到 3000 以下,這對于新裝機的玩家們來說,會是一個不錯的選擇。如果想拿來做生產(chǎn)力的話,不放期待一下后續(xù)發(fā)售的 16G 大顯存版 NVIDIA GeForce RTX 4060 Ti。
廣告聲明:文內(nèi)含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。