就在上周,摩爾線程舉行了 2022 秋季發(fā)布會,推出了首款支持 Windows 環(huán)境和 DirectX 圖形接口的國產(chǎn)顯卡產(chǎn)品 MTTS80、全新多功能 GPU 芯片“春曉”、面向服務(wù)器應(yīng)用的 MTT S3000,以及元計算一體機 MCCX。
筆者一開始以為,這次會是一場“PPT 發(fā)布會”。因為這次摩爾線程的步子實在邁的太大。但沒想到就在一周后,這張 MTT S80 實實在在的擺在了IT之家的桌面上,而且是裝上主機就可以在 Windows 下使用,并不需要復(fù)雜的調(diào)試。
在本文中,我們就來看看這張 MTT S80,為國產(chǎn)顯卡的發(fā)展邁出了怎樣的一步吧。測試配置如下:
外觀設(shè)計
摩爾線程 MTT S80 的包裝設(shè)計很是獨特,上面國畫風(fēng)的線條圖案彰顯著它國產(chǎn)顯卡的賣點。說來這也是IT之家第一次測試國產(chǎn)顯卡,頗有紀念價值。
包裝內(nèi)除了顯卡本體外,有一本非常簡單的說明書,以及一根雙 PCIe 8Pin 轉(zhuǎn) CPU 8Pin 線。之所以說明書如此簡單,是因為它的安裝方法與正常顯卡無異,裝上去,打開 Windows,安裝驅(qū)動,完事。
MTT S80 顯卡本體的設(shè)計水平相當(dāng)高。整體設(shè)計方正,金屬風(fēng)滿滿。外殼采用了一體式設(shè)計,并使用鋁合金壓鑄 + CNC 工藝,極大的提升了顯卡的整體結(jié)構(gòu)強度,不用顯卡支架也不用擔(dān)心變形。散熱部分采用 3 風(fēng)扇設(shè)計,2 個 8cm 風(fēng)扇加上中間的 7cm 風(fēng)扇構(gòu)成了中心對稱的整體布局。
兩側(cè)的風(fēng)扇外緣被兩條弧線包裹,其靈感來源是數(shù)學(xué)中常見的雙曲函數(shù),與中間圓形 RGB 風(fēng)扇交相輝映,很有設(shè)計感。這的 3 組風(fēng)扇均支持智能調(diào)速,在保證 GPU 穩(wěn)定工作的同時,還能提供一個安靜的使用體驗。
背板有一整塊金屬保護,中間有一個摩爾線程 LOGO,右側(cè)通風(fēng)孔在通電后還會點亮,觀感非??犰拧?/p>
最炫酷的莫過于中間的橙色光環(huán)了,點亮后猶如噴薄的火山口,帶來無窮的能量。
從顯卡側(cè)面可以看到 S80 密集的散熱鰭片,同時使用了 4 根 6mm 熱管貫穿散熱片整體,幫助熱量從 GPU 芯片和顯存上盡快傳遞到散熱鰭片上。
最棒的設(shè)計莫過于側(cè)面的 8Pin 電源接口了,雖然這會導(dǎo)致需要更大的機箱才能兼容,但也使得機箱正面觀感變得更簡潔美觀。
側(cè)面接口部分,采用了目前高端顯卡才配備的 3 個 DP1.4a 和一個 HDMI2.1 接口,可以支持最高 8K 的視頻輸出。
最后需要注意的是,MTT S80 是首批使用 PCIe 5.0 接口的顯卡,也是一款支持 PCIe 5.0*16 接口的顯卡,這意味著最好搭配比較新的主板才能實現(xiàn)最好的接口性能。所以摩爾線程京東旗艦店會選擇以 2999 搭一個華碩 B660M 主板的方式進行售賣。
架構(gòu)解析
摩爾線程 MTT S80 搭載了一顆基于 MUSA 架構(gòu)的多功能 GPU 芯片“春曉”,相較于摩爾線程在今年 3 月發(fā)布的“蘇堤”,“春曉”內(nèi)置的四大計算引擎全面升級,可以同時支持圖形圖像渲染、8K 視頻編解碼、AI 訓(xùn)練和推理、通用計算、GPU 虛擬化、物理仿真等多種功能。
核心參數(shù)方面,MTT S80 基于臺積電 7nm 工藝打造,擁有 4096 個 MUSA 核心,主頻 1.8GHz、16GB GDDR6 顯存,顯存位寬 256bit,核心內(nèi)集成了 220 億個晶體管,內(nèi)置 MUSA 架構(gòu)通用計算核心以及張量計算核心,可以支持 FP32、FP16 和 INT8 等計算精度。
我們也對 MTT S80 進行了拆解,整張卡的拆解非常簡單,擰開所有可見的螺絲就可以取下背板和擋板。內(nèi)部做工是相當(dāng)規(guī)整的,顯存為 8 顆三星 GDDR6 閃存,每顆 2GB,組成了 16GB 的大顯存。
核心代號為 SD102AA-500,基于摩爾線程的 GPU 芯片“春曉”打造。
MTT S80 最特別的地方在于,它是國內(nèi)率先支持 Windows 環(huán)境和 DirectX 圖形接口的 GPU。發(fā)布會上摩爾線程表示,目前 MTT S80 的 Windows 驅(qū)動已經(jīng)內(nèi)置了 MUSA DirectX Driver 模塊,并已完成對《暗黑破壞神 3》、《英雄聯(lián)盟》和《穿越火線》等十多款游戲完成適配,還有更多游戲可以運行,但還在適配過程中。不過至于是否真的如它所說,我們接下來就實測一下。
理論性能
首先我們進行一下理論性能測試。但在測試前,我們發(fā)現(xiàn):MTT S80 的確是支持 Windows 和 DirectX 環(huán)境,在硬件層面能夠支持 DirectX 11,但目前驅(qū)動還未完成全部功能模塊的開發(fā),因此目前只支持 DirectX 9,目前大部分的跑分軟件都是基于 DirectX 11/12 的。所以常規(guī)的測試我們就不能進行了,只能另尋辦法。
在 Windows 環(huán)境下有一款可以測試 DX9 性能的軟件 ——Unigine Valley BenchMark 1.0,在這款軟件中,MTT S80 獲得了 2302 分的成績。
我們在 Unigine 官網(wǎng)查詢排行榜,可以看出在這個項目中 MTT S80 能達到 GTX 1060 6G 的水平。
像素填充率和紋理填充率也是評價顯卡性能的重要指標(biāo)。像素填充率指的是 GPU 在一秒內(nèi)可以渲染到屏幕并寫入顯示存儲器的像素數(shù)量,我們用使用 Fillrate Tester 實測 MTT S80 的像素填充率 FFP - Single texture 成績?yōu)?188 GPixel / s。作為對比,RTX 3060 的像素填充率為 85.30 GPixel / s,RTX 3080Ti 的像素填充率為 186.5 GPixel / s。
紋理填充率指的是 GPU 可以在一秒內(nèi)映射到像素的紋理貼圖元素的數(shù)量。我們可以用 3DMark 06 來進行測試。最終 Multi-Texturing 最高為 170 GPixel / s,作為對比,RTX 3060 的紋理填充率為 199.0 GTexel / s。RTX 3050 的紋理填充率為 142.2 GTexel / s。之所以不同項目間差距懸殊,是因為目前驅(qū)動還未對 CPU 多線程進行優(yōu)化,因此圖形負載越重,MTT S80 表現(xiàn)就越好。一旦未來驅(qū)動優(yōu)化完成,MTT S80 的性能表現(xiàn)會有進一步提升。
除了上面兩款測試外,Windows 平臺就沒有太多跑分軟件了。所以我們轉(zhuǎn)戰(zhàn) Linux 平臺,在 Ubuntu 下看看還能不能測出一些數(shù)據(jù)。我們試試看使用 clpeak,測試它的顯存帶寬以及單精度浮點(FP32)性能。最終測出來的數(shù)據(jù)如下:顯存帶寬最大為 365 Gbps、單精度浮點最大為 13.9 TFLOPS。
這大概是一個什么水平呢?以下是桌面端 RTX 3060 12G 的理論性能,MTT S80 的顯存帶寬和浮點性能都比 RTX 3060 略高一點點。
前面我們有提到,MTT S80 是首款支持 PCIe 5.0 的國產(chǎn)顯卡,因此我們也測試了一下它的 PCIe 帶寬,我們在 Ubuntu 下使用 OCL Bandwidth Test 進行接口上下行測試,實測上傳最大帶寬為 28G / s,下載最大帶寬為 32G / s,這個速度是目前大部分主流 PCIe 4.0 顯卡的兩倍??梢哉f MTT S80 是一張“戰(zhàn)未來”的顯卡了。
從上面我們的測試來看,MTT S80 在不考慮環(huán)境兼容性的情況下,純理論性能可以做到 RTX 3060-RTX 3060Ti 的水平。而在 Windows 環(huán)境下,由于驅(qū)動對 DirectX 和 OpenGL 環(huán)境還在努力適配,因此不同軟件中的性能差距很大??梢哉f摩爾線程 MTT S80 這次的硬件水平是相當(dāng)在線的,驅(qū)動適配雖然暫時跟不上主流水平,但也為國產(chǎn)顯卡開了一個好頭。
游戲體驗
前面我們有說過,MTT S80 是首款支持 Windows 和 DirectX 環(huán)境的國產(chǎn)顯卡,那么它的實際游戲體驗怎么樣?前面我們有提到,MTT S80 暫時只支持 DirectX 9 環(huán)境,所以我們只能選擇一些比較老,但是受眾廣泛的游戲來測試。以下游戲我們均開到 1080P 低畫質(zhì)運行。首先是《英雄聯(lián)盟》,達到了 140-150 幀,可以滿足電競級顯示器暢玩。
如果開到 1080P 高畫質(zhì),幀數(shù)則會來到平均 136 幀左右,同樣也能流暢游玩。
最后我們嘗試一下 2K 高畫質(zhì),平均幀數(shù)還能維持在 120 幀以上,表現(xiàn)很不錯了。
《QQ 飛車》默認鎖 30 幀,自然是可以暢玩。
《穿越火線》的平均幀數(shù)高達 180 幀,完全可以流暢游玩。
《暗黑破壞神 3》是摩爾線程在發(fā)布會上演示的游戲,我們實測下來也確實可以滿足 90-100 幀左右流暢游玩。
《我的世界》也得到了適配。但筆者發(fā)現(xiàn)網(wǎng)易版是打不開的,微軟版可以直接打開,但幀數(shù)在平均 40-50 幀左右,不算很流暢,但已經(jīng)可以玩了。
最后我們測試一下《CS:GO》,這款游戲玩起來還是很流暢的。我們運行 Benchmark 可以達到 213 幀左右的平均幀數(shù)。
從上述游戲的適配情況可以看出,摩爾線程目前的思路是優(yōu)先適配那些受眾廣泛的國民級游戲,來提高國產(chǎn)顯卡的接受程度,然后再回頭去適配那些精品的小眾游戲,這樣的發(fā)展思路無疑是正確的。
視頻編解碼
對于一款家用顯卡來說,不僅僅要能玩游戲,更要有出色的視頻編解碼能力。在發(fā)布會上摩爾線程表示,MTT S80 不僅支持 H.264、H.265 (HEVC),還加入了最新的 AV1 編解碼能力,并有三個 DP 1.4a 接口和一個 HDMI 2.1 接口,每個接口均可輸出 8K、4K 畫面。
筆者首先嘗試在油管打開一個 4K 的在線視頻,觀感是非常流暢的,沒有遇到編解碼不暢帶來的卡頓。從控制面板中可以看到,MTT S80 也被正常調(diào)用進行 GPU 加速了。
那么它的視頻編解碼性能和效率究竟如何呢?我們需要回到 Linux 環(huán)境下,使用 ffmpeg 工具調(diào)用 vappi 的硬件編解碼加速接口,選擇不同格式的碼流來進行測試,從我們的測試結(jié)果看,可以正常并行解碼多路 H.264、H.265、VP9 和 AV1 等格式的視頻,并且可以實現(xiàn)多路 H.264、H.265 的并行編碼,以及多種格式間的視頻轉(zhuǎn)碼。
我們準備了一個 1080p 的視頻 YUV 數(shù)據(jù),采用 H.265 進行多路編碼,為了盡量增加編碼器的壓力,測試時采用 9 路編碼并行,從測試結(jié)果可以看到每路的編碼的幀率為 183fps,總體性能超過 1080p1600fps。
另外我們也對解碼的性能做了些測試,多路壓測解碼 1080p 的視頻時,總幀率也可以超過 1200fps。如下是 VP9 格式的 1080p 視頻并行 10 路解碼時的單路性能,可以看到幀率為 122fps。
可以說,MTT S80 的視頻編解碼性能是在線非常強的,硬件能力上已經(jīng)打好了基礎(chǔ)。對于大部分內(nèi)容消費者們來說,買回來就可以直接用,看 4K HDR 視頻也毫無壓力。對于視頻創(chuàng)作者們來說,MTT S80 硬件的編碼能力也是很強的。但目前暫時沒有剪輯軟件適配。據(jù)摩爾線程內(nèi)部產(chǎn)品人士的反饋,目前他們正在積極與國內(nèi)外視頻編輯類軟件進行驅(qū)動和 API 適配,希望未來可以逐步滿足消費者視頻編輯的需求。摩爾線程能與一些國產(chǎn)剪輯軟件一起,推進剪輯軟件的適配。
AI 與計算
得益于全功能 MUSA 架構(gòu),MTT S80 還可以應(yīng)用在 AI 訓(xùn)練方面,比如開發(fā)者可以通過 MUSA 軟件棧將現(xiàn)有 AI 模型簡單、快捷的遷移到 MTT S80 上;兼容性方面,MTT S80 兼容 PyTorch、TensorFlow 等多種主流深度學(xué)習(xí)框架,并實現(xiàn)了對 Transformer、CNN、RNN 等數(shù)十類 AI 模型的優(yōu)化。
前面我們的測試中,MTT S80 的單精度浮點性能很強,因此在很吃單精度浮點性能的 AI 高精度推理上能展現(xiàn)強大的性能,滿足對數(shù)據(jù)計算精度要求極高的場景,如醫(yī)療、金融等應(yīng)用領(lǐng)域。比如 MTT S80 特別適配了醫(yī)療領(lǐng)域 AI 開源框架 MONAI,實現(xiàn)多種任務(wù)的高精度推理。
最大的黑科技還是“CUDA on MUSA”。為了降低用戶的遷移成本,摩爾線程專為使用 CUDA 語言的用戶開發(fā)了一套 CUDA ON MUSA 的兼容方案?;谀柧€程提供的 porting 工具,通過編譯與運行兩步就可以讓 CUDA 源碼運行在摩爾線程 MUSA 架構(gòu) GPU 上。
總結(jié):國產(chǎn)顯卡的一大步
從筆者今天的評測中能看出,MTT S80 的硬件性能已經(jīng)達到了主流甜品級的水平,這無疑是整個國產(chǎn)顯卡行業(yè)的一大步。但最大的難點還是在于后續(xù)如何開發(fā)驅(qū)動程序,由于計算機圖形的專業(yè)性非常強,全球能夠懂得開發(fā) Windows 驅(qū)動的人本來就少,其中大部分都集中于西方國家,在中國的專業(yè)人士屈指可數(shù)。處于初創(chuàng)階段的國內(nèi) GPU 企業(yè)需要快速推出市場化的 GPU 產(chǎn)品,但面臨的難題在于背景是芯片設(shè)計、底層驅(qū)動開發(fā)等關(guān)鍵領(lǐng)域人才匱乏、團隊缺少磨礪。所以開發(fā)通用 GPU 絕非易事。
即便是做了十幾年核顯,市場占有率第一的 intel,在進軍獨立顯卡市場時也遇到了驅(qū)動開發(fā)的挫折,更何況是對于一個初創(chuàng) 2 年的新玩家呢?國產(chǎn) GPU 想要做到對舊有軟件生態(tài)的兼容,無疑是一個漫長而艱難的過程。我們不得不承認,自主創(chuàng)新是一條非常艱難的路,但也是一條不得不走的路。最近美國一紙禁令,英偉達就不得不對中國斷供指定型號的 GPU 芯片,未來會發(fā)生什么樣的摩擦我們更是難以想象,所以我們必須做好充足的準備。
但我們今天也有幸看到,摩爾線程邁出了兼容主流平臺的第一步,就我們手上的這個 MTTS80 來說,對于大部分輕度使用的消費者們,買來直接插在 Windows 電腦上就可以用,看看視頻打打 LOL 啥的也沒問題,這無疑是值得慶幸的。但我們也應(yīng)當(dāng)理性看待,不能指望摩爾線程一步登天,直接做出主流級別的產(chǎn)品,因此筆者在評價摩爾線程 MTT S80 時,也給予了最大的鼓勵與寬容。當(dāng)然,還是希望摩爾線程能盡快推動各類游戲和應(yīng)用的適配,充分釋放這顆強大的核心,回應(yīng)整個國產(chǎn)行業(yè)的期待。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。