2023 年 11 月 28 日,龍芯在北京國家會(huì)議中心舉辦了 2023 年產(chǎn)品發(fā)布暨用戶大會(huì),大會(huì)以“到中流擊水”為主題,現(xiàn)場發(fā)布了新一代通用處理器龍芯 3A6000、打印機(jī)主控芯片龍芯 2P0500 重磅成果,并對外公布龍芯處理器核 IP 及龍芯自主指令系統(tǒng)架構(gòu)授權(quán)計(jì)劃。
整體來看,這場發(fā)布會(huì)的絕對主角,無疑還得是全新的龍芯 3A6000 處理器。龍芯從誕生到今天一直在致力于推進(jìn) CPU 半導(dǎo)體的國產(chǎn)化和自主可控,二十多年辛苦不尋常,到這次龍芯 3A6000 的推出,可以說真正達(dá)到了一個(gè)關(guān)鍵的里程碑。
龍芯 3A6000,國產(chǎn)自主 CPU 的一個(gè)里程碑
龍芯 3A6000 最重要的創(chuàng)新點(diǎn)就在于它采用的完全自主設(shè)計(jì)的 LoongArch 龍架構(gòu)指令集。這是龍芯在 2020 年基于二十年 CPU 研發(fā)和生態(tài)建設(shè)積累推出的指令系統(tǒng),包括基礎(chǔ)架構(gòu)部分和向量指令、虛擬化、二進(jìn)制翻譯等擴(kuò)展部分,有近 2000 條指令,并且是按照先進(jìn)性、擴(kuò)展性、要求從頭定義的,不含國外授權(quán)。
具體來說,LoongArch 指令系統(tǒng)從整個(gè)架構(gòu)的頂層規(guī)劃到各部分的功能定義再到細(xì)節(jié)上每條指令的編碼、名稱、含義,都在架構(gòu)上進(jìn)行了自主重新設(shè)計(jì),具有充分的自主性。
基于 LoongArch 指令系統(tǒng),龍芯設(shè)計(jì)了自主的 CPU 微架構(gòu),第一代是 GS464,主要用于 3A1000、3B1500 處理器,第二代為 GS464E,對應(yīng)的處理器為 3A2000 和 3A3000,第三代則為 GS464V / LA464,用在 3A4000 和 3A5000 處理器上。
而這次龍芯 3A6000 采用的是第四代微架構(gòu) LA664,這一代架構(gòu)設(shè)計(jì)將發(fā)射寬度從 4 發(fā)射增加到 6 發(fā)射,ROB 項(xiàng)數(shù)提升到了 256,定點(diǎn)和向量物理寄存器都從上一代的 128 增加到了 192,發(fā)射隊(duì)列項(xiàng)數(shù)、功能部件數(shù)、load 隊(duì)列項(xiàng)數(shù)和 store 隊(duì)列項(xiàng)數(shù)也都有明顯增加。
整體來說,龍芯微架構(gòu)的演進(jìn)節(jié)奏采用的是 Tock-Tick 的策略,先進(jìn)行微結(jié)構(gòu)優(yōu)化,然后在進(jìn)行工藝升級,相當(dāng)于英特爾過去 Tick-Tock 策略換了個(gè)順序。這種先優(yōu)化軟件再提升工藝的思路,好處就是可以盡可能壓榨出每一代工藝的性能上限,在當(dāng)前國產(chǎn)半導(dǎo)體制程工藝提升受限的背景下其實(shí)也是非常正確的策略。
另外在 LA664 架構(gòu)上,龍芯也實(shí)現(xiàn)了同時(shí)多線程技術(shù)(SMT),CPU 核心在同一時(shí)刻運(yùn)行多個(gè)線程,單位時(shí)間內(nèi)可以執(zhí)行多個(gè)線程的更多指令,這也讓 3A6000 在相同工藝下性能比上一代產(chǎn)品大幅提高。
總體來說,龍芯 3A6000 是 4 核 8 線程,主頻為 2.3GHz-2.5GHz,峰值運(yùn)算速度為 240GFlops,每個(gè)核心包含 64KB 一級指令緩存和 64KB 一級數(shù)據(jù)緩存,256KB 二級緩存和 16MB 三級緩存,擁有 2 個(gè) 72 位 DDR4-3200 內(nèi)存控制器,實(shí)測帶寬超過 42GB/s,I / O 方面包含 1 個(gè) HyperTransport 3.0 控制器、1 個(gè) SPI、1 個(gè) UART、2 個(gè) I2C、16 個(gè) GPIO 接口,封裝方面采用 35mm×35mm BGA 封裝,1190 個(gè)引腳,典型功耗為 40W@2.5GHz。
根據(jù)工業(yè)和信息化部電子第四研究院給出的測試,龍芯 3A6000 在 SPEC CPU 2006、SPEC CPU 2017、Stream、Unixbench 等多項(xiàng)測試中的表現(xiàn)都非常優(yōu)異,比如在 SPEC CPU 2006 INT 測試中的成績?yōu)?43.1,相比 3A5000 提升了 62%,在 SPEC CPU 2017 INT ratel 中的成績?yōu)?5.05,相比 3A5000 提升了 45%。這樣的性能提升幅度在整個(gè) CPU 領(lǐng)域都是很少見的。
整體而言,根據(jù)龍芯的介紹,龍芯 3A6000 處理器的綜合性能已經(jīng)能趕上英特爾 2020 年推出的第 10 代酷睿 i3-10100 四核處理器的水平。
根據(jù)龍芯中科董事長胡偉武的介紹,龍芯在 2013 年曾做過反思,自主 CPU 與國外先進(jìn)水平的核心差距到底在哪里?
是通用處理能力不行還是專用處理能力不行?龍芯認(rèn)為是通用處理能力。
是單核性能不足還是核數(shù)不夠?龍芯認(rèn)為是單核性能不足,因?yàn)橐蝗盒W(xué)生談不上人多力量大。
是設(shè)計(jì)能力不行還是工藝不行?龍芯認(rèn)為重點(diǎn)是設(shè)計(jì)能力不行。
沿著上述反思的思路,龍芯開啟了通用處理器的“補(bǔ)課”征程,成果自然也是可喜的,要知道,2002 年推出的龍芯 1 號與市場主流產(chǎn)品性能相差有 20 多倍,而到 2021 年推出的龍芯 3A5000,與市場主流產(chǎn)品性能相差已經(jīng)不到 1 倍,再到這次龍芯 3A6000 處理器,和當(dāng)今主流產(chǎn)品的差距已經(jīng)基本全部補(bǔ)齊。
因此,將龍芯 3A6000 視為國產(chǎn)自主 CPU 的一個(gè)里程碑,并不為過。
軟件生態(tài)建設(shè)和體驗(yàn):讓人充滿期待
前面我們主要說了龍芯 3A6000 的硬件,而圍繞龍芯 3A6000 的基礎(chǔ)軟件生態(tài)體系建設(shè),其實(shí)也取得了不俗的成果。
說到軟件體系的建設(shè),重點(diǎn)還是在龍芯自主設(shè)計(jì)的 LoongArch 龍架構(gòu)的兼容和適配性上。根據(jù)龍芯的介紹,目前龍架構(gòu)已經(jīng)得到了國際開源軟件的認(rèn)可和支持,包括開源軟件基石 Linux 內(nèi)核持續(xù)支持龍芯全系列 CPU 和橋片,開源世界兩大支柱性編譯器 GCC / LLVM 也支持 LoongArch 全量指令集和特性,新興與傳統(tǒng)編程語言 Rust、Golang、 Pascal 等也都能全面支持 LoongArch 等等,總之可以基于 LA 架構(gòu)的國際開源軟件直接構(gòu)建出完整的操作系統(tǒng),這也是一個(gè)重要的里程碑。同時(shí)部分國外基礎(chǔ)軟件企業(yè)也推出了龍架構(gòu)版本,如 Codesys。
更重要的是,龍架構(gòu)也得到了國內(nèi)操作系統(tǒng)和基礎(chǔ)應(yīng)用的認(rèn)可和支持,比如 Loongnix、統(tǒng)信、麒麟、歐拉、龍蜥、開源鴻蒙等操作系統(tǒng)都已經(jīng)能夠支持龍架構(gòu),還有 WPS、微信、QQ、釘釘、騰訊會(huì)議、美圖、搜狗輸入法等基礎(chǔ)應(yīng)用,也都有對應(yīng)的版本。LoongArch 已經(jīng)逐漸建成與 X86 以及 ARM 并列的基礎(chǔ)軟件體系。
此外,LoongArch 架構(gòu)還獲得了國際開源軟件生態(tài)中的身份編號,擁有編號為 258 的專屬指令集架構(gòu)標(biāo)識,即 ELF 可執(zhí)行文件的 e_machine 編號,所有軟件中都會(huì)嵌入對應(yīng)的指令架構(gòu)身份編號。
除了積極推進(jìn) LoongArch 架構(gòu)原生應(yīng)用生態(tài)的建設(shè),對于目前市面上最主流的 X86 生態(tài),龍芯也通過主動(dòng)的兼容策略來讓 X86 應(yīng)用能夠運(yùn)行在 LoongArch 架構(gòu)上,即通過二進(jìn)制翻譯的方式運(yùn)行 X86 運(yùn)用,目前使用這一策略可以運(yùn)行絕大多數(shù) X86 / Linux 應(yīng)用,包括辦公、EDA、娛樂軟件等都能獲得流暢的用戶體驗(yàn),比如可以在龍芯服務(wù)器上運(yùn)行主流商業(yè) EDA 軟件。
同時(shí)對于 X86 / Windows 應(yīng)用,也仍在持續(xù)改進(jìn)中,龍芯稱爭取在 1-2 年后在龍芯平臺上運(yùn)行絕大多數(shù) X86 / Windows 應(yīng)用,走向商用市場,并且下一代龍芯處理器還會(huì)完善對二進(jìn)制翻譯的支持,如 X87 的 80 位浮點(diǎn)指令,盡管這樣可能會(huì)損失一定的應(yīng)用執(zhí)行性能(官方稱最高大約損失 20%),但還是那句話:能運(yùn)行總比沒有好。
最后,對于龍芯 3A6000 在終端設(shè)備中運(yùn)行系統(tǒng)和軟件的實(shí)際體驗(yàn),IT之家也在這次龍芯發(fā)布會(huì)的展示區(qū)域進(jìn)行了體驗(yàn)。比如小編在一臺搭載龍芯 3A6000 處理器,內(nèi)存為 DDR4 8GB、256GB SSD 的國光龍芯瘦客戶機(jī)上做了測試,這臺主機(jī)運(yùn)行的是銀河麒麟操作系統(tǒng),小編嘗試用系統(tǒng)自帶的瀏覽器打開 20 多個(gè)網(wǎng)頁,然后同時(shí)運(yùn)行 QQ、百度網(wǎng)盤、迅雷、系統(tǒng)應(yīng)用商店等軟件,并在本地播放一段 1080P 分辨率的視頻,在不同的軟件之間切換、使用等都可以很流暢地進(jìn)行,一點(diǎn)也沒有卡頓的感覺。
另外,小編還在一臺搭載龍芯 3A6000 處理器、運(yùn)行統(tǒng)信 UOS 系統(tǒng)的臺式終端上進(jìn)行了體驗(yàn),值得一提的事,在統(tǒng)信 UOS 系統(tǒng)的自帶應(yīng)用商店里,會(huì)標(biāo)明該軟件可以下載 LoongArch 架構(gòu)原生版或是 Windows 版本,如果是下載 Windows 版本,則會(huì)以二進(jìn)制翻譯的方式運(yùn)行。
小編在這臺主機(jī)上先后運(yùn)行了大小 10MB 左右的《WPS 文字》文檔和《WPS》 PPT 文檔,整個(gè)體驗(yàn)也非常流暢,翻動(dòng)頁面、進(jìn)行一些功能操作等都沒有卡頓感。
小編還分別體驗(yàn)了原生版本的 QQ 和微信,其中 QQ 的軟件功能比較齊全,聊天、空間、郵箱甚至短視頻等功能都有,但微信的功能目前相對簡單,基本只有聊天功能,體驗(yàn)上還有待微信方面進(jìn)一步完善。
還有在游戲方面,IT之家還在現(xiàn)場看到搭載龍芯 3A6000 處理器、AMD 獨(dú)顯、運(yùn)行統(tǒng)信 UOS 系統(tǒng)的攀升主機(jī)流暢運(yùn)行云原神,云原神客戶端是 Windows 版本通過二進(jìn)制轉(zhuǎn)譯運(yùn)行,此外還有死亡細(xì)胞、魔獸世界懷舊服等游戲,也都可以很流暢的運(yùn)行。
綜上可見,龍芯 3A6000 在硬件性能和軟件生態(tài)體驗(yàn)方面確實(shí)已經(jīng)達(dá)到了一個(gè)能夠讓人滿意甚至驚艷的程度,這無疑會(huì)讓人們對龍芯乃至國產(chǎn)自主 CPU 的未來發(fā)展充滿期待。
龍芯第四代產(chǎn)品“三劍客”,和茁壯成長的產(chǎn)業(yè)生態(tài)
除了 3A6000,龍芯今年重點(diǎn)發(fā)展的還有龍芯 3C / D / E6000 服務(wù)器 CPU 和龍芯 2K3000 移動(dòng)終端 CPU,他們并稱龍芯第四代產(chǎn)品的“三劍客”。
其中龍芯 3C6000 目前已經(jīng)完成了設(shè)計(jì),單硅片 16 核 32 線程,基于 LA664 架構(gòu),通用處理性能成倍提升,同時(shí)支持 DDR4-3200x4 內(nèi)存,訪存帶寬比上一代 3C5000 成倍提高,還支持 PCIe4x64,IO 性能比上一代 3C5000 成數(shù)量級提高,支持高性能國密標(biāo)準(zhǔn)加解密算法,SM4 帶寬大于 30Gbps。
此外,龍芯 3C6000 還支持“龍鏈技術(shù)”,這項(xiàng)技術(shù)和英偉達(dá) NVLink 以及英特爾 CXL 技術(shù)類似,可實(shí)現(xiàn)芯片組件(Chiplet)的連接,相比過去 3A5000 的片間互聯(lián)協(xié)議,延遲成倍降低,帶寬提高了好幾倍,大大提高多片協(xié)同工作的性能。龍鏈跟 nvlink 比,速率還低一些(目前每位速率是 16Gbps,下一步將提高到 32Gbps),但已經(jīng)不錯(cuò)了。
重要的是,龍鏈技術(shù)基于的事全自研的物理接口,兼容 PCIe 電氣標(biāo)準(zhǔn),硅間、片間互連可切換,完全可以自主掌握。
至于 3D6000 和 3E6000,則可以通過龍鏈技術(shù)分別將兩顆、四顆 3C6000 連接在一起得到。
此外,面向筆記本 / 云終端的 2K3000,目前也已經(jīng)完成了前端設(shè)計(jì),這是八核單硅片,具有極高的性價(jià)比,8 個(gè) LA364 處理器核中,單核性能可達(dá)到 3A5000 的水平。
同時(shí)值得關(guān)注的是,2K3000 還集成了 LG200 GPU 核心,支持 OpenGL4.0 圖形加速、OpenCL3.0 科學(xué)計(jì)算加速,還內(nèi)置了 INT8 張量計(jì)算加速部件,可進(jìn)行 AI 加速,單節(jié)點(diǎn)達(dá)到 256GFlops-1TFlops,支持多節(jié)點(diǎn)互聯(lián)。
還有就是,根據(jù)龍芯給出的線路圖,2025 年將會(huì)有面向桌面級的 3B7000 和面向服務(wù)器的 3D / E7000。都是基于 LA664 架構(gòu)的升級。
從龍芯第四代“三劍客”產(chǎn)品線的全面鋪設(shè),小編又想到龍芯在自主 CPU 生態(tài)建設(shè)方面取得的成果,畢竟產(chǎn)品再好,也需要生態(tài)的支持。
別的不說,單說這次龍芯 3A6000 處理器發(fā)布后,現(xiàn)場就有 50 多家合作伙伴進(jìn)行了龍芯 3A6000 整機(jī)產(chǎn)品的發(fā)布儀式,其中不乏華碩、雷神、方正、同方、聯(lián)想、攀升等我們耳熟能詳?shù)钠放?。在現(xiàn)場聽著一長串用實(shí)際產(chǎn)品響應(yīng)龍芯生態(tài)建設(shè)的合作伙伴品牌名字,小編才真正切實(shí)感受到龍芯在做的事情不是我們在新聞里聽到的各種心潮澎湃,而是腳踏實(shí)地落在實(shí)處、落在商用端的產(chǎn)品,這才是讓龍芯能持續(xù)往前走的關(guān)鍵。
不僅如此,為了進(jìn)一步擴(kuò)大 LoongArch 架構(gòu)指令集的覆蓋范圍,龍芯還選擇了將龍芯 CPU IP 核開放授權(quán),首批開放的 IP 核包括 LA132、LA264、LA364 三種核心,通過這樣共享、共建的方式構(gòu)建龍架構(gòu)生態(tài),進(jìn)行龍芯 IP 授權(quán),而且一次性授權(quán)且永不收版稅,即“賣芯片不收提成”,且無需對被授權(quán)企業(yè)進(jìn)行審計(jì)。相信這些措施都有助于龍架構(gòu)芯片生態(tài)的快速建設(shè)。同時(shí),龍芯表示未來還可能會(huì)開放龍架構(gòu)指令集,足見他們的開放姿態(tài)。
在這次大會(huì)上,就已經(jīng)有蘇州雄立科技有限公司、大唐可再生能源試驗(yàn)研究院有限公司、得一微電子股份有限公司、山東領(lǐng)能電子科技有限公司、三峽智控科技有限公司、國家超級計(jì)算無錫中心、北京得瑞領(lǐng)新科技有限公司、北京科技大學(xué)工業(yè)互聯(lián)網(wǎng)研究院、西安微電子技術(shù)研究所、北方自動(dòng)控制技術(shù)研究所共 10 家企業(yè)在發(fā)布會(huì)上與龍芯中科簽署合作協(xié)議,使用基于龍架構(gòu)的 CPU 核設(shè)計(jì)超算芯片、專用控制芯片、存儲芯片等多種 SOC 芯片。
從小小的課題組到今天,只因一個(gè)信念
相信通過上述的介紹和解讀,大家在驚艷于龍芯在自主 CPU 硬件、軟件、生態(tài)建設(shè)方面取得出色成果的同時(shí),也會(huì)感嘆國內(nèi)半導(dǎo)體產(chǎn)業(yè)在擺脫受制于人的處境上又前進(jìn)了一大步。
事實(shí)上,作為國產(chǎn) CPU 的代表,龍芯從一開始就是為“中國人有自己的 CPU 造計(jì)算機(jī)”而誕生的。
龍芯最初誕生于中科院計(jì)算所知識創(chuàng)新工程支持下的龍芯課題組,而如今作為龍芯中科董事長的胡偉武,就是當(dāng)年這個(gè)課題組最初的發(fā)起人。2000 年,在中科院計(jì)算所所長李國杰院士的直接推動(dòng),龍芯課題組開啟了自主設(shè)計(jì) CPU 的工作,盡管項(xiàng)目啟動(dòng)資金只有 1000 萬元,但他們還是克服種種困難,在一枚完全自主設(shè)計(jì)、研發(fā)的通用 CPU 龍芯 1 號上成功跑起了 LINUX 系統(tǒng)。
2002 年 9 月 22 日,龍芯 1 號通過了中國科學(xué)院組織的鑒定,9 月 28 日,龍芯 1 號發(fā)布會(huì)召開,這標(biāo)志著中國計(jì)算機(jī)產(chǎn)業(yè)“無芯”歷史的終結(jié)。
2003 年 10 月 17 日,龍芯 2 號首片 MZD110 流片成功,次年,9 月 28 日,經(jīng)過多次改進(jìn)后的龍芯 2C 芯片 DXP100 流片成功。然后在 2005 年 4 月 18 日,龍芯 2 號芯片的發(fā)布會(huì)召開。
2010 年對龍芯來說是比較特別的一年,龍芯就成立了龍芯中科技術(shù)有限公司,標(biāo)志他們開始市場化運(yùn)作,全面走向產(chǎn)業(yè)化。
2010 年 9 月,龍芯大 CPU 系列的首款多核處理器產(chǎn)品 —— 龍芯 3A 開始量產(chǎn)。到今天,龍芯已經(jīng)形成了由龍芯 1 號、2 號、3 號三個(gè)系列處理器和龍芯橋片系列構(gòu)成的完善的產(chǎn)品體系,并且對應(yīng)的軟硬件和產(chǎn)業(yè)生態(tài)也在茁壯成長。
當(dāng)然,在耀眼成果的背后,往往是各種不為人知的艱難和危機(jī),以及誓為“CPU 自主化”奉獻(xiàn)一切的熱情和克服困難的勇氣與堅(jiān)韌。
比如從 2001 年到 2010 年的時(shí)間里,龍芯的研發(fā)經(jīng)費(fèi)投入超過 4 億元,在一些領(lǐng)域有突破,但整體成果卻并不顯著,因此龍芯不得不面對社會(huì)的種種質(zhì)疑,甚至一些部門機(jī)構(gòu)不再支持自主 CPU 芯片的研發(fā)。根據(jù)胡偉武的回憶,在 2009 年、10 年前后國家重大專項(xiàng)經(jīng)費(fèi)到的時(shí)候,龍芯已經(jīng)欠下計(jì)算所七八千萬了。
在此背景下,龍芯投向市場化、產(chǎn)業(yè)化運(yùn)作就成了必須要考慮的事情。但投入市場化運(yùn)營,就意味著龍芯的團(tuán)隊(duì)要放棄原來的事業(yè)編制,從中科院計(jì)算所辭職下海,這無疑是一條破釜沉舟的道路。而且在成立市場化企業(yè)的初期,資金依然是頭等難題,胡偉武四處籌借,才能把公司成立起來。后來北京市政府牽頭投資 1 億元帶動(dòng)民營企業(yè)跟投 1 億元才暫時(shí)解決了融資難題。
還有再比如 2018 年前后,龍芯當(dāng)時(shí)使用的美國 MIPS 指令系統(tǒng)由于其背后公司多次被收購、易主,輾轉(zhuǎn)于不同企業(yè)之間,加上西方國家對中國半導(dǎo)體產(chǎn)業(yè)的阻撓,致使 MIPS 在中國市場的支持力度和開發(fā)可持續(xù)性都受到了很大的影響。這讓龍芯意識到,“建筑地基”自主可控的重要性,但是更換指令系統(tǒng)對于半導(dǎo)體企業(yè)來說是一件風(fēng)險(xiǎn)極大的事情,胡偉武為此茶不思飯不想地糾結(jié)了很長時(shí)間,最終下定決定,并在 2020 年正式用上了自主研發(fā)的 LoongArch 指令系統(tǒng),真正做到了從地基到上層建筑完全的自主可控……
試想,在這些困難和風(fēng)險(xiǎn)面前,如果沒有一份信念和執(zhí)著,也許就沒有今天我們看到的龍芯 3A6000 的突破,還有整個(gè)龍芯產(chǎn)業(yè)生態(tài)的壯大。
就像龍芯所說的,這樣的生態(tài)是一個(gè)獨(dú)立于 X86 體系和 ARM 體系的第三套新型信息技術(shù)體系和產(chǎn)業(yè)生態(tài),也就是“龍?bào)w系”。
盡管了解半導(dǎo)體產(chǎn)業(yè)的朋友都知道,這樣一個(gè)大廈的建成可謂“路漫漫其修遠(yuǎn)”,但我們相信龍芯就像不知疲倦的飛鳥,只要眼里看著遠(yuǎn)方,翅膀還在振動(dòng),就總有飛越滄海的那一刻。
最后,再分享一個(gè)讓小編頗受感動(dòng)和思索的細(xì)節(jié),就是去年,胡偉武在接受央視面對面欄目采訪時(shí),主持人問他“你希望未來人們提到龍芯的時(shí)候會(huì)是怎樣一種評價(jià)?”胡偉武的回答是:
我希望首先人們買電腦的時(shí)候,買龍芯不是因?yàn)橐С肿灾鳎腔谛詢r(jià)比的考慮,就是因?yàn)橄矚g它,這樣我們的生態(tài)才能做成。
是啊,一句“消費(fèi)者(或客戶)喜歡”抵過所有宏大命題下的千言萬語,更是所有“自主化”的終極目標(biāo)。如果這不能解釋龍芯驚艷于世的原因,那還有什么可以解釋呢?
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。