本周早些時(shí)候,《全球超算500強(qiáng)》正式公布了2016年上半年排行名單。原本以為會(huì)獲得“7連冠”的天河2號(hào),竟意外被趕超,且還是被另一國(guó)產(chǎn)超算給擊敗……如此的意料之外頓時(shí)讓中外媒體和小編們又一次沸騰。
實(shí)際上,筆者大概在去年的這個(gè)時(shí)候也寫(xiě)過(guò)一篇有關(guān)國(guó)產(chǎn)超算的文章,不過(guò)內(nèi)容主要是質(zhì)疑“天河2”連續(xù)五次蟬聯(lián)《全球超算500強(qiáng)》之意義所在。
當(dāng)時(shí)的觀點(diǎn)并非是認(rèn)為“天河系列”已沒(méi)有所謂的技術(shù)價(jià)值,而是想強(qiáng)調(diào):當(dāng)“天河1”于2010年10月首次擊敗美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的“美洲虎”超級(jí)計(jì)算機(jī)后,成功幫助國(guó)人在歷史上首奪“最快超算”之頭銜時(shí),“天河系列”的偉大使命實(shí)際上就已經(jīng)基本完成。
再之后的“天河2”連續(xù)蟬聯(lián),即使媒體用再多的篇幅去報(bào)道和渲染,也只能是徒增一些虛無(wú)飄渺的“自豪感”,而不能改變國(guó)產(chǎn)超算實(shí)際面臨的兩項(xiàng)殘酷事實(shí):1.最核心的技術(shù)仍依賴(lài)于美國(guó)——所以后來(lái)有了美國(guó)單方面宣布禁止向中國(guó)科研機(jī)構(gòu)出口Xeon CPU和Tesla GPU的新規(guī);2.美國(guó)已經(jīng)在研究下一代“百億億次級(jí)”(exascale)超算,能效標(biāo)準(zhǔn)遠(yuǎn)超當(dāng)前水平——所以我們眼下的領(lǐng)先,真的不能代表什么。
因此,基于我們一時(shí)半會(huì)兒在自主核心硬件上難以趕超美國(guó)的事實(shí),小編提出——將超算小型化、節(jié)能化和普及化會(huì)是一套更符合實(shí)際意義的做法,因?yàn)檫@能讓我們制造出更多可以榮登《綠色超算500強(qiáng)》榜單的中小型超算系統(tǒng),能讓更多的學(xué)校和科研機(jī)構(gòu)隨時(shí)隨意地用上屬于自己的超級(jí)計(jì)算機(jī)。實(shí)際上,這也是大國(guó)發(fā)展、科技興國(guó)的重要指標(biāo)之一。
然而萬(wàn)萬(wàn)沒(méi)有想到,時(shí)間僅過(guò)了一年,“神威太湖之光”的出現(xiàn)不僅確保了今年《綠色超算500強(qiáng)》前三甲的一個(gè)席位(過(guò)去中國(guó)大陸產(chǎn)超算從未登榜前十),更還一舉同時(shí)奪得了《全球超算500強(qiáng)》的冠軍頭銜,且完完全全用的是國(guó)產(chǎn)自主設(shè)計(jì)處理器(小編這里不用CPU一詞,是因?yàn)閺募軜?gòu)看已經(jīng)脫離了傳統(tǒng)CPU的概念,有點(diǎn)英特爾Xeon Phi加速協(xié)處理器的意思,后者也是美國(guó)禁售名單產(chǎn)品之一)。
這樣的成績(jī),在美國(guó)剛剛宣布對(duì)華禁售高性能處理器的大環(huán)境下,在苦苦掙扎也不愿配合大陸共同研發(fā)的臺(tái)灣半導(dǎo)體面前,簡(jiǎn)直等同于一次核爆,其意義遠(yuǎn)非“天河系列”繼續(xù)蟬聯(lián)“全球最強(qiáng)”所能比擬——當(dāng)然這里還是要再次澄清,小編沒(méi)有無(wú)視“天河”的價(jià)值,但用一套已掌握的技術(shù)標(biāo)準(zhǔn)來(lái)連續(xù)贏得競(jìng)爭(zhēng)對(duì)手現(xiàn)階段已不參與的角逐,真的已不再具備任何值得大篇幅渲染的意義。
不要將所有的“國(guó)產(chǎn)芯”都一視同仁
每每提到“國(guó)產(chǎn)芯”,總會(huì)有那么一群“不明真相”的網(wǎng)友要調(diào)侃、要嘲笑。不能怪他們,畢竟有過(guò)上海交大“漢芯事件”這樣的黑歷史,也有著“龍芯”過(guò)分高調(diào)而不討喜的事實(shí)。“少說(shuō)多做”一直是小編在評(píng)價(jià)“龍芯”時(shí)的觀點(diǎn),而“神威太湖之光”背后的“申威系列”處理器,就實(shí)實(shí)在在做到了這點(diǎn),所以今天他們成功了,并且一鳴驚人。
當(dāng)然,這里要插個(gè)畫(huà)外音,要為“龍芯”做一點(diǎn)解釋?zhuān)撼鲇谀承┰?,“龍芯”雖然受到國(guó)家重視,但卻是“自負(fù)盈虧”的放養(yǎng)模式。相比也是國(guó)家重點(diǎn)項(xiàng)目的“申威”,后者則得到了軍方的完全支持,因而無(wú)需擔(dān)憂(yōu)能否持續(xù)發(fā)展的問(wèn)題。所以從這個(gè)角度理解,我們不能怪“龍芯”的完全商業(yè)化,但是——少接受采訪、少吹噓性能、低調(diào)做產(chǎn)品就行了,夸大產(chǎn)品在特定測(cè)試環(huán)境下性能趕超歐美是沒(méi)有意義的,因?yàn)椤褒埿尽倍ㄎ坏氖峭ㄓ糜?jì)算市場(chǎng),不是在指定領(lǐng)域下玩跑分。
“申威”顯然在獲得軍方支持后,走的并不是“通用”路線——能否支持普通人能理解的Windows、UNIX或者Linux發(fā)行版并不重要,“申威”作為國(guó)家安全戰(zhàn)略用芯片自然會(huì)有特殊定制版系統(tǒng)與之配合;性能或許也非最重要指標(biāo),能掌握核心技術(shù)并用于關(guān)鍵領(lǐng)域才是最具意義的事情——所以,“申威”一直特別低調(diào),鮮有報(bào)道(比較大篇幅的報(bào)道始于2015年)。直到今天勇奪世界第一,才讓美國(guó)頓時(shí)懵逼了,讓主流媒體突然沸騰了。
能被用于超算領(lǐng)域的“國(guó)產(chǎn)芯”大概也只有“申威”和“龍芯”兩個(gè)選擇,其它的基于ARM架構(gòu)的芯片,則主要面向移動(dòng)和通用市場(chǎng),因此要一視同仁地進(jìn)行比較并不具備價(jià)值。未來(lái)還有可能出現(xiàn)的能挑戰(zhàn)“申威”的國(guó)產(chǎn)芯片,恐怕就只有等與AMD合作的那款SoC了——當(dāng)然小編對(duì)此是極度懷疑中。
“神威太湖之光”的厲害和不同
“神威太湖之光”采用的是申威26010處理芯片,共40960個(gè)計(jì)算節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)由256個(gè)計(jì)算內(nèi)核4個(gè)管理內(nèi)核(據(jù)說(shuō)也帶計(jì)算功能)組成,所以整套系統(tǒng)共1060萬(wàn)個(gè)CPU計(jì)算核——這個(gè)數(shù)字為排名第二的“天河2”的三倍,后者約為312萬(wàn)個(gè)計(jì)算內(nèi)核,因而在浮點(diǎn)計(jì)算性能上也大約是“天河2”的三倍:93.01 petaflop/s比33.86 petaflop/s。
然而,“神威太湖之光”的整機(jī)功耗只有15.37 MW,而“天河2”則為17.81 MW。也就是說(shuō),“神威”是實(shí)現(xiàn)了性能倍增的前提下,功耗反而大幅降低了。這才是一次真正意義的技術(shù)突破——當(dāng)然,這與美國(guó)提出的50 gigaflops/watt的exascale次世代超算還是有很大差距(“神威”換算過(guò)來(lái)的每瓦性能約為6 gigaflops/watt)。
申威26010之所以能有如此強(qiáng)大的浮點(diǎn)計(jì)算性能是得益于Alpha處理器架構(gòu)。Alpha是不同于今天市場(chǎng)主流的X86、ARM、MIPS、Power和Sparc的又一處理器微架構(gòu),屬于RISC(精簡(jiǎn)指令集)家族,曾在上世紀(jì)90年因大膽前衛(wèi)的亂序并行設(shè)計(jì)而風(fēng)靡。雖說(shuō)Alpha也不是申威的自主專(zhuān)利技術(shù)(原持有公司為DEC,后輾轉(zhuǎn)賣(mài)給了惠普,于2004年停止研發(fā)),但與龍芯使用MIPS一樣,在經(jīng)過(guò)那么多年的沉淪,把已經(jīng)“過(guò)氣”的舊指令集和架構(gòu)重新發(fā)揚(yáng)光大,并加入新的構(gòu)思(異構(gòu)架構(gòu)設(shè)計(jì)),也能算是一種創(chuàng)新,因此申威26010在“自主原創(chuàng)性”方面并不存疑。
申威26010的挑戰(zhàn)
不過(guò),也正因?yàn)樯晖?6010是基于DEC Alpha 21264這個(gè)專(zhuān)利已過(guò)保護(hù)期的技術(shù)所發(fā)展出的產(chǎn)品,且采用了類(lèi)似英特爾Phi加速處理器的架構(gòu)設(shè)計(jì),“神威太湖之光”勇奪世界第一的背后,恐怕要面臨編程難、使用難、兼容性難等諸多挑戰(zhàn)。
譬如,Alpha早在2004年就停止后續(xù)開(kāi)發(fā)了,因此很顯然它不會(huì)有開(kāi)源社區(qū)的支持。因此申威及其使用者就不得不自主維護(hù)一套系統(tǒng)和應(yīng)用生態(tài),而早期有能力參與其中開(kāi)發(fā)的人員相信是十分有限。此外,申威26010的架構(gòu)既不像GPU,又不完全是基于CPU,想要合理調(diào)用計(jì)算加速,在編程上也需要額外學(xué)習(xí)成本,今天大量懂得OpenCL或CUDA編程的軟件工程師們恐怕也無(wú)法順利平移到“神威太湖之光”。
當(dāng)然,申威還是主要以突破美國(guó)封鎖、掌握芯片核心技術(shù)為目的的項(xiàng)目,沒(méi)有那么高的通用性或許并不是迫在眉睫的問(wèn)題。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。