最近這段時間,美國股票市場的動靜比較大。有兩個科技股概念,突然變得很火,引起了市場的高度關注,漲幅驚人。這兩個概念,分別是 ASIC 和量子計算。
今天這篇文章,我們主要說說 ASIC。
按資本市場的說法,ASIC 正在加速崛起,威脅 GPU 在 AI 計算中的統(tǒng)治地位。而博通,作為 ASIC 最重要的概念股,股價一路猛漲,一度從 180 飆到了 250,市值也突破了萬億美元。相比之下,英偉達反而成了明日黃花,股價一路下跌,甚至不到 130 美元。
那么,ASIC 時代真的到來了嗎?博通真的會取代英偉達,成為新的 AI 之王?
█ ASIC 和 GPU 是什么
ASIC 和 GPU,都是用于計算功能的半導體芯片。因為都可以用于 AI 計算,所以也被稱為“AI 芯片”。
準確來說,除了它倆,計算芯片還包括大家更熟悉的 CPU,以及 FPGA。
行業(yè)里,通常會把半導體芯片分為數(shù)字芯片和模擬芯片。其中,數(shù)字芯片的市場規(guī)模占比較大,達到 70% 左右。
數(shù)字芯片,還可以進一步細分,分為:邏輯芯片、存儲芯片以及微控制單元(MCU)。CPU、GPU、FPGA、ASIC,全部都屬于邏輯芯片。
邏輯芯片,就是計算芯片。它包含了各種邏輯門電路,可以實現(xiàn)運算與邏輯判斷功能。
四個芯片里,CPU 和 GPU 是通用芯片,可以完成多種任務。尤其是 CPU,是全能型選手,單核主頻高,啥都能干,所以經(jīng)常被拿來做主處理器。
而 GPU,本來是用來做圖形處理(顯卡)的。它的內核數(shù)量特別多(大幾千個),適合做并行計算,也就是擅長同時做大量的簡單計算任務。(圖形處理,就是同時處理大量的像素計算。)
AI 計算和圖形計算一樣,也是典型的并行計算型任務。
AI 計算中包括大量并行的矩陣相乘、卷積、循環(huán)層、梯度運算等任務,所以,特別適合 GPU 去完成。CPU 不適合 AI 計算,這也是英特爾股價跌到 20 美元以下的原因之一。
2023 年以來,AI 浪潮爆發(fā),大部分企業(yè)的 AI 訓練,采用的是英偉達的 GPU 集群。如果進行合理優(yōu)化,一塊 GPU 卡,可以提供相當于數(shù)十甚至上百臺 CPU 服務器的算力。這直接導致了英偉達的股價猛漲了幾十倍,而且還買不到。
再來看看 ASIC 和 FPGA。
ASIC(Application Specific Integrated Circuit,專用集成電路),是一種專用于特定任務的芯片。ASIC 的官方定義,是指:應特定用戶的要求,或特定電子系統(tǒng)的需要,專門設計、制造的集成電路。
Google 公司大名鼎鼎的 TPU(Tensor Processing Unit,張量處理單元),還有前幾年很火的比特幣礦機,英特爾的 Gaudi 2 ASIC 芯片,IBM 的 AIU,AWS 的 Trainium,都屬于 ASIC 芯片。
這幾年非常火的 DPU(Data Processing Unit,數(shù)據(jù)處理單元)和 NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡處理單元),也是 ASIC 芯片。
FPGA(Field Programmable Gate Array,現(xiàn)場可編程門陣列),是半定制芯片,也被人稱為“萬能芯片”。FPGA 可以根據(jù)用戶的需要,在制造后,進行無限次數(shù)的重復編程,以實現(xiàn)想要的數(shù)字邏輯功能。
ASIC 和 FPGA 的區(qū)別在于,AISC 是全定制芯片,功能寫死,沒辦法改。而 FPGA 是半定制芯片,功能靈活,可玩性強。FPGA 不需要流片(很燒錢的一個工序),但因為可編輯,冗余功能比較多,一旦用于單一目的,就會存在浪費。大規(guī)模生產(chǎn)的情況下,F(xiàn)PGA 的成本比 ASIC 高,且極致能效不如 ASIC。
所以,F(xiàn)PGA 現(xiàn)在多用于產(chǎn)品原型的開發(fā)、設計迭代,以及一些低產(chǎn)量的特定應用,或者用于培訓和教學。它適合那些開發(fā)周期必須短的產(chǎn)品,也經(jīng)常用于 ASIC 的驗證。
反正,大家記住,大規(guī)模出貨用于 AI 計算,一般不考慮 FPGA。
所以,AI 芯片,也就是 GPU 和 ASIC 之爭。
█ GPU 和 ASIC,到底誰厲害?
ASIC 作為專用定制芯片,基于芯片所面向的專項任務。它的計算能力和計算效率都是嚴格匹配于任務算法的。芯片的核心數(shù)量,邏輯計算單元和控制單元比例,以及緩存等,整個芯片架構,也是精確定制的。
所以,ASIC 可以實現(xiàn)極致的體積、功耗。這類芯片的可靠性、保密性、算力、能效,都會比通用芯片(GPU)更強。
例如,在同等預算下,AWS 的 Trainium 2(ASIC 芯片)可以比英偉達的 H100 GPU 更快速完成推理任務,且性價比提高了 30-40%。明年計劃推出的 Trainium3,計算性能更是提高了 2 倍,能效提高 40%。
但是,為什么這兩年一直火的都是 GPU 呢?
主要是因為英偉達太猛。
英偉達在 AI 上也是歪打正著。當年 AI 大佬辛頓(就是那個新晉諾貝爾獎得主)帶著徒弟使用 GPU 做 AI 訓練,獲得巨大突破,才讓英偉達發(fā)現(xiàn)自己竟然還有這樣的潑天富貴。
然后,英偉達就開始在 AI 發(fā)力,拼命做更厲害的 GPU(當然,也有游戲的帶動)。
在英偉達的持續(xù)努力下,GPU 的核心數(shù)和工作頻率一直在提升,芯片面積也越來越大。算力越強,有利于縮短訓練時間,加快產(chǎn)品發(fā)布,這也是重要優(yōu)勢。
當然,算力變強,功耗也水漲船高。但是,靠工藝制程、水冷等被動散熱,勉強也能兜得住,反正不會燒掉。
除了硬件之外,英偉達在軟件和生態(tài)方面也很會布局。
他們搗鼓出來的 CUDA(AI 開發(fā)的軟件套件),是 GPU 的一個核心競爭力?;?CUDA,初學者都可以很快上手。所以,英偉達的 GPU 方案,被全球用戶廣泛接受,形成了牢固的生態(tài)。
相比之下,F(xiàn)PGA 和 ASIC 的開發(fā)還是太過復雜,不適合普及。
ASIC 之所以在 AI 上干不過 GPU,和它的高昂成本、超長開發(fā)周期、巨大開發(fā)風險有很大關系?,F(xiàn)在 AI 算法變化很快,ASIC 這種開發(fā)周期,很要命。
綜合上述原因,GPU 才有了現(xiàn)在的大好局面。
值得一提的是,前面說了,AI 計算分為訓練和推理兩種。訓練任務,需要更強大的算力,所以在 AI 訓練上,廠商們主要以 GPU 為主。
推理任務的話,算力要求要低一點,也不需要什么并行,所以 GPU 的算力優(yōu)勢沒那么明顯。很多企業(yè),就會開始采用更便宜、更省電的 FPGA 或 ASIC,進行計算。
這個情況,一直持續(xù)到了現(xiàn)在。AI 芯片,GPU 的占比能達到 70% 以上。
如今,因為大家實在是“苦英偉達久矣”,不想總被英偉達“卡脖子”,所以非常希望算力多元化。再有,大模型現(xiàn)在從“訓練熱”走向了“推理熱”。推理類的 AI 計算需求增加,給了 ASIC 機會。
所以,扶持 ASIC 產(chǎn)業(yè)鏈,提升 ASIC 芯片在 AI 領域的占有率,成為了大家的共識。這才有了博通和 Marvell 股價的猛漲。(據(jù)說,博通正與三個大型客戶開發(fā) AI 芯片,預計 2025 年 AI 芯片業(yè)務收入達到 150 億-200 億美元。)
那么,取代就真的那么容易嗎?ASIC 會很快淘汰掉 GPU 嗎?
顯然不是的。
憑借前面提到的性能、生態(tài)、集成能力等方面的優(yōu)勢,英偉達的 GPU 仍然會是中短期內的 AI 芯片首選。英偉達的軟硬件網(wǎng)絡整套方案都很成熟,技術和資金實力太強,GPU 的存量和出貨量依然很大,市場地位難以撼動。
ASIC 的崛起速度雖然很快,但仍需要一定的時間走向成熟。AI ASIC 芯片的研發(fā),也具有很高的風險。即使研發(fā)成功,也需要時間被用戶所接受。
這就意味著,在很長的一段時間內,GPU 和 ASIC 都將處于共存狀態(tài)?;诓煌膱鼍?,用戶會選擇最適合自己的芯片。發(fā)展自研 ASIC,更多是有利于廠商們和英偉達進行談判砍價。
未來的情況還是比較難預測的。量子計算是不是會對計算領域造成顛覆式影響,現(xiàn)在也是討論的熱點。
好了,以上就是今天文章的全部內容。感謝大家的耐心閱讀!
本文來自微信公眾號:鮮棗課堂(ID:xzclasscom),作者:小棗君
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。