IT之家 10 月 24 日消息,IBM Research 日前推出 AI 芯片 NorthPole,該芯片靈感號(hào)稱“來(lái)自人類大腦的運(yùn)作”,推論性能據(jù)稱超越 4nm GPU,適用于邊緣計(jì)算等范疇。
IT之家經(jīng)過查詢得知,NorthPole 芯片是 IBM 曾在 2014 年“模擬人腦運(yùn)作”的 TrueNorth 芯片的后繼者,芯片開發(fā)同樣由 TrueNorth 芯片負(fù)責(zé)人 Dharmendra Modha 所主導(dǎo)。
據(jù)悉,在傳統(tǒng)的半導(dǎo)體產(chǎn)業(yè)中,芯片主要遵循相同的基本架構(gòu),處理單元與儲(chǔ)存信息是相互分開的,這種架構(gòu)雖然簡(jiǎn)化了芯片設(shè)計(jì)模式,卻也因傳輸速度趕不上處理速度而出現(xiàn)了“馮?諾伊曼瓶頸(von Neumann Bottleneck)”,而 Dharmendra Modha 則認(rèn)為,人腦是目前所知最節(jié)能的處理器,因而持續(xù)尋找以數(shù)字方式復(fù)制人腦的方法。
IBM 目前推出的 NorthPole 芯片,相對(duì)于傳統(tǒng)芯片最大的不同點(diǎn)在于“芯片內(nèi)置存儲(chǔ)器”,在沒有“馮?諾伊曼瓶頸”的情況下,NorthPole 芯片的 AI 推論能力優(yōu)于市面上競(jìng)品。
NorthPole 采用 12nm 工藝,于 800 平方毫米上安放了 220 億個(gè)晶體管,并擁有 256 個(gè)核心,于 8-bit 精度下每核心每個(gè)周期可執(zhí)行 2048 次操作,若在 4-bit 或 2-bit 精度下,操作次數(shù)更可翻倍。
在具體架構(gòu)上,NorthPole 號(hào)稱模糊了運(yùn)算與存儲(chǔ)間的界線,這讓 NorthPole 容易整合至系統(tǒng),且明顯減少了搭載芯片的設(shè)備負(fù)載。
IBM Research 在 ResNet-50 模型上測(cè)試 NorthPole,相較于同樣基于 12nm 工藝的 GPU 競(jìng)品,NorthPole 每秒辨識(shí)幀數(shù)的能效是競(jìng)品的 25 倍,而且不管是在延遲或運(yùn)算空間的要求上,表現(xiàn)都優(yōu)于市面上所有主流架構(gòu),甚至凌駕基于 4nm 工藝的 GPU。
不過,NorthPole 的優(yōu)勢(shì)同時(shí)也是它的弱點(diǎn)所在,NorthPole 只能輕松讀取集成在芯片中的本地?cái)?shù)據(jù)信息,讀取外界數(shù)據(jù)時(shí),便沒有計(jì)算速度優(yōu)勢(shì)。
Dharmendra Modha 聲稱,雖然 NorthPole 無(wú)法用來(lái)承載 GPT-4,但應(yīng)該可滿足許多企業(yè)所需的模型推論要求。
目前 IBM Research 仍在研究 NorthPole 的適用領(lǐng)域,研究人員許多需要即時(shí)處理大量資料的邊緣計(jì)算可能非常適合 NorthPole,例如自動(dòng)駕駛、遙感通信等領(lǐng)域,NorthPole 均有用武之地。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。