據(jù)復旦工研院消息,近日,該院張立華課題組參與的芯片院存算一體智能處理器研究團隊,針對后摩爾時代的人工智能處理器設(shè)計的相關(guān)挑戰(zhàn),提出了多芯粒集成存算一體人工智能芯片 COMB-MCM。
該系統(tǒng)在發(fā)揮存算一體“非馮”架構(gòu)的性能和能效優(yōu)勢的同時,避免模擬計算電路的計算誤差,并且利用多芯粒集成技術(shù)實現(xiàn)了流片后的算力可擴展性。
據(jù)介紹,存算一體(Computing-In-Memory,CIM)架構(gòu)通過將數(shù)據(jù)存儲單元和計算單元融合為一體,徹底消除不必要的數(shù)據(jù)搬移,破解了傳統(tǒng)馮諾伊曼架構(gòu)處理器與存儲器分離,訪存瓶頸導致的“存儲墻”和“功耗墻”問題,極大提高了算力和能效。
該技術(shù)在需要密集訪存的 AI 應(yīng)用中展現(xiàn)出超高的能效,被認為是下一代人工智能芯片的關(guān)鍵技術(shù)。
復旦大學的工作主要從三個層面進行了技術(shù)探索和創(chuàng)新:
在架構(gòu)層面,提出了基于 SRAM 的存邊計算型存算一體架構(gòu)(Computing-On-Memory-Boundary,COMB),進一步減少現(xiàn)有存算融合系統(tǒng)中權(quán)重更新引起的數(shù)據(jù)搬移,降低系統(tǒng)功耗開銷;
在電路層面,提出了支持細粒度雙極稀疏感知的存算融合宏單元電路結(jié)構(gòu),在不增加額外檢測電路的情況下兼容任意的稀疏模式,降低人工智能算法的計算功耗;
在系統(tǒng)層面,提出了基于逐層流水線的多芯粒算法映射方法,并搭建了多芯粒集成(Multi-Chip-Module,MCM)可擴展系統(tǒng)來支持不同復雜度的人工智能任務(wù)。面對不同規(guī)模神經(jīng)網(wǎng)絡(luò)時,通過配置芯粒的數(shù)量,實現(xiàn)計算與存儲需求的按比例增長,可避免了“一系統(tǒng)一設(shè)計”的重復研發(fā)成本,也為未來單一封裝內(nèi)的異質(zhì)異構(gòu)集成提供了一個新的設(shè)計思路。
官網(wǎng)文章稱,該人工智能芯片方案分別采用 65nm 和 28nm 工藝制造,65nm 工藝下通過 2.5D 封裝的 MCM 系統(tǒng)驗證了方案的可行性,并在 28nm 工藝下實現(xiàn)了更好的性能。
相關(guān)研究成果發(fā)表在被譽為“集成電路奧林匹克”的國際固態(tài)電路會議 ISSCC 2022。微電子學院博士研究生朱浩哲、工程與應(yīng)用技術(shù)研究院碩士研究生焦博、張錦山為共同第一作者,芯片與系統(tǒng)前沿技術(shù)研究院青年副研究員陳遲曉為該論文通訊作者。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。