在2020年CCF GAIR(全球人工智能與機器人大會)上,清華大學高濱副教授團隊展示了一項前沿研究成果:基于憶阻器(Memristor)的存算一體(Computing-in-Memory)單芯片,其算力潛力可能高達1 POPS(Peta Operations Per Second,每秒千萬億次操作)。這一進展為突破傳統(tǒng)馮·諾依曼架構(gòu)瓶頸、實現(xiàn)下一代高能效人工智能計算提供了極具前景的硬件路徑。
傳統(tǒng)計算架構(gòu)中,數(shù)據(jù)需要在處理器和存儲器之間頻繁搬運,產(chǎn)生了巨大的能耗和延遲,即所謂的“內(nèi)存墻”問題。這在處理人工智能,特別是深度學習的海量矩陣乘加運算時,成為提升算力和能效的主要制約。存算一體技術(shù)旨在將計算功能直接嵌入存儲器單元,在數(shù)據(jù)存儲的位置完成計算,從而極大減少數(shù)據(jù)搬運,實現(xiàn)能效的飛躍。
憶阻器作為一種新興的非易失性存儲器器件,其電阻值能夠隨流經(jīng)的電荷量改變并保持,這一特性天然適合模擬突觸的權(quán)重,并直接在陣列中執(zhí)行并行的模擬域乘累加運算。高濱團隊的研究正是利用憶阻器交叉陣列,構(gòu)建了高效的存算一體硬件核心。他們所展示的芯片設(shè)計,通過高密度集成的憶阻器陣列和優(yōu)化的外圍電路,能夠在單個芯片上實現(xiàn)理論峰值算力達1 POPS的驚人水平。這相當于每秒執(zhí)行一千萬億次操作,為運行復雜神經(jīng)網(wǎng)絡(luò)模型提供了強大的本地化算力支撐。
該技術(shù)的意義不僅在于超高的理論算力,更在于其革命性的能效提升。由于減少了大量數(shù)據(jù)移動能耗,存算一體芯片在執(zhí)行AI推理任務(wù)時,能效比有望比現(xiàn)有GPU、TPU等傳統(tǒng)架構(gòu)高出數(shù)個數(shù)量級。這對于在邊緣設(shè)備、物聯(lián)網(wǎng)終端等對功耗極其敏感的場景中部署復雜AI模型至關(guān)重要,有望推動人工智能在更多領(lǐng)域的普及和實時化應(yīng)用。
在CCF GAIR 2020的報告中,高濱團隊也探討了與此類新型硬件相匹配的人工智能基礎(chǔ)軟件開發(fā)所面臨的挑戰(zhàn)與機遇。存算一體芯片,尤其是基于模擬計算的憶阻器芯片,其計算范式與數(shù)字處理器有根本不同,需要全新的軟件工具鏈、編程模型、算法以及神經(jīng)網(wǎng)絡(luò)設(shè)計方法。這包括:
高濱團隊的工作標志著我國在存算一體這一顛覆性計算技術(shù)領(lǐng)域已處于國際前沿。將高達1 POPS的潛在單芯片算力從理論推向大規(guī)模實用化,仍需在憶阻器器件的一致性、可靠性、大規(guī)模集成工藝,以及上文所述的完整軟件生態(tài)建設(shè)上持續(xù)攻關(guān)。這條道路無疑為應(yīng)對后摩爾時代挑戰(zhàn)、滿足未來人工智能對算力與能效的無限渴求,點亮了一盞關(guān)鍵的引路明燈。
如若轉(zhuǎn)載,請注明出處:http://m.51sotao.cn/product/61.html
更新時間:2026-04-14 20:34:23
PRODUCT