《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業界動態 > 打破兩堵“墻”,存算一體芯片該如何發揮作用?

打破兩堵“墻”,存算一體芯片該如何發揮作用?

2021-12-10
來源:半導體產業縱橫

所有事物的發展都代表了當下時代對其提出的新要求,半導體行業也沒有例外。

前日,阿里達摩院發布了全球首款使用混合鍵合3D堆疊技術實現存算一體芯片,在行業內引起了不小的轟動。存算一體技術作為打破存儲墻和功耗墻的重要解決方案,又一次站在了聚光燈下。

兩堵”墻”:存算一體技術發展的必要性

存算一體的發展是時代發展的要求,現有馮·諾伊曼計算系統采用存儲和運算分離的架構,存在“存儲墻”與“功耗墻”瓶頸,嚴重制約系統算力和能效的提升。

在馮·諾伊曼架構的核心設計中計算機的組成架構包括運算器、控制器、存儲器、輸入設備、輸出設備五部分。

在馮·諾伊曼架構中,計算單元要先從內存中讀取數據,計算完成后,再存回內存,這樣才能輸出。隨著半導體產業的發展和需求的差異,處理器和存儲器二者之間走向了不同的工藝路線。由于工藝、封裝、需求的不同,從1980年開始至今二者之間的性能差距越來越大。數據顯示,從 1980年到 2000年,處理器和存儲器的速度失配以每年50%的速率增加。

存儲器數據訪問速度跟不上處理器的數據處理速度,數據傳輸就像處在一個巨大的漏斗之中,不管處理器灌進去多少,存儲器都只能“細水長流”。兩者之間數據交換通路窄以及由此引發的高能耗兩大難題,在存儲與運算之間筑起了一道“存儲墻”。

此外,在傳統架構下,數據從內存單元傳輸到計算單元需要的功耗是計算本身的約200倍,因此真正用于計算的能耗和時間占比很低,數據在存儲器與處理器之間的頻繁遷移帶來嚴重的傳輸功耗問題,稱為“功耗墻”。

再加上人工智能的發展,需要運算的數據量開始了極大的增長。人工智能算法是一個很龐大和復雜的網絡,包含大量的圖像數據和權重參數,計算的過程中又會產生大量的數據,數據需要在計算單元和存儲單元之間進行頻繁的移動,這迫切需要合適的手段來減少數據移動及其帶來的性能和功耗開銷。

自1945年提出的馮·諾伊曼架構,其本身仍是現代計算機的主要架構,在此架構下關于存算流程的彎路,在當時是合理的。但是在人工智能飛速發展的現在,卻有必要顛覆它。

于是,業界開始尋找弱化或消除存儲墻及功耗墻問題的方法,開始考慮從聚焦計算的馮·諾伊曼體系結構轉向存算一體結構。

近存儲計算還是存內計算?

為了解決以上問題,存算一體芯片應運而生。其核心思想是將部分或全部的計算移到存儲中,計算單元和存儲單元集成在同一個芯片,在存儲單元內完成運算,讓存儲單元具有計算能力。這種極度近鄰的方式很大程度上降低了數據移動的延遲和功耗,解決了存儲墻問題。

阿里達摩院發布的2020年十大科技趨勢里,它認為存算一體是突破AI算力瓶頸的關鍵技術,朝著這個趨勢阿里發布了近存儲計算芯片。近存儲計算與存內計算都是存算一體的實現方式,但是概念不同。

近存儲計算指的是計算操作由位于存儲芯片外部的獨立計算芯片完成。通過采用先進的3D封裝方式把內存和計算單元封裝在一起,可以達到幾千根甚至上萬根連線,兩者之間的帶寬增加,提高了數據搬運速度。近存儲計算本質上來說還沒有做到真正的存算“一”體。

它從一開始設計計算芯片和存儲芯片的時候,就設計好了鏈接兩方的通路,將數據運輸距離極致縮短。設計芯片本就相當于用這些晶體管在指甲蓋大小的面積上建造一座城市,現在是需要重新設計兩座城市,并提前在中間設計好互相鏈接的通道,這是難點,也是競爭力。阿里發布的,正是采用這個技術的存算一體芯片。

存內計算指的是通過在存儲器顆粒上嵌入算法,使得存儲芯片內部的存儲單元完成計算操作,存儲單元和計算單元完全融合,沒有獨立的計算單元。

在這種方式下,數據不需要單獨的運算部件來完成計算,而是在存儲單元中完成存儲和計算,消除了數據訪存延遲和功耗,是一種真正意義上的存儲與計算融合。同時,由于計算完全依賴于存儲,因此可以開發更細粒度的并行性,獲得更高的性能和能效,存算一體對于符合的應用會帶來較高的性能收益和能效收益,這種方式尤其適用于人工智能應用。

積極布局的龍頭與勇往直前的初創公司

存算一體仍舊是解決存儲墻和功耗墻問題的重要技術,一些處于行業領先地位的半導體公司正在積極進行自研,還有一些公司通過投資初創公司來布局存算一體技術。

國外巨頭中,三星早在2019年就闡述了其在2030年希望完成的愿景:當AI半導體技術變得更加復雜時,存儲器和處理器將最終集成為一體。今年2月,三星發布了HBM-PIM存內計算技術,在高帶寬內存 (HBM) 配置中集成內存處理 (PIM) 。PIM 將可編程計算單元 (PCU) 的 AI 引擎集成到內存核心中來處理某些邏輯函數,PIM 將刺激需要持續性能改進的 AI 應用程序的使用量增長。與現有的內存解決方案相比,三星的 PIM 理論上可以通過可編程計算單元 (PCU) 提高 4 倍的性能。

此外,IBM在2016年就透露了其關于存內計算的研發計劃,提出了混合精度內存計算的新概念。

美國存算一體AI芯片初創公司Mythic發布的存算一體芯片,依靠模擬計算技術,將足夠的存儲與大量并行計算單元打包在芯片上,以最大化內存帶寬并減少數據移動的能力。在今年C輪融資中,Mythic籌集7000萬美元,自成立以來Mythic的總融資額已達到1.65億美元。

此外,美國另一家專注于語音識別的存算一體AI芯片公司Syntiant也受到微軟、亞馬遜、應用材料、英特爾、摩托羅拉和博世的支持。

在國內企業中,看準存算一體趨勢的阿里也激情入局,打出了一張好牌。而阿里也不止步于此,近存儲技術之后,阿里還將向存內計算技術進發。

除了阿里外,眾多初創公司也努力在存算一體這個賽道狂奔,一些廠商也通過投資初創公司來布局存算一體技術,還包括知存科技、后摩智能、閃億半導體等初創公司。

知存科技于2017年成立,目前知存推出國際首個存算一體加速器WTM1001和首個存算一體SoC芯片WTM2101。今年,知存科技獲得了華為哈勃的投資。知存科技已經獲得五輪產業資本領投融資,累計融資3億元。

閃億半導體作為該領域國產化芯片的先行者,于2017年7月創立,創始團隊分別畢業于清華大學和北京大學,閃億專注于研發、生產最先進的存儲-運算陣列SoC芯片,聚焦人工智能計算。其在2019年10月發布了其首款存算一體芯片,該公司負責人魯辭莽表示,這款芯片在運行效率上能提高10TOPS/W,成本比傳統AI芯片方案下降超一半。

后摩智能更是于今年完成3億元融資,資金將用來加速推動存算一體技術落地,作為國內首家采用存算一體技術打造大算力芯片的公司,后摩智能也擁有充滿野心的愿景:打造出具有“十倍效應”的AI芯片, 滿足真正人工智能時代的超大算力需求,用無限算力去改變世界。

存算一體的荊棘之路

當前,存算一體芯片產業還算不上成熟,在產業鏈方面仍舊存在上游支撐不足,下游應用不匹配的諸多挑戰。在芯片的設計階段,另外由于存算一體芯片和常規的芯片設計方案有所不同,目前市面上也沒有成熟的專用EDA工具輔助設計和仿真驗證;芯片流片之后,沒有成熟的工具協助測試;在芯片落地應用階段,暫時沒有專用的軟件與之匹配。

類腦技術暫時遙不可及,存算一體看起來是目前問題的較優解。技術的發展來源于日益增長的需求,考慮如何進行創新與創造,如何完善重要技術的生態鏈,是行業上下游廠商應該考慮的問題。




最后文章空三行圖片.jpg


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 亚洲国产福利精品一区二区 | 成人在线观看免费视频 | 亚洲第一页在线 | 亚洲欧美在线一区 | 亚洲国产欧美久久香综合 | 911精品国产亚洲日本美国韩国 | 天天综合久久 | 欧洲精品一区二区三区 | 国产免费人成在线视频视频 | 性a爱片免费视频性 | 五月天堂网| 久草亚洲视频 | 在线观看视频你懂的 | 性xxxfreexxxx性欧美 | 成人小视频在线免费观看 | 亚洲va欧美ⅴa国产va影院 | 激情五月激情综合网 | 亚洲精品高清国产一久久 | 艳妇乳肉豪妇荡乳a亚洲 | 久青草国产在视频在线观看 | freexxxx性大陆另类 | 超薄肉色丝袜精品足j福利 超级碰人人 | 久久亚洲人成网站 | 国产三级国产精品国产普男人 | 色黄污在线看黄污免费看黄污 | 国产成人精品综合久久久 | 每日更新国产 | 久久狠狠色狠狠色综合 | 男人把女人狂躁的免费视频 | 女性一级全黄生活片在线播放 | 欧美日韩一区二区视频图片 | 黄色片免费在线观看 | 日批视频网址免费观看 | 成人免费真人毛片视频 | 欧美不卡精品中文字幕日韩 | 免费国产综合视频在线看 | www午夜| 久久久噜噜噜www成人网 | 欧美日韩国产中文字幕 | 免费a级人成a大片在线观看 | 国产精品入口麻豆高清在线 |