受物聯網、個人設備、數據中心的強勁帶動,未來五年,人工智能為半導體帶來的收益將增長13倍以上,年復合增長率超過50%,成為集成電路廠商不可錯過的藍海盛宴。
尤其在以下這幾個領域,半導體供應商可以積極尋求為人工智能訓練開發新器件并由此獲得新商機。
工作負載加速器。目前,基于GPU的系統正在許多訓練系統中使用。然而,隨著開發人員獲得神經網絡算法的經驗,對替代計算架構的需求可能隨著針對特定神經網絡模型的器件需求而演變。許多半導體供應商正在開發專用的AI加速器,例如,Intel Crest系列產品和Graphcore的智能處理單元(IPU)。谷歌還開發了自己的基于專用集成電路(ASIC)的解決方案,一款已進入第二代的張量處理單元(TPU)。現場可編程門陣列(FPGA)也可用于滿足神經網絡訓練的一些需求,但是,許多當前的算法都使用32位浮點運算,這可能會限制FPGA可以支持的并行度。
2018年1月
內存。在數據帶寬和內存密度方面,提供高吞吐量并行處理會對所使用的內存子系統帶來挑戰。今天,許多AI設備使用高帶寬存儲器(HBM)技術,該技術使用安裝在與主處理芯片相同的基板上的堆疊DRAM管芯。目前的HBM2規范可實現每個芯片堆棧高達256 GB/秒的傳輸速率和每個堆棧4 GB;對于具有四個HBM2堆棧的處理器件,這提供了1 TB/秒的理論最大數據帶寬和16 GB的封裝內存。除了這種快速本地連接的存儲器之外,AI系統通常還需要在主系統存儲器中容納大量數據。
存儲器內部處理。不同于處理內存附近的數據,“在存儲器內部處理”,將計算嵌入到內存陣列中,使處理器和內存耦合更緊密。存儲器內部處理可以提供額外的優勢,包括更精細的并行性和更高效的性能和能效。目前,計算機行業直接插入式替換這種存儲器內部處理并不普及。然而,新興的存儲器技術,包括自旋轉移扭矩RAM(SST RAM)、電阻RAM(RRAM)、相變存儲器(也稱為PCRAM)和Intel/Micron的3D XPoint存儲器,為半導體供應商提供了未來AI應用實現存儲器內部處理的機會。
互連。器件和系統之間的互連性能將極大限制AI培訓系統的擴展。今天,許多加速器器件通過Peripheral Component Interconnect Express(PCIe)3.0連接到主系統的微處理單元(MPU)和存儲器陣列。許多行業聯盟,如CCIX聯盟、OpenCAPI聯盟和Gen-Z聯盟,正致力于定義可用于互連異構計算系統的緩存一致性互連標準。還有許多專有的系統內互連,例如,英特爾的UPI、AMD的Infinity Fabric和Nvidia的NVLink。所有這些互連為半導體供應商提供了使其AI加速器器件能夠與主系統處理器及其存儲器子系統連接的機制,雖然可能有必要協商訪問互聯的規范。
封裝選項。許多專為AI訓練而設計的器件將采用大型高性能芯片,甚至可能需要多個芯片才能提供最高水平的性能。這種情況為封裝供應商提供了為支持這些產品而開發和提供新技術的機會。當前有一些異構封裝選項的例子,包括英特爾開發的2D嵌入式多層互連橋接(EMIB)封裝技術,臺積電在多芯片和3D IC上采用的襯底晶圓芯片(CoWoS)技術。由許多封裝和測試公司及代工廠提供的扇出晶圓級封裝(FOWLP)或板級封裝,也將允許以更薄的外形和更好的散熱來實現芯片的低成本3D集成。
想了解更多人工智能給半導體帶來的商機嗎?想與眾多一流企業、研究院所及投融資機構一起規劃人工智能的美好未來嗎?11月8號,相約重慶,2018中國集成電路產業促進大會——人工智能專題研討會,讓我們一起來一次頭腦風暴!