據外媒報道,當地時間2月26日,東芝電子歐洲公司(TEE)宣布將研發一種用于汽車應用的圖像識別片上系統(SoC),該系統與東芝以前的產品相比,深度學習加速器的速度是原來的10倍,功率效率為4倍。該項技術的細節在2019年IEEE國際固態線路研討會(ISSCC)上公布,該研討會于2月19日在舊金山舉行。
自動緊急制動等高級駕駛輔助系統提供越來越先進的能力,而且實現此類系統需要圖像識別片上系統,此類片上系統需要能夠在低功耗的情況下高速識別道路交通標志以及道路狀況。
深度神經網絡(DNN)是一種以大腦神經網絡為模型的算法,與傳統的模式識別和機器學習相比,能夠更精確地進行識別處理,而且人們普遍認為其適用于汽車應用。但是,使用傳統處理器、基于深度神經網絡的圖像識別依賴大量的乘積累加(MAC)計算,因而需要大量處理時間,而且也需要消耗更多功率。
東芝推出的深度神經網絡(DNN)加速器克服了上述問題,而且該加速器在硬件中實現了深度學習,具備以下3個特點:
1、 平行乘積累加(MAC)組件。深度神經網絡(DNN)處理需要很多乘積累加計算,東芝的新設備具有4個處理器,每個都有256個乘積累加組件,從而提升了深度神經網絡(DNN)的處理速度。
2、 減少對動態隨機存取存儲器(DRAM)的訪問。傳統的片上系統沒有本地存儲器來保存深度神經網絡執行組件附近的暫態數據,而且處理本地存儲器會消耗很多功率。使用乘積累加(MAC)計算加載權重數據也要消耗功率。而在東芝的新設備中,深度神經網絡(DNN)執行組件附近執行的是靜態隨機存取存儲器(SRAM),深度神經網絡(DNN)處理分成了子處理塊,以將暫態數據存儲于靜態隨機存取存儲器(SRAM)中,減少對動態隨機存取存儲器(DRAM)的訪問。此外,東芝還為加速器增加了一個解壓裝置,提前將權重數據壓縮、存儲在動態隨機存取存儲器中,再通過解壓裝置上傳權重數據,可減少從動態隨機存取存儲器(DRAM)中上傳權重數據所帶來的功率消耗。
3、 減少對靜態隨機存取存儲器(SRAM)的訪問。傳統的深度學習需要在處理完深度神經網絡的每一層之后再訪問靜態隨機存取存儲器,此過程會消耗大量功率。東芝推出的加速器具有流水線式結構,位于深度神經網絡的深度神經網絡執行組件中,完成一系列的深度神經網絡計算只需訪問一次靜態隨機存取存儲器(SRAM)。
該新型片上系統符合汽車應用功能安全的全球標準ISO26262。東芝將繼續提升其片上系統的功率效率和處理速度,并將于今年9月份開始交付其下一代圖像識別處理器ViscontiTM5的樣品。