自動駕駛是邊緣計算的重要應用,自動駕駛需要100-1000TOPS邊緣AI算力,其具有高性能、低功耗特點的邊緣AI(Edge AI)成了行業壁壘。
AI計算需要域來優化算法和數據流架構,摩爾定律已逼近極限,若沒有正確的算法和架構,僅基于處理技術的驅動性能將無法實現預期的結果。
整體邊緣計算市場規模高速增長。圖片來源:IDC
未來計算平臺
第一類:馮·諾依曼人工智能架構
哈佛大學推出了參數化深度學習基準套件ParaDNN,這是一種系統化、科學化的跨平臺基準測試工具,不僅可以比較運行各種不同深度學習模型的各類平臺的性能,還可以支持對跨模型屬性交互作用的深入分析、硬件設計和軟件支持。
TPU(Tensor Processing Unit, 即TPU張量處理單元)是谷歌打造的處理器,專為機器學習量身定做的,執行每個操作所需的晶體管數量更少,效率更高。TPU對CNN和DNN的大批量數據進行了高度優化,具有最高的訓練吞吐量。
GPU表現出與TPU類似的性能,但對于不規則計算(如小批量和非MatMul計算)具有更好的靈活性和可編程性。
CPU在針對RNN方面實現了最高的FLOPS利用率,并且因其內存容量大而支持最大模型。
第二類:非 馮·諾依曼人工智能架構
內存計算(CIM):基于SRAM、NAND閃存以及新興內存(如ReRAM、CeRAM、MRAM)的CIM陣列被視為神經網絡計算的可重新配置、可重新編程加速器。CIM優點:高性能、高密度、低功耗和低延遲。當前的挑戰:讀出位線模擬信號傳感和專用RAM處理技術的ADC。
神經形態計算:神經形態計算將AI擴展到與人類認知相對應的領域,如解釋和自主適應。下一代人工智能必須能夠處理新的情況和抽象,以自動化普通人類活動。
量子計算:在量子計算中,最小的數據單位是基于磁場自旋的量子位。基于量子糾纏,量子計算允許2個以上的狀態,糾纏速度非常快(比如:Google Sycamore、Quantum Supremay、53個Qbits、速度快1.5萬億倍、在200秒內完成一項需要經典計算機10000年才能完成的任務)。當前的挑戰:嘈雜中型量子(NISQ)計算機中的錯誤率和消相干。
量子神經形態計算:量子神經形態計算在類腦量子硬件中物理實現神經網絡,以加快計算速度。
邊緣AI與垂直應用
邊緣人工智能將主導未來的計算,人工智能是一種能實現未來水平和垂直應用的技術。
水平人工智能應用解決了許多不同行業的廣泛問題(例如計算機視覺和語音識別);
垂直人工智能應用是針對特定領域進行高度優化的特定行業(例如高清地圖、自動駕駛定位與導航)。憑借深厚的領域知識,高效的AI模型和算法可將計算速度提高10-100000倍。這是未來人工智能中最核心、最重要的自動駕駛技術。
所有垂直應用解決方案均需要用于多任務的多級AI模型。
AI模型與算法
DNN是人工智能的基礎,如今的DNN使用一種稱為反向傳播的學習形式。如今的DNN訓練速度慢,訓練后是靜態的,有時在實際應用中不能靈活應變。
遷移學習是一種將先前開發的DNN“回收”作為DNN學習第二項任務起點的方法,有了遷移學習,DNN可用較少的數據訓練DNN模型。
持續(終身)學習是指在保留先前學習經驗的同時,通過適應新知識不斷學習的能力。例如,與環境交互的自動駕駛需從自己的經驗中學習,且必須能在長時間內逐步獲取、微調和遷移知識。
強化持續學習(RCL)通過精心設計的強化學習策略,為每個新任務尋找最佳的神經結構。RCL方法不僅在防止災難性遺忘方面具有良好的性能,而且能很好地適應新的任務。
自動駕駛系統 (ADS) – 功能框圖。圖片來源:ARM
自主駕駛技術需要突破:
邊緣精確定位和導航–輕量化、基于指紋的精確定位和導航。
關鍵實時響應–20-30毫秒,類似人腦
消除盲區–V2X、V2I、DSRC、5G
可升級–低功耗和低成本
圖片來源:ARM
自動駕駛需要在高清地圖、定位和環境感知中處理大量數據,邊緣處理的所有數據都需要在關鍵的幾毫秒內完成。在感知、定位、導航、強化交互(駕駛策略)方面智能精確地減少數據,將使自動駕駛系統縮短延遲,并快速響應不斷變化的交通狀況。
強大、高性能的邊緣人工智能(Edge AI)是自動駕駛汽車領域主要壁壘之一。5G連接支持可靠的MIMO連接、低延遲、高帶寬。在5G的加持下,強大的邊緣AI,加之高清地圖、定位和感知方面的創新,將使真正的自動駕駛成為現實。