說到AI芯片領域,最近的一件大事是,10月13日地平線和大眾旗下軟件公司CARIAD官宣合作。雙方成立合資企業,CARIAD控股60%,投資約24億歐元,預計會在2023年上半年完成。
這算是地平線迄今為止最重磅的一個合作。而一個插曲是,半年前地平線才宣布第三代產品征程5芯片首個定點合作,花落比亞迪,上車時間2023年。不過,有意思的是,比亞迪同時也將投產搭載英偉達DRIVE Orin計算平臺的車型。
而公社C次元最近一篇文章《英偉達不要的,地平線都要》,對地平線和英偉達在汽車領域AI芯片應用的競爭情況也做了介紹,所以,這篇我們就科普科普,到底這兩家企業競爭些什么,以及車企的選擇背后是怎樣的考慮?
都是AI芯片,有啥不一樣?
論及雙方,他們的產品都是用于自動駕駛領域的AI芯片。但是區別還是很大的。
AI芯片的應用場景,主要分為云端和終端,還有邊緣端。目前,云端應用的更多,相對成熟。此外,云端應用又可分為訓練和推理兩種,其中訓練的市場規模占比較高。
云端應用的霸主,就是英偉達。而云端(服務器、數字中心)和終端(手機、智能汽車等移動端)應用場景中,AI芯片的運算方式有著本質性的差別。
比如,云端處理大批量一次性到達的累積數據(擴大批處理量,batch size),可以“等”數據“夠了”再開始處理。但車端芯片則需要處理流數據,隨著行駛(時間)陸續到來的數據;需要實時完成計算,盡可能得降低延遲。
對于交互性,終端要求更高。云端任務本身是限定在虛擬世界,無需考慮與現實世界的交互。終端則身處現實世界,每一個任務都需要考慮交互性。
此外,功耗和成本在車端AI芯片的考量中也占據更重的分量??梢?,對于汽車終端來講,AI芯片除了須保證計算能效,還有低功耗、低延遲、低成本的要求。
目前,AI芯片主要有三種,分別是通用型的GPU,可定制的FPGA,以及專用的ASIC。英偉達的Orin芯片,是基于通用GPU。而地平線的征程5芯片,既是ASIC芯片,也是DSA(Domain Specific Architecture 特定領域架構)芯片。值得注意的是,Orin芯片的核心GPU架構仍是云端架構。
不過,對車企來說,芯片的兼容性越強越好,因為車企可以一步到位,而且無需再從頭做驗證,用一個芯片就能實現未來高階智能駕駛的硬件預埋,為未來更高階的智能駕駛做好準備。這也是很多品牌愿意選擇英偉達Orin芯片的原因。
而地平線采用面向特定場景的軟硬結合方法論來設計芯片,也就是DSA芯片的做法,極大提升了芯片的有效算力。但是,我們的疑問是,征程5芯片的極限到達后,更高級別的自動駕駛需求就要換用征程6,那么,這個換裝的綜合成本,誰來買單承受呢?
除了算力,還有FPS
除了通用和定制的區別,目前業內存在“唯算力論”,好像芯片算力越高覺得越好。其實,這有失偏頗。實際上,還是要看FPS(每秒傳輸幀數)才行。
FPS通俗來講就是指動畫或視頻的每秒畫面數。FPS是測量用于保存、顯示動態視頻的信息數量。簡單來說,FPS數值越大,性能越好。對于自動駕駛所有應用的計算平臺來說,FPS被認為是衡量先進算法運行效率的評價標準之一。
比如,在芯片算力上,單片英偉達Orin和征程5的算力分別為254TOPS(每秒萬億次計算)和128TOPS,功率為45W和30W,功耗比分別為4.6TOPS/W和4.2TOPS/W。征程5只有英偉達Orin的一半。
但是,征程5的FPS(每秒傳輸幀數)卻為1283。比Orin的1001FPS(基于同安培架構的英偉達RTX3090進行調整后測算得出)高出不少。地平線征程5畫面傳送視頻的流暢度明顯要好于英偉達Orin。怪不得地平線BPU算法負責人羅恒要說,“能效上來看,我們(征程5相比Orin)有6倍多的提升?!?/p>
其實,不僅是地平線以FPS來算帳。2017年發布自研的FSD芯片時,特斯拉創始人馬斯克便以此前應用的英偉達Drive PX2作比,從算力來看FSD是Drive PX2的3倍,但FPS是Drive PX2的21倍。
此外,低延遲性能也是衡量AI芯片性能的關鍵指標。因為,延遲問題直接關乎駕駛證安全。比如,在緊急制動場景下,100毫秒意味著近1.7~3.3米的剎車距離。
而按照地平線的說法,征程5的8M單目前視感知結構化輸出延遲小于60毫秒,比英偉達ORIN的延遲性能更好。而Orin芯片的低延遲數據未知。
所以,從FPS和低延遲、低成本來說,地平線在汽車領域的發展機會還是很大的,目前有超過20家車企的70多款車型應用了征程系列芯片,這也是地平線通過定制路線的“奇兵”收獲的成果。
架構,決勝
而在第五波計算浪潮之下,決定芯片的核心,當然是架構。因為,架構是芯片企業最底層的核心技術,迭代成本巨大,也是最值錢的技術。
作為提出DSA架構的泰山北斗,John Hennessy與David Patterson在獲得2017年圖靈獎時的獲獎演說中指出:“未來十年,將是計算機體系結構的黃金年代”。這是一個很好的注腳。
而地平線的征程系列芯片,從其架構來說,經歷了名為高斯、伯努利和貝葉斯的三代BPU(Brain Processing Unit, 地平線自主設計研發的高效的人工智能處理器架構)架構。
從低到高,高斯架構主要處理感知,就是圖像識別,識別攝像頭,雷達,傳感器等的圖像,采用40nm工藝。而伯努利架構加入了深度學習,20nm工藝。貝葉斯架構則是加入貝葉斯網絡,結合深度學習來提高AI的準確率,16nm工藝。
再來看英偉達。創立于1993年的英偉達厲害之處在于,1999年發明GPU(圖形處理器),2006年發布CUDA?通用并行計算架構,實現了軟硬解耦。開發者不必再使用高難度的GPU專用開發語言,而能使用通用性的編程語言調用GPU算力。
通過軟硬解耦,將圖形處理的專用芯片GPU變為適用于大規模并行計算的通用型芯片,英偉達站上AI時代的C位。對于地平線以及其他芯片企業來說,也是高山仰止、拼命追趕的對象。
而英偉達的Orin是基于Ampere(安培)架構,這也是推動英偉達數據中心業務增長近9成的主力產品架構。換句話說,面向高級別自動駕駛場景的Orin,用的還是魔改的通用架構。這就像,今年大熱的高通8155芯片,是從消費電子芯片魔改而來。
通用架構的好處是“上手容易”,拿來就能用,而且工具豐富。不過,缺點是,很多硬件性能前期是浪費的,暫時用不上的。
那么,為什么站在云端的英偉達仍然在用通用架構?看看汽車業務占比就明白。
5月26日,英偉達發布2023財年Q1財報(截至2022年3月),本季營收82.9億美元,同比增長46%。其中,由超大規模計算、云端和AI業務推動的數據中心業務占比45.23%;顯卡支撐的游戲業務占比43.67%。汽車業務呢?微不足道,占比2.1%。
地平線的營收情況,沒有公開的披露。不過,2020年《晚點LatePost》曾報道,地平線2020年營收為2~2.3億元,其中70%來自向車廠提供芯片等產品的收入,客戶包括長安、一汽和理想汽車等。
從營收來看,地平線和英偉達的差距還不是一個數量級的,還根本無法威脅到英偉達的地位,是海洋界鯨魚和海豚的關系。所以,英偉達沒什么動力去做面向車企的ASIC芯片。這也給了地平線和其他芯片企業巨大的機會。
當然,地平線還處于發展初期也就是要不斷砸錢的階段。根據企查查的數據,如果不計算未披露的融資金額,地平線累計融資超34億美元(約合人民幣243.3億元)。最近一筆,是奇瑞汽車的。
地平線目前的核心業務只有端側的汽車領域。市場方面,地平線征程系列芯片目前累計出貨超過150萬片。而通過針對自動駕駛場景算法和需求專門設計的專用芯片,實現在效率上的更高效,只是地平線追趕英偉達的第一步。
就像前面說的,比亞迪并不是唯一一個同時部署英偉達和地平線的車企。理想在2021理想ONE以及后續的理想L8 Pro上搭載了征程5,而在理想L8 MAX和L9上則使用的是英偉達Orin。
所以,地平線更難的是構建出好用的軟件體系,以及能支撐持續演進迭代的用戶生態,而這正是英偉達CUDA體系的王牌所在。地平線的天工開物還有很長的路要走。不過,無論怎樣,地平線給中國汽車企業帶來了一個DSA芯片的可選項,都是件“極好的”事。
更多信息可以來這里獲取==>>電子技術應用-AET<<