最近,英特爾推出了第二代神經(jīng)擬態(tài)芯片Loihi2和用于神經(jīng)啟發(fā)應(yīng)用程序的開源軟件框架Lava。并且,Loihi2采用Intel4工藝的預(yù)生產(chǎn)版本制造。使用極紫外光刻技術(shù)簡化布局設(shè)計規(guī)則,使得快速開發(fā)Loohi2成為可能。
在AI芯片方面,除了英特爾推出的神經(jīng)擬態(tài)芯片,百度也在8月18日的百度世界大會上宣布第二代自研AI芯片——昆侖2正式量產(chǎn)。公布即量產(chǎn),可以看出百度對于昆侖芯片的自信。
自1956年的Dartmouth學(xué)會上,人工智能的概念誕生。經(jīng)過了半個多世紀(jì)的發(fā)展,麥卡錫提出的人工智能在機(jī)器人、語音識別、圖像識別等領(lǐng)域都不斷發(fā)展。而在人工智能發(fā)展的過程中,必然不會缺少的就是AI芯片。
目前對于AI芯片并沒有明確的定義,廣義上所有面向AI應(yīng)用的芯片,包括訓(xùn)練和推理應(yīng)用的芯片都可以稱為AI芯片。
幾乎所有的科技巨頭都已開始布局,除了百度、英特爾兩家企業(yè),特斯拉也推出了號稱全球算力最高的自研AI芯片。AI芯片行業(yè)巨頭英偉達(dá)市值一度被推至5000億以上。
AI芯片的市場注定是一場激烈的斗爭。
資本的涌入
2017年左右掀起了一輪新的AI熱潮。AlphaGo戰(zhàn)勝人類頂級棋手柯潔,橫掃圍棋界,一時間學(xué)界開始了又一輪的AI研究。
在最近三年級,AI芯片領(lǐng)域出現(xiàn)了兩筆超級融資,壁仞科技在新創(chuàng)18個月就融資超過47億元,創(chuàng)下國內(nèi)芯片創(chuàng)業(yè)公司的最大融資記錄。摩爾線程成立不到一年,估值超百億,融資數(shù)十億。
就單從2021年開年后看,AI芯片行業(yè)至少有20多起公開融資,而已公布的投融資金額及加起來,合計已達(dá)到約200億人民幣,其中有至少8起單筆融資的金額逾10億人民幣,單筆最高融資達(dá)53.5億人民幣。
國內(nèi)的云端AI芯片創(chuàng)業(yè)公司擁有超強(qiáng)的吸金能力。
致力于打造高性能GPU的沐曦集成電路有限公司8月27日宣布完成10億元人民幣A輪融資。
2021 年 1 月,燧原科技完成 18 億人民幣 C 輪融資。其實在去年 5 月,燧原科技就完成 7 億人民幣 B 輪融資,領(lǐng)投方為半導(dǎo)體產(chǎn)業(yè)基金武岳峰資本,老股東騰訊繼續(xù)跟投。
2021年3月1日,云端服務(wù)器級的通用高性能計算芯片的天數(shù)智芯宣布完成C輪12億元融資。
摩爾線程在成立后的短短100天,即獲深創(chuàng)投、紅杉資本中國基金、GGV紀(jì)源資本等眾多機(jī)構(gòu)的青睞,融資金額已達(dá)數(shù)10億。
可重構(gòu)存算AI芯片的提出者千芯半導(dǎo)體(TensorChip)在3月22日公布完成了數(shù)千萬人民幣融資。
9月22日,黑芝麻智能宣布今年已經(jīng)完成數(shù)億美元的戰(zhàn)略輪及C輪兩輪融資。戰(zhàn)略輪由小米長江產(chǎn)業(yè)基金、富賽汽車等國內(nèi)產(chǎn)業(yè)龍頭企業(yè)參與投資。
在深圳的墨芯人工智能,其自稱是唯一擁有動態(tài)稀疏和靜態(tài)稀疏技術(shù)的企業(yè),在今年的1、3月份分別宣布獲得新融資。
如此強(qiáng)大的吸金能力,能夠看出資本方對于AI芯片企業(yè)的看好。
無論資本市場如何火熱,檢驗AI芯片創(chuàng)企們長期發(fā)展實力的關(guān)鍵準(zhǔn)則,最終會回歸到產(chǎn)品實際性能和落地能力上來。
AI芯片落地難點
AI芯片已經(jīng)進(jìn)入肉搏期。相比起一度火熱的概念潮,目前比拼的是誰能夠率先落地產(chǎn)品、構(gòu)建生態(tài)。
現(xiàn)在的問題成為了:進(jìn)入了哪些場景?合作了哪些客戶?有沒有軟硬一體化方案?是否已經(jīng)有標(biāo)桿案例?
AI芯片落地難的原因可能有很多個。例如,神經(jīng)網(wǎng)絡(luò)中的卷積運(yùn)算加速對于功耗的增加,當(dāng)算力翻倍,除了硬件成本增加,電力供應(yīng)和電費(fèi)成本更是一個瓶頸。從芯片技術(shù)到算法理論的創(chuàng)新,是一個原因。
還有芯片研發(fā)速度小于AI語言的研發(fā)速度,當(dāng)出現(xiàn)合適的芯片時,其采用的AI語言可能已經(jīng)過時。這對于能否量產(chǎn)打出了一個問號。
Rokid北京AI實驗室負(fù)責(zé)人高鵬在鈦媒體的采訪中說,“衡量一塊芯片成功與否的標(biāo)準(zhǔn),就是看它能否大規(guī)模的應(yīng)用于產(chǎn)品。” 云知聲創(chuàng)始人黃偉也曾表示:“我們的芯片是有客戶的,不是PPT造芯,更不是自嗨。“
落地難更重要的原因還是在應(yīng)用場景的設(shè)計。缺乏殺手級應(yīng)用使得現(xiàn)有的AI芯片沒有清晰的定位,無法高度優(yōu)化PPA。支撐AI芯片的不僅僅是AI計算,更要面向場景,實現(xiàn)完整的功能。
“每個規(guī)格的芯片都有自己的特性,有些芯片非常便宜,性能就會差,無法支持諸如打斷喚醒這種前端能力,這類芯片就適合高性價比產(chǎn)品;像 Rokid KAMINO18這樣的AI 芯片,支持4麥陣列,就很適合智能音箱場景。”圖靈機(jī)器人兒童事業(yè)部總監(jiān)劉峰表示。
除去殺手級應(yīng)用場景的缺乏,很多半導(dǎo)體投資人都表示,誰能在自己的產(chǎn)品賽道上率先突破生態(tài),誰就能存活下來。
所謂的AI芯片生態(tài)指的是,芯片上整個軟件棧來支持AI框架,而AI應(yīng)用程序則是基于這些框架開發(fā)的。軟件棧包括驅(qū)動程序、編譯器、函數(shù)庫、算字庫、工具包等等,是實現(xiàn)高性能、高通用性、高易用性,以及針對不同應(yīng)用場景深度優(yōu)化的關(guān)鍵。
生態(tài)搭建的難度和時間,遠(yuǎn)比芯片開發(fā)要更難、更長。
安謀中國AI技術(shù)高級市場經(jīng)理吳彤曾表示,ASIC定制類的AI芯片會在未來的五到十年內(nèi)成為市場上的主流,與此同時,AI芯片領(lǐng)域?qū)S眉軜?gòu)(DSA)也將開始流行。
針對不同的應(yīng)用場景,客戶的需求并不統(tǒng)一。一個可以商用的AI芯片除去自身芯片的研發(fā),更多的時間還是花在了創(chuàng)造生態(tài)上。
在AI訓(xùn)練芯片領(lǐng)域,國際巨頭英偉達(dá)一家獨(dú)大,云端訓(xùn)練芯片上,很少有公司能夠突破英偉達(dá)生態(tài)。在英偉達(dá)快速擴(kuò)大中,生態(tài)成為了他的“護(hù)城河”。在2019年,云廠商亞馬遜、谷歌、阿里巴巴中97.4%的人工智能加速器都部署了英偉達(dá)的圖形處理器。
生態(tài)的改變絕非一朝一夕的事。
國內(nèi)廠商的芯片落地
2018年,騰訊戰(zhàn)略領(lǐng)投了燧原科技。燧原科技的通用AI訓(xùn)練芯片專為人工智能計算領(lǐng)域而設(shè)計,基于這種芯片的AI加速卡、燧原智能互聯(lián)技術(shù),以及“馭算”計算及編程平臺可實現(xiàn)深度全棧集成,為編程人員提供針對性的加速AI計算。
面向AI云端訓(xùn)練,邃思2.0在7月份正式發(fā)布。
尺寸為57.5毫米×57.5毫米(面積為3306mm2),達(dá)到了芯片采用的日月光2.5D封裝的極限,與上代產(chǎn)品一樣采用格羅方德12nm工藝,單精度FP32算力為40TFLOPS,單精度張量TF32算力為160TFLOPS,整數(shù)精度INT8算力為320TOPS。
燧原產(chǎn)品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內(nèi)容生產(chǎn);強(qiáng)大的視覺能力,保駕護(hù)航金融安全;邊緣部署融合多數(shù)據(jù),構(gòu)建新型智能化交通;高效推理算力集群,建設(shè)園區(qū)AI視頻云。
中科寒武紀(jì),寒武紀(jì)科技的終端智能處理器IP主要產(chǎn)品有2016年推出的寒武紀(jì)1A處理器、2017年推出的寒武紀(jì)1H處理器、2018年推出的寒武紀(jì)1M處理器;云端智能芯片及加速卡產(chǎn)品有2018年推出的思元100、2019年推出的思元270、2021年初正式亮相的思元290;邊緣智能芯片及加速卡為思元220,推出時間為2019年。
寒武紀(jì)科技面向云、邊、端三大場景研發(fā)了三種類型的芯片產(chǎn)品。
分別為終端智能處理器IP、云端智能芯片及加速卡、邊緣智能芯片及加速卡,并為上述三個產(chǎn)品線所有產(chǎn)品研發(fā)了統(tǒng)一的基礎(chǔ)系統(tǒng)軟件平臺(包含應(yīng)用開發(fā)平臺)——Cambricon Neuware軟件開發(fā)平臺(適用于其所有芯片與處理器產(chǎn)品)。
中星微,于 2016 年 6 月率先推出全球頭先款具有深度學(xué)習(xí)能力的嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)人工智能芯片——“星光智能一號”,其后又于 2018 年推出運(yùn)算速度提高 16 倍、功耗降低50%、適用場景更廣的“星光智能二號”(NPU-II)人工智能芯片。
在今年9月的中關(guān)村論壇上,中星微發(fā)布了后摩爾時代下的新一代人工智能機(jī)器視覺芯片——“星光摩爾一號”。
“星光摩爾一號”是面向邊緣計算的人工智能機(jī)器視覺芯片,可廣泛應(yīng)用于各類機(jī)器視覺邊緣計算。支持800萬像素的圖像處理、視頻編解碼、安全加解密和異構(gòu)智能計算,其視頻編解碼提供國標(biāo)SVAC2.0與H.265兩種格式的自由切換和轉(zhuǎn)碼,支持國標(biāo)35114的A、B、C三種安全級別,提供4TOPS的深度學(xué)習(xí)峰值算力并支持多模融合智能計算框架。
地平線機(jī)器人(Horizon Robotics)。成立于 2015 年,總部在北京,創(chuàng)始人是前百度深度學(xué)習(xí)研究院負(fù)責(zé)人余凱。
地平線機(jī)器人在2021年先后發(fā)布了芯片征程5、Matrix 5平臺和Matrix SuperDrive整車智能解決方案,并將推出國內(nèi)首個開源安全實時操作系統(tǒng)TogetherOS。9月15日,搭載了地平線旭日3芯片,科沃斯發(fā)布了最新一代掃地機(jī)器人地寶X1也成為了業(yè)內(nèi)首款搭載AI專用芯片的掃地機(jī)器人。
除去掃地機(jī)器人芯片的使用,征程2則是商用落地的車規(guī)級AI芯片。該芯片現(xiàn)已應(yīng)用于智能輔助駕駛、高級別自動駕駛、高精建圖與定位,以及智能座艙等智能駕駛場景。基于軟硬結(jié)合的創(chuàng)新設(shè)計理念,可提供4 TOPS等效算力,典型功耗僅2瓦;而且具有極高的算力有效性,每TOPS算力可達(dá)同等算力GPU的10倍以上。
靈汐科技,類腦芯片KA200入選2021年世界互聯(lián)網(wǎng)領(lǐng)先科技成果“提名項目”。該系列產(chǎn)品可廣泛應(yīng)用于云端和邊緣計算,滿足眾多傳統(tǒng)人工智能企業(yè)的智能化升級需求,促進(jìn)智慧城市、智能網(wǎng)聯(lián)車等眾多相關(guān)行業(yè)的發(fā)展和變革。
不僅能高效支持類腦計算模型和大規(guī)模腦仿真,為腦科學(xué)領(lǐng)域提供有利工具。同時,還可助力構(gòu)建更大、更快、更精準(zhǔn)的功能級腦仿真平臺,推動腦科學(xué)與類腦算法的研究和類腦生態(tài)構(gòu)建。
計算機(jī)科學(xué)與腦科學(xué)融合的類腦芯片KA200,采用異構(gòu)融合眾核、存算一體的架構(gòu),單芯片集成25萬神經(jīng)元和2500萬突觸,每秒超過16萬億次突觸計算,功耗近12瓦。KA200已經(jīng)于2021年實現(xiàn)量產(chǎn)。
并且基于KA200構(gòu)成了完整的產(chǎn)品體系,如類腦計算板卡、類腦計算模組、類腦服務(wù)器、軟件工具鏈和系統(tǒng)軟件以及類腦整體解決方案。
國內(nèi)本土的AI芯片在不同場景應(yīng)用中發(fā)力。
燧原科技面向云端訓(xùn)練,瞄準(zhǔn)具體商業(yè)落地場景;寒武紀(jì)科技面向云、邊、端三大場景研發(fā)了三種類型的芯片產(chǎn)品;中星微則布局嵌入式人工智能大規(guī)模商用,與AlphaGo這樣高算力、高功耗的服務(wù)器端AI不同,嵌入式人工智能應(yīng)用需要小型化、低功耗、低成本的芯片,星光智能二號完美地符合了這些需求,攝像頭本身就具備AI邊緣計算功能。
落地應(yīng)用前景
云端和邊緣端
作為AI算力的主要應(yīng)用場景,AI芯片在云端發(fā)展需要解決算力性價比與通用性問題。算力性價比決定了人工智能應(yīng)用的部署成本,而算力通用性及軟件生態(tài)決定著不同算法的遷移及開發(fā)成本。
在邊緣和終端這一側(cè),AI芯片所面臨的挑戰(zhàn)是它們會被部署在各種各樣的應(yīng)用環(huán)境中。即便在同一個垂直場景里,也需要考慮不同模塊之間的任務(wù)負(fù)載均衡問題。
賽靈思的單羿認(rèn)為,FPGA因為有靈活可編程的優(yōu)勢,可以根據(jù)場景的持續(xù)需求調(diào)整這些模塊之間的資源占用比例,從而達(dá)到全系統(tǒng)最優(yōu)的效果。
ADAS/自動駕駛應(yīng)用場景落地
地平線瞄準(zhǔn)自動駕駛應(yīng)用場景,在ADAS/自動駕駛應(yīng)用場景下,AI芯片的核心價值就是實時處理行駛道路上的人、車、物等復(fù)雜環(huán)境的感知和決策。
目前,自動駕駛芯片在架構(gòu)設(shè)計、研發(fā)投入與車規(guī)級應(yīng)用等方面仍處于較為前期的探索過程中,特別是國產(chǎn)汽車芯片的市場份額還有待提升,因此,突破本土自動駕駛芯片技術(shù)的發(fā)展壁壘,將成為促進(jìn)未來中國智能汽車產(chǎn)業(yè)發(fā)展的關(guān)鍵環(huán)節(jié)。
安防
安防是目前最為明確的AI芯片應(yīng)用場景,主要任務(wù)是視頻結(jié)構(gòu)化。攝像頭終端加入AI芯片,可以實現(xiàn)實時響應(yīng)、降低帶寬壓力。也可以將推理功能集成在邊緣的服務(wù)器級產(chǎn)品中。
AI芯片要有視頻處理和解碼能力,主要考慮的是可處理的視頻路數(shù)以及單路視頻結(jié)構(gòu)化的成本。
寫在最后
在AI芯片狂熱的背后,越來越多的關(guān)注點轉(zhuǎn)移到落地,中國的AI狂歡并不會持續(xù)太久。在“老大吃肉,老二喝湯”的半導(dǎo)體行業(yè),AI芯片也具有這樣的屬性,每個產(chǎn)品線最后會跑出兩三家公司。不過這是未來的格局,現(xiàn)在的AI芯片市場,很符合一句話:讓子彈先飛一會。