芯片是戰(zhàn)略要地。目前GPU芯片在深度神經(jīng)網(wǎng)絡(luò)訓練領(lǐng)域獲得大范圍的應用,但受制于功耗、應用優(yōu)化性等方面的限制,仍有眾多的巨頭和初創(chuàng)公司在該領(lǐng)域積極探索,英特爾2016年發(fā)布Nervana AI處理器,可加速各類神經(jīng)網(wǎng)絡(luò)。谷歌2016年也發(fā)布了自己的ASIC芯片TPU,用于加速深度神經(jīng)網(wǎng)絡(luò),微軟、AMD、百度等也相繼加入戰(zhàn)局。
寒武紀研發(fā)了國際首個深度學習專用處理器芯片(NPU),目前其IP指令集,已擴大范圍授權(quán)集成到手機、安防、可穿戴設(shè)備等終端芯片中,2016年就已拿到1個億元訂單。
執(zhí)行董事羅韜26日表示,目前寒武紀深度學習處理器,若以階段性論,還處于相當于“ARM”的授權(quán)階段,未來一年內(nèi),將推出芯片問世,并擬與臺積電先進工藝制程展開合作。
寒武紀之所以想要開發(fā)一款專用的深度學習處理器,因為有必要有專門的深度學習處理處,來提升效能與克服降低功耗。通用芯片與專用芯片相比,就像是一把萬能的瑞士軍刀與菜刀之比,想要切菜得好,必須有專用的菜刀堪用。而深度學習是處理智能應用迄今最好的方法。
羅韜表示,AI已經(jīng)在很多領(lǐng)域超越了人腦。但是傳統(tǒng)的CPU/GPU處理深度學習效率低下,他舉例,AlphaGo使用上千個CPU和數(shù)百個GPU,下一盤棋的電費就高達3000美元,相當耗能。
而寒武紀的目標,據(jù)稱,是要讓1瓦以內(nèi)功耗的攝像頭、手機、甚至手表都能和AlphaGo一樣“聰明”。
光靠NPU指令集就已賺錢
他也分享目前寒武紀的近況。就在2016年國際計算機體系結(jié)構(gòu)年會中,約有1/6的論文都引用寒武紀開展神經(jīng)網(wǎng)絡(luò)處理器研究。
目前寒武紀設(shè)立了三條產(chǎn)品線:首先是智能終端處理器IP授權(quán),智能IP指令集可授權(quán)集成到手機、安防、可穿戴設(shè)備等終端芯片中,客戶包括國內(nèi)頂尖SoC廠商,目前已經(jīng)開始投入市場。而2016年全年就已拿到1個億元訂單。這也使得寒武紀研發(fā)了國際首個深度學習專用處理器芯片,于2016年第一年成立,就實現(xiàn)盈利。
其次,在智能云服務器芯片領(lǐng)域:作為PCIE加速卡插在云服務器上,客戶主要是國內(nèi)的知名服務器廠商。
另外,家用智能服務機器人芯片:從智能玩具、智能助手入手,使服務機器人獨立具備看聽說的能力。客戶是各類下游機器人廠商,產(chǎn)品的推出將比智能云服務器芯片更晚一些。
日前中科院還注資1000萬元,這1000萬元專項資金一方面用于人工智能芯片的基礎(chǔ)性研究,探索下一代人工智能芯片的架構(gòu)、算法以及在一些新型場景(如AR/VR)中的應用開發(fā)方法。
下一階段重點 流片商用問世
據(jù)指出,DianNao是寒武紀系列的第一個原型處理器結(jié)構(gòu),平均性能超過主流CPU核的100倍,但面積和功耗僅為1/10,效能提升可達三個數(shù)量級。
寒武紀處理器能直接面對大規(guī)模神經(jīng)元和突觸處理,一條指令完成一組神經(jīng)元處理,相比傳統(tǒng)執(zhí)行x86指令集的芯片,有數(shù)量級的性能提升,未來在云服務器和智能終端上的圖像識別、語音識別、人臉識別等方面有著較廣應用前景。
而邁入下一個階段,寒武紀從IP指令集授權(quán),到推出商用芯片問世,預料是目前緊鑼密鼓籌備的重點。
相關(guān)人士也指出,寒武紀目前鎖定與臺積電最先進的工藝制程合作,其中對其量產(chǎn)成熟的14納米工藝很有興趣。預期最快一年后流片。
行業(yè)人士還指出,國內(nèi)現(xiàn)在高端芯片設(shè)計領(lǐng)域的實力已經(jīng)提升,但是國內(nèi)晶圓代工廠的工藝制程還沒跟上節(jié)奏,包括展訊14納米找英特爾代工、兆芯14納米CPU也都選擇與臺積電合作。
相關(guān)人士表示,目前看國內(nèi)芯片廠的技術(shù)節(jié)點仍落于國外兩到三個世代,在28納米工藝制程還未站穩(wěn)腳跟的當下,在國內(nèi)選擇綜合考量上,高端芯片會多傾向以選擇臺積電、GLOBALFOUNDRIES為主,而臺積電則又較具兩岸優(yōu)勢。