9月初,隨著美國限制對中國出口高性能數據中心GPU,加速計算國產化趨勢漸明,國內芯片企業正趁勢發展,帶動AI芯片、GPU市場熱度。在資本市場上,中國相關概念股應聲上漲。
“在AI芯片領域,天時地利人和,包括國家政策、人才和經驗等等,這是很好的機會。”近日,燧原科技創始人兼CEO趙立東接受界面新聞記者采訪時稱,把握上述機會的關鍵是打破生態壟斷,實現架構創新。
燧原科技于2018年3月注冊成立,在種子輪之后對外公布了四輪融資,且四輪均有騰訊參投,累計融資額近40億元人民幣。在產品上較早實現了AI芯片的產品化,產品體系覆蓋云端的人工智能訓練、推理芯片及其加速卡、人工智能訓練OAM模組,是國內早期同時擁有云端訓練、云端推理解決方案的AI芯片初創公司。在9月初的世界人工智能大會上(WAIC),燧原科技發布“云燧智算機”人工智能加速集群產品,進入集群計算領域。
燧原科技的創始團隊來自AMD。趙立東曾擔任紫光集團副總裁,更早前在AMD工作了7年時間,任計算事業部高級總監等。另一位創始人兼COO張亞林曾任職AMD上海研發中心,擔任多個芯片項目研發負責人。
團隊建制完整是投資人看好燧原的重要原因,創始人外,燧原相當一部分高端人才也來自AMD。“AMD一度有三分之一的全球收入來自中國,而中國有完整的建制研發體系,獨缺產品定義權。”趙立東解釋,所謂產品定義,即協調各個部門確定芯片產品,定義規格,做好競爭分析,明確市場前景。這一重要工作一直由AMD德州奧斯丁總部承擔。
在AMD的經歷和創始團隊的芯片開發經驗,成為燧原成立的契機和基礎。從產品和團隊規模而言,近四年時間里,燧原從不足十幾個人發展到八百人,產品從單一的訓練芯片發展為端到端方案,最終又涉足更復雜的集群計算。
趙立東表示,燧原看到的機會是:逐漸增長的AI計算需求下,傳統的CPU(中央處理器)已不能滿足算力的需求,GPU(圖形處理器)憑借并行計算能力一躍成為最佳選擇。而英偉達為GPU構建的數學、算子、函數庫等完整軟件生態,讓GPU成為AI計算無可爭議的主角。
AI計算大致分為兩個層面,首先是對模型進行訓練,整個過程可能耗時數天;之后是訓練出的模型響應實際請求,如對一張圖片進行識別,做出推理。從架構而言,英偉達的傳統GPU約60%的面積用于通用計算,30%用于圖形渲染,主要是加速計算的GPGPU(通用計算GPU)普遍去掉圖形渲染部分。過去十多年,英偉達捕捉到AI技術崛起的浪潮,通過CUDA平臺搭建的軟件生態,使其GPU成為全球數據中心處理AI應用的標配,占據了超過90%的市場份額。在云端領域,目前英偉達旗下的GPU占據訓練市場不少份額,部分推理任務則由英特爾CPU承擔 。
業界普遍認為,訓練芯片的研發難度和商業化落地更難,原因是在AI訓練的過程中,神經網絡模型并沒有固定,所以對芯片的通用性有很高的需求,英偉達的GPU長期為第一選擇。而推理則更簡單,增速更快,故而訓練芯片對于芯片公司的設計能力考驗更高。從全球AI芯片市場來看,先推理后訓練是主流路徑,英特爾收購的AI芯片公司Habana、國內諸多AI初創公司也是如此。
以此來看,燧原科技先推訓練芯片、后發推理芯片的路線頗為特別。
2019年12月,燧原科技發布第一款云端訓練芯片“邃思”,并以此芯片衍生出訓練和推理兩款衍生計算卡。“不僅做大芯片而且是做人工智能訓練芯片,它比推理要復雜很多。訓練芯片可以做推理,但推理芯片不能做訓練。”趙立東稱。隨后燧原又推出第二代訓練芯片邃思2.0和推理芯片邃思2.5,共計三款芯片。
實際上,在AI計算領域,由于受到諸多云巨頭和初創公司的沖擊,英偉達一家獨大的格局有望被改變。
特別是在中國,強勢的英偉達并非沒有“弱點”:絕大部分AI廠商依賴英偉達軟硬件生態,議價能力不足;另一方面,基于英偉達非開源軟件開發AI功能,難以進行更深度開發。而客戶支持、服務團隊方面,英偉達很難將BAT等中國客戶與美國谷歌、亞馬遜等美國公司等同視之。
也因此,有必要建設自有芯片生態供應鏈。據趙立東介紹,燧原選擇自建開發工具鏈,適配自家硬件。不過,目前絕大多數專攻AI領域的國產芯片廠商依賴或兼容英偉達的CUDA軟件生態,從而在起步階段避開了英偉達的軟件生態壁壘,趙立東認為,從軟硬件一體的角度很難去評價這一做法,芯片在兼容CUDA生態基礎上超越英偉達GPU可能會存在知識產權問題。
燧原科技也在嘗試推進其硬件系統和軟件一體化,并與機器學習算法無縫協作,比如適配谷歌的TensorFlow、Facebook的Pytorch以及百度“飛槳”等機器學習倉庫中收集的算法,補全生態。所謂AI芯片生態,是指包括驅動程序、編譯器、開發者工具包等軟件層,以簡化AI開發人員的工作。
值得注意的是,類似燧原這樣的初創芯片公司,也面臨著如何與大型互聯網公司打交道的問題。
目前中國互聯網巨頭均在AI芯片領域布局,BAT也是主流云服務商,每年都會采購大量計算硬件。此前阿里半導體部門“平頭哥”已經搭建了AI芯片業務,百度旗下則有AI芯片公司昆侖芯,而騰訊云曾披露三款自研芯片進展,稱其中一款AI芯片已流片試產。三家中,平頭哥和昆侖芯均明確會拓展外部客戶。
芯片在落地過程中,成本也是企業決策的考量因素。互聯網公司自研芯片,無論是從成本、開發周期,維護來看,都難以做到最好,其中一些只針對特定場景開發芯片,自用規模有限,而規模決定盈利能力,帳更難以算清,實現不了盈利就不能持續迭代。
趙立東強調,面對其他芯片公司的競爭,燧原要在芯片性價比、能耗比上做到極致。據他透露,燧原今年最主要的目標是產品規模化落地,擴大市場份額。第三代芯片產品年底會流片,預期會在第二代產品規模化基礎上實現盈利。
不過,在燧原芯片產品持續迭代下,前期成本巨大,需要在規模化后進一步開源節流,提高毛利率,才能實現盈利, “(實現的)時間取決于市場環境如何,如果優先級仍然是市占率,可能要靠犧牲毛利降低價格來搶占,還要看需求,最終要多方考慮做綜合判斷決策。”趙立東表示。
更多信息可以來這里獲取==>>電子技術應用-AET<<