為AI/ML芯片提供更靈活、高效的運算核心
SiFive產品副總裁Chris Jones指出,AI技術快速演進,各種演算法與架構推陳出新,為了最佳化PPA,特別是在邊緣端的推論引擎,業者普遍采用hard-wire的專用硬件加速器設計。但卻因此缺乏可編程性,無法因應演算法的未來變化,這是目前主要的挑戰之一。
「我們認為,邊緣端的推論引擎有龐大商機,且其工作負載主要是AI、影像處理等,非常適合采用矢量處理。而矢量指令集擴充是原生RISC-V架構的一部分,對此深具優勢。」
有監于此,SiFive已于2021年推出首款專為AI/ML打造的矢量運算核心X280,企圖提供具可編程性的另一個選擇。然而推出后雖有成功案例,卻發現許多客戶仍不愿放棄自訂加速器的做法。因此決定進一步擴充核心功能,真正滿足市場的需求。
「我們學習到,客戶會把X280作為神經網絡加速器的協同處理器,NN相關運算在加速器中執行,再把數據傳到X280做基本的矢量運算。由于數據的往返傳輸,不僅造成延遲,功耗也較高,因此我們新增了矢量協同處理器界面擴展(VCIX)功能,使客戶的自訂加速器能與X280直接介接,加速矢量運算的執行?!?/p>
由于無需再透過匯流排傳輸界面,此做法能顯著提升自訂加速器的執行速度。Google已是SiFive的重要成功案例,透過采用此架構來加速其AI運算。Chris Jones強調,對Google來說,他們可以專注于其專精的AI演算法運算,并運用我們優異的矢量指令集架構,結合兩家公司的強項,將能為AI運算帶來更大的突破。
此外,為了提供更高效能,X280也新增了多核心、多叢集功能,最多可擴展到4叢集、共16個核心,使其可適用于從一般的邊緣裝置,到更高端的應用。
X280自2021年推出以來,已取得了兩位數的設計成功案例,「今年我們還會再繼續推出新產品,例如支持更寬位元的矢量長度,并提供更高的運算效能,以持續推動創新。對我們來說,AI應用未來將觸及各領域,而這正符合我們的矢量運算強項。因此,我們會把矢量處理功能帶到更多的產品線,做整合性的強化。此外,車用市場也是一大重點,去年我們已推出車用處理器,2023年也將推出包含矢量運算功能的新款車用處理器?!?/p>
新推兩款核心,推動RISC-V架構進入高端消費市場
另一方面,SiFive亦為Performance系列核心推出了兩款具備矢量運算功能的新產品,分別P670與P470。Chris Jones表示,「P670是目前市場上最高效能的可授權RISC-V處理器,已獲得市場的熱烈反應,證明了RISC-V核心也能夠朝高端市場邁進,足以與競爭對手的A77及A78核心真正的競爭。而P470則是鎖定穿戴裝置,能針對這類應用提供最佳的效能、面積與功率之間的平衡。」
SiFive擁有架構上的優勢,能夠提供更高的運算密度,也就是說在單位面積內,可提供比競爭對手更高效能的運算效能,或是以相同功率能夠提供更高的效能,這是真正符合業界所需的。舉例來說,就單一執行緒效能來比較,P470的運算密度是Cortex-A55核心的四倍,P670則是Cortex-A78核心的兩倍。
「雖然ARM也有矢量擴展功能,但僅限于高端核心才有,其他應用則須采用NEON處理器。我們的方案可直接取代NEON,同時我們也提供了軟件工具來協助客戶從ARM架構轉換到RISC-V架構。此外,即使客戶熟悉SVE架構,我們亦能提供更具成本效益的解決方案?!?/p>
過去,純量處理器是主流,但隨著進入AI應用時代,Chris Jones認為,業界將需要矢量處理來支持更多的平行運算需求,這是未來運算的一個重要趨勢。我們相信,亂序(OoO)、矢量的低功耗高效能運算處理器將會有廣大的市場,這將為SiFive帶來絕佳的成長機會,使RISC-V架構被更廣泛地采用。