當前,移動互聯、萬物互聯、工業4.0、人工智能、自動駕駛、5G網絡等一波又一波的革新應用正在推動整個軟硬件系統的巨大變革浪潮--從超大規模的數據中心到企業私有數據中心,再到各種領域的邊緣計算,對于這些新興系統中的各個部分,如計算、分析、網絡處理、存儲以及人工智能的機器學習等都帶來前所未有的挑戰。
如何有效支撐日新月異的新應用,如何滿足各種應用急速增長的處理性能需求,如何應對在性能提升的同時帶來的能耗大幅增長,如何應對新系統大量部署所帶來的成本壓力……對于這些層出不窮的挑戰,傳統的架構已無法有效應對。市場需要一系列全新的解決方案,以應對高性能、靈活和上市時間等方面的不同需求。
高性能嵌入式FPGA半導體知識產權領導性企業Achronix半導體公司,日前在北京舉行新產品發布會。Achronix公司董事長兼首席執行官Robert Blake、亞太區總經理羅煒亮出席會議并介紹了該公司革新的FPGA產品Speedster7t以及在中國市場的最新進展和策略。
Achronix公司董事長兼首席執行官Robert Blake
Speedster7t創造了一類全新的“FPGA+”技術
Speedster7t系列基于一種高度優化的全新架構,以其所具有的如同ASIC一樣的性能、可簡化設計的FPGA靈活性和增強功能,從而遠遠超越傳統的FPGA解決方案,可有效解決高性能計算、網絡存儲加速、超高帶寬網絡處理、機器學習等應用面臨的挑戰。
Speedster7t FPGA系列產品是專為高帶寬應用進行設計,具有一個革命性的全新二維片上網絡(2D NoC),以及一個高密度全新機器學習處理器模塊陣列。通過將FPGA的可編程性與ASIC的布線結構和計算引擎完美地結合在一起,Speedster7t系列產品創造了一類全新的“FPGA +”技術。
Speedster7t系列產品創造了一類全新的“FPGA +”技術
“我們正處于智能化、自學習計算的高增長階段的早期,這種計算將廣泛影響我們日的常生活。”Achronix Semiconductor總裁兼首席執行官Robert Blake表示:“Speedster7t是Achronix歷史上最令人激動的發布,代表了建立在四個架構代系的硬件和軟件開發基礎上的創新和積淀,以及與我們領先客戶之間的密切合作。Speedster7t是靈活的FPGA技術與ASIC核心效率的融合,從而提供了一個全新的‘FPGA+’芯片品類,它們可以將高性能技術的極限大大提升。”
Speedster7t的三大創新
據Robert介紹,Speedster7t FPGA系列產品基于臺積電(TSMC)的7nm FinFET工藝,具有革命性的新型二維片上網絡(2D NoC)和一系列針對高帶寬和人工智能/機器學習(AI / ML)應用進行了優化的新型機器學習處理器(MLP)。Speedster7t器件還具有滿足未來AI/ML需求所需的超高帶寬接口,包括400G以太網端口、用于數據傳輸的PCI Express Gen5端口以及用于業界最靈活、低成本、高帶寬存儲的GDDR6控制器。
創新一:新型機器學習處理器(MLP) 為計算性能進行了高度的優化
Speedster7t FPGA的核心是其全新機器學習處理器(MLP)中大規模的可編程計算單元平行陣列,它們可提供業界最高的、基于FPGA的計算密度。MLP是高度可配置的、計算密集型的單元模塊,可支持4到24位的整點格式和高效的浮點模式,包括對TensorFlow的16位格式的支持,以及可使每個MLP的計算引擎加倍的增壓塊浮點格式的直接支持。
MLP與嵌入式存儲器模塊緊密相鄰,通過消除傳統設計中與FPGA布線相關的延遲,來確保以750 MHz的最高性能將數據傳送到MLP。這種高密度計算和高性能數據傳輸的結合使得處理器邏輯陣列能夠提供基于FPGA的最高可用計算能力以每秒萬億次運算數量為單位(TOPS,Tera-Operations Per Second)。
創新二:世界級的帶寬 全球第一款直接加載了GDDR6的FPGA產品
高性能計算和機器學習系統的關鍵之處是高片外存儲器帶寬,從而為多個數據流提供存儲源和緩沖。 Speedster7t器件是唯一支持GDDR6存儲器的FPGA,該類存儲器是具有最高帶寬的外部存儲器件。每個GDDR6存儲控制器都能夠支持512 Gbps的帶寬,Speedster7t器件中有多達8個GDDR6控制器,可以支持4 Tbps的GDDR6累加帶寬,并且以很小的成本就可提供與基于HBM的FPGA等效存儲帶寬。
除了這種非凡的存儲帶寬,Speedster7t器件還包括業界最高性能的接口端口,以支持極高帶寬的數據流。Speedster7t器件擁有多達72個業界最高性能的SerDes,可以達到1到112 Gbps的速度。還有帶有前向糾錯(FEC)的硬件400G以太網MAC,支持4x 100G和8x 50G的配置,以及每個控制器有8個或16個通道的硬件PCI Express Gen5控制器。
創新三:革命性的2D片上網絡(NOC) 實現超高效率的數據移動
來自Speedster7t高速I / O和存儲器端口的數萬兆比特數據很容易淹沒傳統FPGA面向比特位的可編程互連邏輯陣列的路由容量,而Speedster7t架構包含一個可橫跨和垂直跨越FPGA邏輯陣列的創新性的、高帶寬的二維片上網絡(NOC),它們連接到所有FPGA的高速數據和存儲器接口。它們就像疊加在FPGA互連這個城市街道系統上的空中高速公路網絡一樣,Speedster7t的NoC支持片上處理引擎之間所需的高帶寬通信。NoC中的每一行或每一列都可作為兩個256位實現,單向的、行業標準的AXI通道,工作頻率為2Ghz,同時可為每個方向提供512 Gbps的數據流量。
通過在Speedster中實現專用二維 NoC,極大地簡化了高速數據移動,并確保數據流可以輕松地定向到整個FPGA結構中的任何自定義處理引擎。最重要的是,NOC消除了傳統FPGA使用可編程路由和邏輯查找表資源在整個FPGA中移動數據流中出現的擁塞和性能瓶頸。這種高性能網絡不僅可以提高Speedster7t FPGA的總帶寬容量,還可以在降低功耗的同時提高有效LUT容量。
Speedster7t FPGA可無縫切換到ASIC 用以滿足大批量需求
Achronix是唯一一家既提供獨立FPGA芯片又提供Speedcore嵌入式FPGA(eFPGA)半導體知識產權的公司。Achronix在Speedcore eFPGA IP中采用了與Speedster7t FPGA中使用的同一種技術,可支持從Speedster7t FPGA到ASIC的無縫轉換。FPGA應用通常具有必須保持可編程性的功能,而其他固定功能則是專用于特定的系統應用。對于ASIC的轉換而言,固定功能可以被固化進ASIC結構中,從而減小芯片面積、成本和功耗。當使用Speedcore eFPGA IP將Speedster7t FPGA轉換為ASIC時,與一款獨立的FPGA芯片相比,客戶有望節省高達50%的功耗并降低90%的成本,同時在性能上可享受高出10倍的帶寬和低100倍的延遲。
將Speedcore技術嵌入到復雜的器件中,除了直接獲得物理上的各項優勢,設計人員還可以為其SoC設計增加獨有的、長期的價值。Speedcore IP內核將作為可重新配置的協處理器和硬件加速器來支持各種各樣的任務,其采用比特位導向(bit-oriented)的FPGA架構,比字段導向(word-oriented)的CPU架構顯著更為高效。當集成在基于Arm的SoC中時,這一優勢是顯而易見的,其中Speedcore eFPGA是一個靈活的、可重構的、用于特定工作負載的硬件加速器,適用于諸如SQL卸載、在線I/O處理、加密、搜索引擎算法性加速和增強多媒體處理等功能。