2020年7月15日,北京——Graphcore今日正式發布第二代IPU以及用于大規模系統級產品IPU-Machine: M2000(IPU-M2000),新一代產品具有更強的處理能力、更多的內存和內置的可擴展性,可處理極其龐大的機器智能工作負載。
IPU-M2000是一款即插即用的機器智能刀片式計算單元,由Graphcore全新的7納米 Colossus? 第二代 GC200 IPU提供動力,并由Poplar?軟件棧提供全面支持。其設計便于部署,并支持可擴展至大規模的系統。這款纖薄的1U刀片機可提供1個PetaFlop的機器智能計算,并集成了針對AI擴展優化的網絡技術。
Graphcore第二代Colossus? IPU處理器:GC200
Graphcore IPU-M2000
IPU-M2000可構建成IPU-POD64這一Graphcore全新模塊化機架規模解決方案,可用于極大型機器智能橫向擴展,提供前所未有的AI計算可能性,以及完全的靈活性和易于部署的特性。它可以從一個機架式本地系統擴展到高度互連的超高性能AI計算設施中的1000多個IPU-POD64系統。
“隨著IPU-M2000和IPU-POD64的推出,Graphcore進一步擴大了我們在機器智能領域的產品競爭優勢。”Graphcore首席執行官Nigel Toon指出:“Graphcore通過技術創新實現更強有力的產品線,這些創新能夠提供客戶所期望的行業領先性能。對于尋求將機器智能計算添加到數據中心的客戶而言,Graphcore最新推出的IPU-M2000憑借其強大的算力、易于擴展的靈活性和突出的易用性,將具有極強的可行性和價值提升潛力。”
Mk1 IPU產品的用戶可以確信,他們現有的模型和系統可以在這些新的Mk2 IPU系統上無縫運行。雖然第一代Graphcore IPU產品已經處于領先地位,但與之相比,第二代產品的性能還將提高8倍。
Mk1 IPU產品與Mk2 IPU產品性能對比
IPU-M2000的設計使客戶可以在IPU-POD?配置中構建多達64,000個IPU的數據中心規模系統,提供16ExaFlops的機器智能計算能力。新的IPU-M2000甚至能夠處理最艱巨的機器智能訓練或大規模部署工作負載。
Graphcore全新的IPU-Fabric?技術使大規模連接IPU-M2000和IPU-POD成為可能,該技術是專為機器智能通信而從頭設計的,并提供了專用的低時延結構,可在整個數據中心內連接IPU。
Graphcore IPU-Fabric?技術
Graphcore的Virtual-IPU軟件與工作量管理和編排軟件集成在一起,可以輕松地為許多不同的用戶提供訓練和推理服務,并允許根據工作情況調整和重新配置可用的資源。
無論您是要使用單個IPU還是要使用數千個IPU來完成機器智能工作負載,Graphcore的Poplar SDK都可以使這一過程變得簡單。您可以使用首選的AI框架(例如TensorFlow或PyTorch)。而且,從這一高級描述中,Poplar將構建完整的計算圖,以捕獲計算、數據和通信。然后,它會充分利用可用的IPU硬件,編譯此計算圖,并構建用于管理計算、存儲和網絡通信的運行時程序。
Graphcore的最新產品線是通過三大顛覆性技術創新實現的,這些創新可提供客戶期望的行業領先性能:
· 計算:每個IPU-M2000的核心都是Graphcore新的Graphcore Colossus?Mk2 GC200 IPU。該芯片采用臺積電最新的7納米工藝技術開發,每個芯片在一個823平方毫米的裸片上包含超過594億個晶體管,使其成為有史以來最復雜的處理器。
· 數據:每個IPU都有大量的In-Processor Memory?。Graphcore新型Mk2 GC200在處理器內部具有史無前例的900MB超高速SRAM,在每個處理器內核旁邊都設有大量RAM,以實現每位最低能量的訪問。Graphcore的Poplar軟件還允許IPU通過Graphcore獨特的Exchange-Memory?通信訪問Streaming Memory?。這甚至可以支持具有數千億個參數的最大模型。每個IPU-M2000都可以支持密度高達450GB的Exchange-Memory?,以及前所未有的180TB/秒的帶寬。
· 通信:IPU-M2000具有內置的專用AI聯網IPU-Fabric?。Graphcore創建了一個新的Graphcore GC4000 IPU-Gateway芯片,該芯片可提供令人難以置信的低時延和高帶寬,每個IPU-M2000均可提供2.8Tbps。在從數十個IPU擴展到數以萬計個IPU的過程中,IPU-Fabric技術使通信時延幾乎保持恒定。
“將強勁算力與網絡能力相結合,我們能夠處理全球最先進、最復雜的算法模型。”Graphcore高級副總裁兼中國區總經理盧濤表示:“這樣的算法模型,對中國本地的AI算法落地場景,如云計算、互聯網和通信等場景都會產生推動作用,并將為AI產業者提供巨大的價值。”
在中國市場,Graphcore與領先的本地商業用戶展開緊密的早期合作,基于IPU的開發者云已于7月初正式上線,其IPU-POD產品技術,已在IPU開發者云上供用戶訪問。因此,中國很可能成為Graphcore最新推出的第二代處理器技術最先實現商業化落地的區域之一。
以上努力,僅僅是Graphcore在中國市場進行的相當規模的投資中的一部分。Graphcore還在本地構建了強有力的工程化團隊,希望與本地的AI產業者和AI創新者進行緊密合作,以先進科技助推中國AI創新。