隨著更多云廠商越來越需要進行針對系統的專門優化,定制化的芯片設計開始變成普遍流行,基礎設施芯片市場變得越來越有趣,玩家越來越多。今年以來,包括印度電子和信息技術部MeitY,法國芯片初創企業 SiPearl,韓國電子通信研究所 ETRI,都宣布開發基于Neoverse V1的產品。
國內廠商奮起直追
包括騰訊和阿里在內的一批國內系統廠商,正在加速構建基于Arm的服務器的芯片。
騰訊專項測試技術中心總監黃聞欣(Victor Huang)表示:“2020年,騰訊和Arm正式簽署了一份合作協議,希望通過合作加速Arm Neoverse技術的測評和適配。后面我們通過TencentBench測試框架發現,得益于更多可擴展的CPU核心數,Arm服務器比傳統的服務器性能表現更強勁。非常值得一提的是,其在AI推理和圖片處理領域優勢非常明顯。”
阿里巴巴首席工程師周經森(Kingsum Chow)提到:“Arm的CPU資源的話,在我們現有的軟件里會有兩個考慮的點,一個是我們有些軟件是需要重新編譯的,另外一種不需要重新編譯,只需要我們把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在這方面,一年之前,我們就跟Arm的員工一起合作,把JVM的性能提高。過去一年里,我們從JDK8到JDK11,通過OpenJDK, 通過阿里巴巴 Dragonwell(OpenJDK的一個發行版),就把我們現有一些Java應用的一些性能提高了50%。”
Arm基礎設施事業部高級副總裁兼總經理Chris Bergey表示:“騰訊在針對基于Arm硬件測試和軟件支持方面持續投入,他們的硬件測試在性能方面展現了出色的結果,在每瓦性能方面也有非凡的表現。在軟件的部份,他們既支持已編譯和解譯的代碼庫,也支持為這些代碼庫提供支撐的微服務框架。”
而針對阿里巴巴的合作,Bergey說道:“Java 對于阿里巴巴來說是一項至關重要的工作負載,他們的工程師已經編寫了超過十億行的 Java 代碼。阿里巴巴和 Arm正在Java 的工作負載分析和調試方面持續合作。”
解密全新Neoverse路線圖
正因為眾多客戶已經開始進行基于Neoverse產品的開發,Arm開始越來越快地公布其產品詳細路線圖。
日前,在Arm年度技術日上,Arm詳細介紹了Arm Neoverse V1 和 Neoverse N2 平臺。以及Arm Neoverse CMN-700 mesh 互連技術。
Neoverse路線圖
CMN-700互聯技術
Bergey表示,Arm CMN-700互聯技術是構建V1和N2的關鍵要素。基于CMN-600而打造,從內核的數量和緩存的大小,到附加內存和IO設備的數量和類型都鎖有所提升。支持DDR5和HBM。此外,增加了CXL功能,可為內存擴展和智能一致性加速。另外則是增加了諸多對于多芯片的支持功能,針對傳統多插槽設計和新的芯片集或多芯片集成提高性能和優化功能。“多芯片集成將為突破傳統的硅掩模版限制提供新的機遇,并為緊密耦合的異構計算提供更大的靈活性。”Bergey說道。
Neoverse V1:增加SVE功能
Bergey表示:“Neoverse V1 的設計理念是性能至上,因此我們加寬了微架構,并增加了緩沖區和隊列的深度,以便在運行中容納更多指令。”
與N1相比,Neoverse V1帶來了 50% 的性能提升、1.8倍的矢量工作負載優化、以及4倍的機器學習工作負載優化,同時,Neoverse V1也是Arm強調性能優先的新型計算系列的第一個平臺。Neoverse N1使芯片合作伙伴能靈活地為高度依賴CPU性能和帶寬的應用構建計算能力,并為其提供 SoC 設計的靈活性。
秉持性能至上的思維,Neoverse V1 的設計理念創造了Arm迄今為止設計過的最寬微架構,以便容納更多運行中的指令,支持高性能和百萬兆級計算等市場應用。Neoverse V1寬而深的架構,加上 SVE功能將使其在單核性能和通過SVE延長代碼存活期等方面占據領先優勢,并為芯片設計人員提供可實現的靈活性。Bergey解釋道:“Arm 現有的 SIMD 指令集 NEON 難以對某些代碼進行矢量化處理,而 SVE 可以直接取用相同的代碼,并很好地對其進行自動矢量化,相比于 NEON,可提速將近 3.5 倍。”
Neoverse N2:采用Arm V9架構
Neoverse N2平臺是第一個基于Armv9架構的平臺,在安全性、能耗以及性能方面都有全面的提升,正在為基礎設施核心鋪平道路。“N2 效率配置能夠在單插槽線程上具有更大的競爭力,同時提供專屬的內核,而非共享線程。”Bergey說道。
相比于N1,Neoverse N2在保持相同水平的功率和面積效率的基礎上,單線程性能提升了40%。Neoverse N2 具備良好的可擴展性,可以橫跨從高吞吐量計算到功率與尺寸受限的邊緣和5G應用場景,并在這些應用中帶來優于N1的表現,例如,在云端上提升 1.3 倍的NGINX,在 5G 和邊緣應用上提升 1.2 倍的DPDK 數據包處理。
Neoverse N2平臺提供了優異的單線程性能和業界領先且能為用戶減少TCO的每瓦性能表現。Neoverse N2是第一個具備SVE2功能的平臺,該功能可為云到邊緣的性能效率帶來巨大的提升。在諸如機器學習、數字信號處理、多媒體和5G等廣泛應用場景中,SVE2除了帶來大幅性能提升外,還帶來了SVE 具備的編程簡易性及可移植性等優勢。
Bergey表示:“SVE2 將 SVE 相關的性能、編程簡易性及可移植性等優勢,應用到更廣的領域和場景。SVE 意在加速 HPC,而 SVE2 則是將其擴展到 ML、DSP、多媒體和 5G 等應用場景。它融合了 NEON 豐富的數據操作、邏輯和算術指令集,以及 SVE 的自動矢量化和可擴展 性等功能。”
Neoverse與友商的性能對比
Bergey總結道:“V1 平臺將成為 HPC 的一場變革,而N2將成為云端到邊緣應用場景的最佳解決方案。”