談到Arm晶片在雲端環境的部署,大部分討論都集中在效率、核心密度和性能可預測性等方面。
然而,亞馬遜雲科技認為,其Arm晶片完全可以在性能和性價比方面也表現出強大的競爭力,特別是Graviton 3E處理器甚至有望在向來以要求嚴苛著稱的HPC市場上一展身手。
AWS於2022年初展示了其第三代Graviton處理器。這款包含550億電晶體的晶片封裝有64個運行頻率為2.6 GHz的Arm兼容核心,並由速度更快的DDR5內存提供300 GB/秒的內存帶寬。隨後於2022年11月,這家雲巨頭又推出了Graviton 3E,新產品針對HPC和網路作業進行了調整,面向浮點與向量數學做出優化。亞馬遜表示,該晶片的浮點和向量計算性能提升了約35%,而在Linpack基準測試中的性能約為標準版Graviton 3的兩倍。
除CPU之外,亞馬遜還展示了更新之後的Elastic Fabric Adapter (EFA) 低延遲網路接口,用於將多個Graviton實例對接起來。
這兩款產品都將登陸AWS Hpc7g實例,具體提供三種SKU,分別向客戶開放16、32和64個Graviton 3E核心。除核心數量之外,這些實例的其他配置基本相同,均支持Amazon Elastic Block Storage服務、配備128 GB DDR5內存,以及由EFA提供的200 Gb/秒網路。
根據亞馬遜的介紹,這種同質化設計是有意為之。他們的想法是在核心數較少的實例中,客戶可以調整各核心所對應的特定內存或網路帶寬比率。另外,這樣的實例規模設計,可能也更適合那些需要遵循特定許可條款的軟體用戶。
與亞馬遜雲科技此前提供的AMD和英特爾晶片版Hpc6實例一樣,AWS希望客戶能像使用集群節點一樣使用這些實例,而非將其作為獨立的虛擬機。在發布公告中,亞馬遜方面提到了Hpc7g實例可支撐起需要「數萬個核心」的工作負載,看來他們已經做好了交付大規模集群設施的準備。
當然,亞馬遜並不是第一家嘗試將Arm核心同HPC工作負載相融合的公司。日本RIKEN實驗室的Fugaku超級電腦採用的也是基於Arm的48核富士通A64FX處理器,其擁有出色的向量計算性能,已連續兩年穩居超算Top500榜首。
亞馬遜表示,他們正與RIKEN合作開發可在Hpc7g實例上運行的「虛擬Fugaku」,用以支持該研究所對計算資源的更多需求。
亞馬遜的Hpc7g實例在初上線時仍將受到一定限制。該公司表示,實例集群僅限於同一可用區內,且首批發布將只登陸位於北弗吉尼亞州的美國東部區域。