宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

面臨AMD及自身內部挑戰,英偉達Green 500主導地位受到威脅

2024年11月26日 首頁 » 熱門科技

英偉達的加速器已經成為同類產品中耗電量最大的選項之一,但這些晶片卻仍舊在Green500榜單中占據著全球最具可持續性超級電腦的主導地位。

在這份兩年一度評選出的榜單上,十大最節能系統中有八家採用了英偉達部件,其中五家由該GPU巨頭的1000瓦Grace Hopper超級晶片(GH200)負責驅動。

這些融合了基於Arm Neoverse V2設計的72核Grace CPU及480 GB LPDDR5x顯存,同時配有96至114 GB HBM3或HBM3e內存的H100 GPU,在高性能計算(HPC)社區中可謂大受歡迎。

在最新的Green 500榜單上,這款晶片為能效排名第一和第二的兩大系統提供支持——分別是EuroHPC的JEDI和Romeo HPC Center的Romeo-2025設備。二者在高性能Linpack基準測試中分別實現了每瓦727和709億次浮點運算性能——當然,均為FP64精度。

這兩套系統幾乎完全相同,均使用Eviden BullSequana XH3000平台構建而成,且使用相同的GH200加速器。英偉達的GH200還與Isambard-AI Phase 1(688億次/瓦)、Jupiter Exascale Transition Instrument(679 億次/瓦)和 Helios GPU(669億次/瓦)一道在榜單上為位列第四、第六和第七的設備提供支持。

面臨AMD及自身內部挑戰,英偉達Green 500主導地位受到威脅

Jupiter百億億次開發設備

與此同時,英偉達備受推崇的H100則為能效榜上排名第五、第八和第九的設備提供支持,包括Capella、Henri以及HoreKa-Teal系統。

不過英偉達能否在Green 500榜單中繼續保持高位,恐怕值得懷疑。其Grace-Balckwell超級晶片已經正式發布規格,普版GB200功耗高達2.7千瓦,GB200 NVL4版功耗更是達到5.4千瓦。

而新一代產品,未必能提供更高的每瓦計算能力。

從2020年的A100到2022年的H100,其FP64性能躍升了約3.5倍。然而與1.2千瓦的Blackwell相比,700瓦的H100在FP64矩陣數學運算方面實際上更強。事實上,對於FP64精度的場景,Blackwell架構的唯一改進就是矢量數學,這款即將推出的晶片將性能提升了32%。

因此,雖然目前英偉達Green 500榜單上仍占據高位,但AMD也依舊維持著一席之地。事實上,正是Zen家族的MI300A加速處理單元支撐起了在最新榜單上排名第三的Adastra 2系統。

有些朋友可能不大熟悉,AMD的MI300A發布於不到一年之前,它將24個CPU核心和六個CDNA-3 GPU晶片融合至同一APU當中,板載HBM3內存高達128 GB,可配置熱設計功耗(TDP)為550到760瓦。而且至少從紙面上看,該加速器的HPC性能已經達到H100的1.8倍。

Adastra 2由HPE Cray使用EX255a刀片伺服器(與全球最強超級電腦採用同款設計)製造而成,能效達到每瓦690億次。無獨有偶,能效榜上排名第十的系統是蘿倫斯利弗莫爾國家實驗室的另一台基於MI300A的設備,名為RZAdams,能效為每瓦628億次。

規模擴展成最大難題

Green 500榜單上前十名中的所有系統,都已經遠遠超過了在20兆瓦限制內實現百億億次算力的目標——換算下來相當於每瓦對應50億次算力。但事實證明,要在規模擴展的同時保持這樣的能效水平卻極其困難。

觀察Green 500榜單上能效最高的三套系統,不難發現它們的體量都很有限。JEDI的額定功率僅為67千瓦。相比之下,瑞士國家超級計算中心的AIps機器(Top 500榜單中最強大的GH200系統)在HPL基準測試中實現了434千萬億次算力,能耗則為7.1兆瓦,對應的每瓦610億次性能僅在能效榜單中排名第14位。

Adastra 2的情況也差不多,規模甚至還不及JEDI,額定功率僅有37千瓦。如果能夠保持住每瓦690億次的算力,那麼實際只需要耗費25.2兆瓦電力就能達到El Capitan 1.742百億億次的性能。可真實情況下,El Capitan需要近29.7兆瓦的功率才能支撐起這樣破紀錄的算力水平

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新