周四,隨著德國斯圖加特大學(University of Stuttgart)的高性能計算中心(HLRS)宣布其最新的超級電腦Hunter構建完成,數百個AMD APU正式激活。
這套耗資1,500萬歐元的系統由巴登-符騰堡邦科學、研究和藝術部以及德國聯邦教育和研究部共同出資,將支持各種公共和私人研究工作,從工程和氣象建模到生物醫學研究、材料科學,當然還有人工智慧(AI)。
Hunter由惠普企業(Hewlett Packard Enterprise,HPE)所打造,採用Cray EX4000平台,並由AMD Instinct MI300A加速處理單元(APU)和Epyc Genoa CPU組成。
如果這個配置聽起來有點熟悉,那是因為這台機器和1.74 exaFLOP的El Capitan超級電腦採用相同的架構,只是規模小得多。
El Capitan搭載44,544個APU,而Hunter僅在188個水冷式節點上配備752個APU。 這些加速器每個都擁有24個Zen 4核心、6個CDNA 3 GPU區塊和128GB的同調HBM3內存。 除了APU之外,還配備了額外512個32核心Epyc處理器。
HLRS估計Hunter的雙精度浮點運算理論峰值性能為48.1 petaFLOPS,幾乎是其前身Hawk的兩倍。 然而,這適用於需要高精度的科學工作負載。 該大學還計劃將該系統應用於各種AI應用,包括模型訓練,MI300A的BF16和FP8數據類型應可提供736 petaFLOPS到1.47 exaFLOPS的峰值性能,具體取決於精度。
事實上,在公私合作夥伴關係下,HLRS表示,德國AI創業公司Seedbox.ai已經在使用該系統以24種歐洲語言訓練開放式大型語言模型(LLM)。
HLRS主任麥可‧雷許(Michael Resch)在一份聲明中表示:「AI的快速發展,以及超級運算領域對可持續發展性的日益重視,意味著高性能計算目前正經歷一個令人興奮的轉型期。」
談到可持續發展性,Hunter的一個獨特功能是與HPE合作開發的全新「動態功率限制」功能。 此功能旨在通過持續監控應用程序並根據需求調整功率分配來優化系統的能源效率。 在Hawk超級電腦上的早期測試顯示,此功能可在性能沒有顯著下降的情況下,將功耗降低20%。
雖然48 petaFLOPS的性能讓Hunter無法進入Top500的前10名,但這不是它主要的目的。 Hunter是一個過渡系統,主要的目的是幫助研究人員為APU和GPU編寫和優化程序代碼,以應對更大規模的超級電腦Herder的到來。
與Hunter相同,Herder將由HPE的Cray部門製造,並採用基於GPU的架構,其雙精度浮點運算性能估計可達「數百petaFLOPS」。 這兩個系統的總成本為1.15億歐元。
預計近期將開始建造Herder的外殼和電力設施,並於2027年的某個時間點安裝完成的系統。