未來的更新,只需點擊添加新單位即可——至少目標如此……
歐洲首個百億億級超級計算系統將以由集裝箱單元組成的模塊化數據中心形式交付,以便未來能更輕鬆地更新或更換個別模塊。搶先體驗計劃也已經針對後續計劃登陸系統的潛在應用程序開放。
Jupiter項目的全稱為「共同計劃先鋒百億億次創新和變革研究」,計劃將在2024年秋季正式投入運行。
該系統由歐洲高性能計算共同計劃(EuroHPC JU)採購,將成為歐洲首個百億億次級超算系統,每秒可執行超百億億次浮點運算。外界普遍估計,這一數字可能是指雙精度浮點運算或者是主流關注的「AI flops」。
負責該項目的於利希超級計算中心(JSC)表示,他們正採取一種新穎方法在數據中心內安置Jupiter基礎設施。根據JSC的介紹,整個數據中心將由約50個集裝箱模塊組成,占地面積超過2300平方米,約相當於半個足球場大小。轉換為英制單位,其面積接近2.5萬平方英尺。
這些集裝箱模塊計劃分為20個IT模塊、15個供電模塊和10個後勤模塊,其中後勤模塊將具體提供數據中心的主廳、車間和倉儲空間。
在交付之前,容納Jupiter基礎設施的機架將與冷卻、供電、網路及布線設計一道,在生產車間內被直接集成至各集裝箱當中。預計這將顯著加快安裝速度,並降低硬體現場部署之後發生故障的風險。
法國IT巨頭Atos旗下負責監督施工的子公司Eviden表示,這種集裝箱作業的優點包括顯著縮短規劃與安裝時間,以及降低施工與運營成本等。
在傳統數據中心架構當中,拆除陳舊系統並升級數據中心以支持新技術往往需要幾周甚至幾個月的時間。而Jupiter系統允許JSC快速更換各個模塊,藉此高效添加硬體更新。Eviden公司指出,供電子系統與後勤區域也可按單元更換。
最初公布Jupiter項目時,EuroHPC表示將採用與Juwels超級電腦相同的動態模塊化架構。Juwels就曾在2020年通過接入GPU增強模塊實現了性能升級。
Eviden公司宣稱,Jupiter項目的交付周期縮短一半、控制在一年之內,而成本也「cut by 3」,我們猜測是指減少至三分之一。在去年公布合同時,該項目的總體預估成本為2.73億歐元。
JSC主任Thomas Lippert博士強調,Jupiter「可能將成為世界上最強大的AI超級電腦」。
他指出,「然而,巨大的算力也將帶來對電力的可觀需求。迄今為止,德國還沒有哪處科學數據中心能夠支持這樣的供電規模。很高興數據中心模塊化方案能夠快速建立起供應基礎設施,也讓利用冷卻過程中產生的熱能為於利希園區供暖成為了可能。」
Eviden公司高性能計算、AI與量子全球負責人Emmanuel Le Roux在一份聲明中指出,「我們很榮幸能夠領導Jupiter製造聯盟並提供用於系統託管的數據中心,也很高興能在歐洲的百億億次計算發展旅程中貢獻力量。」
為了配合Jupiter項目上線,JSC還專門啟動了Jupiter研究與早期訪問計劃(JUREAP),供外部客戶探索這套全新百億億次系統的潛在用例。
JSC表示,JUREAP計劃將從可擴展性與性能評估階段(SPEP)起步。在此期間,他們將與其他研究人員及領域科學家合作,共同評估各類應用在百億億級規模下運行模擬的技術潛力。
SPEP已經於1月15日對外開放,對申請者本身並無任何特別要求,但必須論證所申請的用例擁有大規模科學應用潛力。
JSC表示,如果希望後續參與JUREAP計劃並利用Jupiter系統運行科學用例,則研究人員必須先期參加SPEP。