Nvidia近日宣布面向專注於人工智慧的伺服器推出下一代以太網網路技術,並表示,戴爾、HPE和聯想將率先將這種技術集成到他們的產品中。
Nvidia表示,此次推出的Spectrum-X技術是專為AI工作負載設計的,能夠為AI通信提供比傳統以太網高1.6倍的網路性能。
戴爾、HPE和聯想公布的新伺服器產品將Spectrum-X與Nvidia最強大的H100 Tensor Core GPU以及AI Enterprise和AI Workbench軟體相結合。據稱,這些廠商將為那些想要實施最先進生成式AI模型的企業提供了完整的方案。
據Nvidia稱,Spectrum-X將結合最新的Spectrum-4以太網交換機高速性能與Nvidia BlueField-3 SuperNIC(如圖所示),後者是一種新型網路加速器,旨在加速AI工作負載以及加速軟體。據稱,該技術是對Nvidia BlueField-3 數據處理單元的補充,這種數據處理單元是一種卸載、隔離、加速和保護數據中心服務的處理器,可以釋放GPU資源以專注於AI處理。
Nvidia表示,Spectrum-4是首款每秒51太比特的以太網交換機,旨在確保大規模和高負載下儘可能高的數據吞吐量,以最大限度地減少網路擁塞。這麼做是必要的,因為AI工作負載必須處理大量數據。通過添加微調的路由軟體,它可以確保以最佳方式使用網路基礎設施。
至於BlueField-3 SuperNIC,它可通過融合以太網以高達每秒400 GB的遠程直接內存訪問速度連接集群內的每個AI伺服器。Nvidia表示,這將對AI訓練和推理系統的性能產生顯著影響。另一個好處是高安全性,因為BlueField-3 SuperNICS創建了一個安全的多租戶數據中心環境,可以隔離每個工作負載。
Nvidia表示,戴爾、HPE和聯想的新系統將於明年第一季度上市。
Nvidia公司創始人、首席執行官黃仁勛強調了加速網路框架的重要性,稱它是「Nvidia領先伺服器製造商合作夥伴新一波AI系統的催化劑,可加速向生成式AI時代的轉變。」
HPE公司首席執行官Antonio Neri解釋了這項新技術背後的想法,稱生成式AI需要完全不同的網路架構來支持各種動態工作負載。他表示,為了讓客戶能夠發揮AI的潛力,「HPE正在與Nvidia合作,構建具有所需功能、效率和可擴展性的系統來支持這些應用」。
Spectrum-X目前已經安裝在Nvidia Israel-1超級電腦上,對於那些想要在本地環境中構建下一代AI系統的公司來說可以把這種超級電腦作為他們的參考架構。Israel-1系統使用戴爾的PowerEdge XE9680伺服器構建,支持Nvidia的HGX 100平台,該平台具有8個GPU、BlueField-3 DPU和帶有Spectrum-4交換機的SuperNIC。
戴爾公司董事長、首席執行官Michael Dell表示:「通過我們的合作,戴爾和Nvidia正在為客戶提供快速地、安全地從數據中提取情報所需的基礎設施和軟體。」
據稱,戴爾的網路加速軟體可以進一步提高性能,提供對Cumulus Linux、Pure SONiC和NetQ等軟體開發套件以及位於BlueField晶片核心的Nvidia DOCA軟體框架的訪問路徑。AI Enterprise打包了數十種主流的AI框架、預訓練模型和開發工具,AI Workbench則提供了用於在PC或工作站上自定義AI模型的工具。