戴爾將推出一系列包括新伺服器在內的基礎設施產品,有望幫助企業更有效地訓練和運行人工智慧模型。
戴爾在近日Nvidia備受關注的GTC開發者大會上發布了這些產品。據戴爾稱,這些新伺服器產品和Nvidia首席執行官黃仁勛在活動中推出的B200 Tensor Core圖形卡是兼容的。除了這些伺服器之外,戴爾還將推出數據湖平台,升級存儲產品組合,以及一系列其他產品更新。
theCUBE Research聯合創始人、首席分析師Dave Vellante表示:「各個組織都在急於嘗試AI,但實現投資回報率方面卻面臨著很多挑戰,數據主權、法律和合規、數據質量都是首要考慮的問題,我們的研究表明,企業正在尋求戴爾和NVIDIA等行業領導者的幫助,以幫助提供AI的專業知識和服務,降低風險,更快地獲得投資回報。」
推理優化的計算
戴爾已經開始向客戶提供的PowerEdge XE9680伺服器將配備Nvidia最新的B200 Tensor Core GPU,該晶片預計將執行推理任務,即在生產中運行經過訓練的AI模型,速度比上一代晶片快15倍,而且更具成本效益。
B200是基於Nvidia Blackwell新型GPU架構的。據戴爾稱,PowerEdge XE9680伺服器還支持其他基於Blackwell的晶片以及H200 Tensor Core,後者將於11月推出,是H100的增強版,專門針對運行大型語言模型進行了優化。
在網路方面,戴爾的新伺服器將搭配使用Nvidia Quantum-2和Spectrum-X交換機系列,分別針對使用InfiniBand和以太網數據傳輸協議的網路而構建。這兩個交換機系列都包含了一系列軟體功能,旨在降低延遲並減少擁塞連接對數據傳輸速度的影響。
數據存儲和管理
PowerScale是戴爾的一個NAS產品線,針對運行AI模型等用例進行了優化。該系統將數據保存在採用橫向擴展架構的閃存驅動器中,這使得在需要時添加更多容量變得相對簡單一些。戴爾的OneFS存儲作業系統主要用於管理容量擴展過程以及相關的維護任務。
據戴爾稱,PowerScale系列現在已經成為第一批經過驗證可與基於DGX H100的SuperPOD一起使用的以太網存儲系統。DGX H100是Nvidia的一款數據中心設備,配備了8個H100 GPU。反過來,SuperPOD是DGX設備的集群。
戴爾表示,此次在GTC大會上詳細介紹的產品更新不僅使數據存儲變得更加容易,而且還讓數據管理變得更加輕鬆。在推出新伺服器的同時,戴爾還宣布Dell Data Lakehouse平台現已在全球上市,該產品讓組織能夠集中處理來自不同來源的資訊。
企業以前主要採用兩種類型的數據管理平台。數據倉庫高度可靠,非常適合處理結構化記錄,而數據湖能以經濟高效的方式保存大量非結構化資訊。而此次戴爾新推出的平台中,數據湖平台是將這兩種技術的功能集結合在了一個產品中。
集成平台
戴爾還在GTC大會上推出了產品組合中的其他幾款產品,每項新產品都將戴爾硬體產品組合的多個組件與軟體、專業服務與Nvidia晶片進行了結合。
首先是Dell AI Factory,這是一套用於訓練、調整和運行AI模型的「端到端AI企業解決方案」,它將Nvidia晶片與戴爾的計算、存儲、客戶端設備、軟體產品組合以及專業服務相結合,這些服務有望簡化準備AI數據集等任務。
其次是Dell Generative AI Solutions with NVIDIA – Model Training基礎設施平台。據戴爾稱,該平台可以幫助企業更輕鬆地訓練針對特定領域任務優化的定製AI模型。第三款新產品是Dell Generative AI Solutions with NVIDIA – Retrieval-Augmented Generation,主要面向那些正在構建具有RAG功能的AI模型的企業。
Nvidia公司首席執行官黃仁勛表示:「NVIDIA和戴爾正在共同幫助企業打造AI工廠,將他們專有的數據轉化為強大的洞察力。」
AI加速器產生的熱量比典型CPU要多得多。戴爾詳細介紹說,戴爾正在與Nvidia合作開發基於Nvidia Grace Blackwell Superchip的機架級液冷AI平台。用於數據中心冷卻的水和其他液體相比空氣能夠更好地導熱,因此在調節伺服器溫度方面也更加有效。