外電報道,GPU大廠英偉達 (NVIDIA) 現在正在向那些渴望使用其硬體和軟體的對象,出租其自主研發的人工智慧解決方案。這個被稱之為「DGX Cloud」的雲計算服務將內置其高性能人工智慧硬體,包括目前供不應求的H100和A100 GPU算力。用戶將能夠藉由英偉達自己的雲計算基礎設施或甲骨文 (Oracle) 的雲計算服務來租用該系統。
報引導用英偉達DGX平台總監Tony Paikeday的說法指出,DGX Cloud在全球都可租用,但受美國出口管制的地區除外。而該雲計算服務將在英偉達的雲計算基礎設施中提供,其中包括位於美國和英國的DGX系統,而DGX Cloud也將藉由甲骨文雲計算服務來提供。
英偉達3月GTC會議首次宣布了DGX雲計算服務,隨後宣布推出該服務。日前正式宣布提供該項服務,這是繼該公司發布一系列雲計算人工智慧服務之後所宣布的最新計劃。競爭對手Cerebras Systems於中東雲計算提供商G42雲計算服務安裝人工智慧系統,提供36exaflops算力。特斯拉 (TESLA) 也宣布生產Dojo超級電腦,搭載自研D1晶片,到2024年底可提供100exaflops算力。
DGX Cloud租賃計劃包括使用英偉達雲計算人工智慧系統,每個伺服器都有H100或A100 GPU和640GB GPU內存,可運行AI應用程序。英偉達目標是像工廠運行人工智慧基礎設施,輸入數據材料後,輸出數據用戶可使用的可用資訊,更不用擔心軟體和硬體性能不足。
Paikeday強調,DGX Cloud滿足關鍵需求,就是大型複雜生成式人工智慧訓練模型的多節點訓練專用計算,企業還將獲得深厚的技術專業知識,部署支持此類工作環境。DGX Cloud租賃價格為每月每個應用36,999美元,DGX Cloud基本價格包括AI Enterprise軟體,提供大型語言模型和工具開發AI應用程序。
DGX Cloud租賃還有Base Command Platform軟體接口,以便公司管理和監控DGX Cloud。Oracle Cloud有高達512個英偉達GPU集群,每秒200GB RDMA網路,支持多系統(如Lustre)。相較DGX Cloud,雖然大型雲計算服務供應商都有構建Nvidia H100和A100 GPU,但與DGX Cloud不同,僅自行訓練人工智慧模型,並不提供客戶使用。
Google今年稍早發布26,000個Nvidia H100 Hopper GPU的A3超級電腦,規格類似英偉達DGX Superpod,跨越127個DGX節點,每個節點配備8個H100 GPU。亞馬遜AWS EC2 UltraClusters系統也採用H100 GPU。
各界對英偉達人工智慧硬體需求大增,因急於用生成式人工智慧發展各種領域。OpenAI ChatGPT以聊天機器人展示人工智慧多強大,醫療保健、保險和金融等市場都出現新應用。Paikeday指出,英偉達希望DGX Cloud吸引更多生成式人工智慧客戶和業務上雲。
(首圖來源:NVIDIA)