根據麥肯錫預測,生成式 AI 每年可為全球經濟帶來多達 4.4 萬億美元的增長。簡化並提高生成式AI應用的開發、測試和部署效率,成為現階段企業實實在在的需求。如今,全球各地的企業都在競相尋找合適的基礎設施並構建生成式 AI 模型和應用。
8 月 22 日,NVIDIA 宣布,推出 AI 就緒型伺服器,該伺服器支持於同日發布的 VMware Private AI Foundation with NVIDIA。雙方希望通過此平台能幫助企業使用自有業務數據來定製和部署生成式 AI 應用。
VMware、英偉達珠聯璧合 構建私有定製化的生成式AI能力
作為全集成式解決方案,VMware Private AI Foundation with NVIDIA 平台採用 NVIDIA® L40S GPU、NVIDIA BlueField®-3 DPU 和 NVIDIA AI Enterprise 等生成式 AI 基礎設施和軟體,以及端到端的雲原生框架NVIDIA NeMo ,具備能夠讓企業自定義模型並運行如智能聊天機器人、助手、搜索和摘要等各類生成式 AI 應用的先驅優勢。企業可以通過部署平台創建供內部使用的更加安全的私有模型,同時還能將生成式AI作為一項服務提供給用戶,並能更加安全地大規模運行推理工作負載。
VMware 首席執行官 Raghu Raghuram 表示:「生成式 AI 與多雲可謂珠聯璧合。客戶的數據無處不在,遍布其數據中心、邊緣、雲等多處。我們將與 NVIDIA 一同助力企業放心地在數據附近運行生成式 AI 工作負載,並解決其在企業數據隱私、安全和控制方面的問題。」
NVIDIA 創始人兼首席執行官黃仁勛表示:「世界各地的企業都在競相將生成式 AI 整合到自身業務中。通過與 VMware 擴大合作,我們將能夠為金融服務、醫療、製造等領域的數十萬家客戶提供其所需的全棧式軟體和計算,使其能夠使用基於自身數據定製的應用,充分挖掘生成式 AI 的潛力。」
官方資料顯示,VMware Private AI Foundation with NVIDIA平台預計能夠提供以下方面的優勢:
隱私:將通過能夠保護數據隱私並確保訪問安全的架構,使客戶能夠在任何數據所在地輕鬆運行 AI 服務。
選擇:從 NVIDIA NeMo™ 到 Llama 2 等,企業在構建和運行其模型的位置上,將擁有廣泛的選擇空間,包括領先的 OEM 硬體配置以及未來的公有雲和服務提供商解決方案。
性能:近期的行業基準測試表明,某些用例在 NVIDIA 加速基礎設施上運行的性能與裸機性能相當,甚至超過了裸機性能。
數據中心規模:虛擬化環境中的 GPU 擴展優化使 AI 工作負載能夠在單個虛擬機和多個節點上擴展到最多 16 顆 vGPU/GPU,從而加快生成式 AI 模型的微調和部署速度。
更低的成本:將最大程度地利用 GPU、DPU 和 CPU 的所有計算資源以降低總體成本,並創建可在各個團隊間高效共享的池化資源環境。
加速存儲:VMware vSAN Express Storage Architecture 提供性能經過優化的 NVMe 存儲,並支持通過 RDMA 實現 GPUDirect® 存儲,從而無需 CPU 即可實現從存儲到 GPU 的直接 I/O 傳輸。
加速網路:vSphere 與 NVIDIA NVSwitch™ 技術之間的深度集成將進一步確保多 GPU 模型的執行不會出現 GPU 間瓶頸問題。
快速部署和價值實現時間:vSphere Deep Learning VM 鏡像和鏡像庫將提供穩定的統包解決方案鏡像,該鏡像預先安裝了各種框架和性能經過優化的庫,可實現快速原型開發。
雙方進一步表示,VMware和 NVIDIA雙方的戰略合作夥伴關係,將幫助數十萬家使用 VMware 雲基礎架構的企業做好準備,迎接AI時代的到來。
戴爾、HPE、聯想 將推出搭載 NVIDIA L40S 的伺服器
業內人士認為,此次發布進一步推動了企業級生成式 AI 部署的龐大生態系統。
英偉達方面透露,戴爾科技、慧與和聯想將於年底前推出採用 NVIDIA L40S GPU 和 NVIDIA BlueField 的伺服器和 NVIDIA ConnectX®-7 智能網卡的系統,以支持 VMware Private AI Foundation with NVIDIA。
性能上的突破是收到相關企業青睞的原因之一。相較於 NVIDIA A100 GPU,NVIDIA L40S 可將智能聊天機器人、助手、搜索和摘要等生成式 AI 應用中的生成式 AI推理性能提高 1.2 倍。
此外,通過集成 NVIDIA BlueField DPU,可加速、卸載和隔離巨大計算工作負載,其中包含虛擬化、網路、存儲、安全,以及其他雲原生 AI 服務,以進一步提高速度;NVIDIA ConnectX®-7 智能網卡提供先進的硬體卸載和超低延遲,可為數據密集型生成式 AI 工作負載提供同類領先的可擴展性能。
據悉,相關伺服器還將採用 NVIDIA AI Enterprise,即 NVIDIA AI 平台的作業系統。
NVIDIA 創始人兼首席執行官黃仁勛表示:「全新的計算時代已經來臨,各行各業的企業都在競相採用生成式 AI。我們正在通過涵蓋全球頂尖軟體和系統合作夥伴的生態系統,將生成式 AI 帶給全球企業。」
VMware 首席執行官 Raghu Raghuram 表示:"生成式 AI 正在大力推動數字化轉型進程,企業需要一種全面集成的解決方案,以更加安全地構建應用,從而推動業務發展。通過 VMware、NVIDIA、以及我們伺服器製造商合作夥伴的專業知識相結合,企業將能夠在確保數據隱私、安全和可控性的前提下開發和部署 AI。
在下游頭部廠商的評價中,也不難度看出NVIDIA AI就緒型伺服器對於AI應用生態推進。
戴爾科技主席兼首席執行官 Michael Dell 表示:「生成式 AI是創新的『催化劑』,將助力解決一些全球性的重大挑戰。而採用 NVIDIA AI就緒型伺服器的戴爾生成式AI解決方案將扮演至關重要的角色,即通過推動生產力水平實現前所未有的提升,並變革工業運營的方式,以加速人類的進程。」
慧與總裁兼首席執行官 Antonio Neri 表示:「生成式 AI 將推動企業生產力規模的全新擴展 —— 從賦能聊天機器人和數字助理,到幫助設計和開發新的解決方案。我們很高興能繼續與 NVIDIA 密切合作,在一系列企業級調優和推理工作負載解決方案中採用 NVIDIA 的 GPU 和軟體,這將加速生成式 AI 的部署。」
聯想集團主席兼首席執行官楊元慶表示:「企業迫切希望採用生成式 AI 來推動智能化轉型。通過與 NVIDIA 和 VMware 合作,聯想正在進一步擴大自身在生成式 AI 領域的領先地位,並鞏固自身的獨特定位,即在客戶採用 AI 的旅程中為其提供幫助。」
值得一提的是,在供貨方面,NVIDIA官方透露,搭載 L40S GPU 和 BlueField DPU 的 NVIDIA AI 就緒型伺服器將於年底前上市,雲服務提供商預計將在未來幾個月提供實例。
VMware也計劃於 2024 年初發布 VMware Private AI Foundation with NVIDIA。
寫在最後
自今年生成式AI風靡全球以來,「百模競技」持續上演。有人斷言,「百模競技」的局面,最終必將「分久必合」。而在這一過程中,誰掌握了私有化定製的能力,誰就具備的AI應用的差異化優勢。
可以說,VMware 與NVIDIA 為企業開啟生成式AI時代打開了一條快速通道,賦予的私有化部署能力,也將會為企業智慧化轉型提供強大的支持,在未來,我們期待看到更多的企業能夠通過私有化部署的生成式AI,實現業務的升級和轉型。