近期,以ChatGPT為代表的大語言模型持續火爆,在人們驚嘆於其表現時,而要實現大模型不可避免的就是遇到吞吐量和性能瓶頸。
為了滿足人工智慧模型訓練和推理的需求,NVIDIA提供了為全新應用提供加速的高性能網絡平台——Quantum-2 InfiniBand網絡平台和Spectrum-4以太網網絡平台,而BlueField-3 DPU是這兩大高性能加速網絡平台的重要組成部分。
其中,BlueField-3 DPU通過卸載、加速和隔離數據中心控制平面,創建了一個安全、加速和可持續的基礎設施,用於在節點集群中運行人工智慧和其他現代工作負載,並作為一個統一的計算平台運行。
而DOCA提供基於BlueField系列DPU的可編程性,可以廣泛的應用到支撐生成式AI的數據中心基礎設施中,以加速生成式AI的模型訓練和推理。
突破吞吐量和性能瓶頸 BlueField-3 DPU
BlueField-3 DPU專為數據中心規模的計算而設計,提供400Gb/s以太網和InfiniBand網絡連接,相比上一代可支持高達4倍的計算能力、高達4倍的加密加速性能、2倍的存儲處理性能和5倍的內存帶寬。
NVIDIA網絡技術專家崔岩告訴記者,BlueField-3 DPU具有四大優勢:加速性能、提升雲規模效率、強大的零信任安全、完全可編程的基礎設施。具體來說:
加速雲計算:現在人工智慧模型訓練和推理會依託於雲計算的方式,而BlueField-3 DPU支持的虛擬機數量時上一代的四到八倍,這對於雲廠商而言,不用大幅度增加硬體投入,就可以增加投資回報。
安全的雲計算:在多租戶環境中,BlueField-3 DPU提供了數據中心的控制平面,實現租戶的隔離,以及業務應用域和基礎設施域之間的隔離,藉助零信任安全模型提供更好的安全性保障。
加速企業計算:除了雲計算平台,BlueField-3 DPU現在已經部署到戴爾的Poweredge服務器,支持VMware vSphere 8。以Redis事務處理為例,採用BlueField-3 DPU可以增加50%的Redis事務處理能力,並實現零 CPU 核心占用。
可持續的雲計算:數據中心的能耗持續增加,而BlueField-3 DPU會提升服務器的性能表現,減少服務器的功耗水平,間接減少電力費用。測試顯示,與未使用DPU的服務器相比,使用NVIDIA BlueField DPU的服務器可降低高達34%的功耗。
NVIDIA DOCA為DPU注入靈魂
NVIDIA DOCA是專為BlueField DPU而設計的軟體開發套件和加速框架。DOCA旨在通過為BlueField DPU快速創建和部署應用程序和服務來解鎖數據中心創新。
從某種意義上來說,DOCA之於DPU正如CUDA之於GPU,是釋放DPU潛力的關鍵,也是加速雲計算基礎設施服務的關鍵。
NVIDIA DOCA擁有豐富的庫、驅動程序和API,可為BlueField DPU開發者提供 「一站式服務」,同時也是加速雲基礎設施服務的關鍵。
NVIDIA DOCA軟體框架現在已支持BlueField-3 DPU,使成千上萬的開發者能夠利用第三代DPU平台的強大功能來快速創建加速的應用程序和服務。
NVIDIA網絡市場總監孟慶表示,最新發布的 NVIDIA DOCA 2.0增加了對BlueField-3 DPU里的數據路徑加速器(DPA)編程子系統的支持,以及DOCA IPsec加密/解密庫、設備認證和YARA規則在內的多項安全增強功能。還包括DOCA Flow庫增強功能、Regex匹配性能改進、SNAP v4存儲功能、BlueMan遙測小工具等,軟體生態更加豐富。
其中,DPA是一種高度可編程的嵌入式處理器,集成於BlueField-3 DPU中。DPA有助於從CPU 卸載更多類型的流量,並通過DPU加速來提高性能。
NVIDIA DOCA DPA庫是NVIDIA DOCA軟體開發套件的一部分,它提供了一種編程模型,用於卸載以網絡為中心的代碼,並在DPA處理器上運行。
NVIDIA DOCA 2.0體現了NVIDIA BlueField-3 DPU的軟體可編程性,藉助NVIDIA BlueField-3 DPU可以獲得完全可編程的加速數據中心平台。
目前,全球已有超過4700名註冊開發者使用NVIDIA DOCA來創建BlueField DPU應用程序,孟慶說,NVIDIA非常注重社區建設,在2021年中國的 DOCA 開發者占了全球開發者42%,經過過去一年的發展,今年年初56%的DOCA開發者來自中國。
為了不斷壯大社區規模,DOCA中國開發者社區舉辦了豐富的活動,比如DOCA訓練營、黑客松競賽。而且首批NVIDIA授權合作夥伴DPU & DOCA卓越中心提供了免費的DOCA開發環境,方便開發者體驗。
DOCA中國開發者社區還為DOCA中國開發者提供豐富的技術文檔、培訓、影片、論壇、微信群來協助初階開發者進行開發。
結語
為了充分發揮人工智慧的潛力,數據中心正轉向加速計算,以滿足日益增長的計算需求。在NVIDIA DOCA 2.0版本的支持下,BlueField-3 DPU正在為人工智慧時代雲、超級計算和企業數據中心帶來變革。