新聞事件
2023年7月11日,英特爾正式於中國市場推出第二代Gaudi深度學習加速器——Habana Gaudi2。 同時,英特爾正與浪潮資訊合作,打造並發售基於Gaudi2深度學習加速器的浪潮資訊AI伺服器NF5698G7。
新聞分析
在筆者看來,這一新聞看點著實多,我們不妨從中挑選出幾個看點,與大家分享。
01 新選擇,AI伺服器的新變量
眾所周知,現在AIGC如此火爆,直接帶動了算力需求的激增,進而推動了AI伺服器的發展。
根據IDC統計,2022年預計全球生成式人工智慧對AI伺服器的新增需求規模為8.2億美元,預計到2026年其新增需求規模將達到109.9億美元,2022年至2026年的年複合增速高達91.34%。
AI伺服器通常擁有一個或多個協處理器,比如GPU、FPGA或ASIC協處理器,而CPU與GPU的組合是最為主流的組合,例如英特爾或者AMD的處理器加上英偉達的GPU。
現在隨著Gaudi2的推出,AI伺服器迎來新的組合模式。Gaudi2深度學習加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構為基礎,以多方位性能與能效比提升,加速高性能大語言模型運行。該加速器具備:
24個可編程Tensor處理器核心(TPCs)
21個100 Gbps(RoCEv2)以太網接口
96GB HBM2E內存容量
2.4TB/秒的總內存帶寬
48MB片上SRAM
集成多媒體處理引擎
Gaudi2加速器的出色性能在6月公布的MLCommons MLPerf基準測試中得到了充分認證,其在GPT-3模型、電腦視覺模型ResNet-50(使用8個加速器)、Unet3D(使用8個加速器),以及自然語言處理模型BERT(使用8個和64個加速器)上均取得了優異的訓練結果。與市場上其他面向大規模生成式AI和大語言模型的產品相比,Gaudi2擁有卓越的性能與領先的性價比優勢,能夠幫助用戶提升運營效率的同時,降低運營成本。
此外,Gaudi2可為大規模的多模態和語言模型提供出色的推理性能。在最近的Hugging Face評估中,其在大規模推理方面的表現,包括在運行Stable Diffusion(另一個用於從文本生成圖像的最先進生成式AI模型之一)、70億以及1760億參數BLOOMz模型時,在行業內保持領先。
在Stable Diffusion訓練上,Gaudi2展示了從1張卡至64張卡近線性99%的擴展性。此外,MLCommons剛剛公布的MLPerf訓練3.0結果,亦驗證了Gaudi2處理器在1750億參數的GPT-3模型上,從256個加速器到384個加速器可實現令人印象深刻的接近線性的95%擴展效果。
英偉達的GPU現在不光卡的價格暴漲,關鍵是一卡難求。從Gaudi2的表現看,我們有理由相信Gaudi2會成為AI伺服器的新選擇,而GPU不再是唯一首選。
而具體到中國市場,由於不管是NVIDIA還是AMD都是為中國客戶提供「特供」版本的晶片,所以不縮水的Gaudi2有望成為中國企業的新選擇,這無疑為市場增加了新的變數。
02 堅冰鬆動,中美的算力博弈
眾所周知,中美之間在半導體領域展開博弈。NVIDIA與AMD的晶片在中國出貨受限,但是這次Gaudi2卻可以在國內發布上市。而且浪潮集團被美國列入實體名單,而出乎意外的是浪潮資訊居然可以發布基於Gaudi2的伺服器產品。
這些說明了什麼?我們只能說這背後英特爾是做足了工作的,我覺得話只能說到這裡。我這樣的猜想與英特爾的相關人員溝通後也得到了確認。
Gaudi2作為AI加速器在中國銷售是符合監管規定,特別是美國。除了商業考慮,這次Gaudi2能夠在中國市場發布,應該是得到了高層的默認,這是不是預示著中美在科技領域的堅冰有鬆動的跡象了?這不好說。但是至少說,Gaudi2在中國上市是利好消息。
03 敏感時刻為什麼選擇浪潮資訊?
英特爾選擇浪潮資訊首發相關的伺服器產品,也肯定是經過深思熟慮的,就像前面說的,浪潮資訊的母公司浪潮集團處于敏感時刻,而英特爾在AI伺服器方面還是一如既往選擇浪潮資訊,肯定是看到了浪潮資訊的過人之處。
這裡要重點說的是浪潮資訊,據IDC數據報告顯示,浪潮資訊在中國AI伺服器市場份額連續六年保持第一。
我想這也是英特爾選擇與浪潮資訊推出Gaudi2伺服器產品的重要選擇,要知道浪潮資訊在伺服器市場的產品工程能力和市場拓展能力那是業界有目共睹的。浪潮資訊在伺服器市場的表現那可是可圈可點,所以Gaudi2選擇浪潮的這樣合作夥伴進行國內市場的拓展,還是非常值得期待的。
比如浪潮資訊這次推出的NF5698G7伺服器在6U空間支持8顆基於開放加速模組OAM高速互聯的Gaudi2 AI加速器,每顆Gaudi2晶片配置96GB HBM高速內存,共提供2.1Tbps的P2P互聯帶寬,支持全互聯拓撲,滿足大模型訓練張量並行的通信需求;搭載2顆第四代至強處理器,支持AMX/DSA等AI加速引擎。
NF5698G7基於全球開放計算OCP開放加速器規範OAM/UBB進行產品設計,支持PyTorch、TensorFlow等主流AI框架和Megatron/DeepSpeed等流行開發工具,為生成式AI提供成熟、高性價比的開放生態產品方案。
除了Gaudi2,浪潮資訊與眾多晶片廠商有廣泛的合作,比如英特爾、AMD、Arm、Ampere、NVIDIA、國內的AI創新公司等。這其實也是浪潮資訊在AI伺服器方面的能力體現。
04 依靠夥伴,英特爾打個AI翻身仗
Gaudi2是英特爾布局AI的重要棋子。或許藉助Gaudi2,英特爾可以在AI領域打個翻身仗。至於這樣的論斷是否成立,這要看Gaudi2後面的市場表現。
在AI市場,英特爾並沒有占據太大的優勢。雖然英特爾一直在為至強處理器打「AI補丁」,但是相比GPU的強勢地位,效果並不明顯。比如第四代英特爾至強可擴展處理器繼承了英特爾AMX加速引擎,可以更好地運行AI工作負載。
創新的硬體必不可少,軟體的生態建設同樣重要。就像NVIDIA在AI市場,除了GPU,CUDA是其構建護城河的重要因素。
對於英特爾也是如此,英特爾構建了從雲到端產品組合,同時提供Geti商用軟體平台和OpenVINO開源深度學習平台等。
此外,英特爾的一大優勢是開放生態,秉持賦能全棧軟體的開放生態戰略,幾十年來持續投入從硬體到軟體各個層面的開源開放,建立了充滿活力的生態系統,其傳承自x86架構的龐大合作夥伴體系可以為英特爾帶來巨大的能力。英特爾在Gaudi2推出後,新華三、超聚變等英特爾的鐵桿夥伴也講推出相應的伺服器產品。
在NVIDIA和AMD晶片無法供應中國市場的情況下,英特爾聯合合作夥伴推動Gaudi2 AI加速器的AI伺服器,無疑是具有想像空間的。
結論
大模型驅動的AIGC對於算力需求是巨大的,這直接帶動了AI基礎設施的發展,而AI伺服器更是成為搶手貨。這次Gaudi2在國內發布,並由浪潮資訊進行相關伺服器的銷售,無疑為當前火爆的AI伺服器市場帶來新的變化。
如今是一個多元化的時代,不光AI晶片,還有大模型乃至AI框架,呈現出百花齊放的態勢。Gaudi2在中國市場如果表現出色,無疑會給整個市場帶來變革,這是中國市場對於AI算力的強大需求所決定的。