4月25日,中國移動2023移動雲大會在蘇州金雞湖國際會議中心開幕。大會全方位展示了移動雲最新發展成績,並發布了移動雲全新戰略規劃、自研核心技術成果及未來市場關鍵舉措,釋放加速賦能千行百業數智化轉型的數智力量。
楊傑:雲擎未來鑄重器 智信天下繪宏圖
中國移動董事長楊傑表示,作為新型資訊基礎設施的重要組成部分,以云為核心的算力基礎設施正加快成為數字經濟高質量發展的有效推動力、促進社會進步的數智生產力、全球大國博弈的重要競爭力。建設雲基礎設施、提供算力服務,是中國移動數智化轉型的戰略重點。2022年移動雲收入突破500億元、較三年前增長25倍,發展創新力、市場競爭力、生態聚合力、品牌影響力明顯提升,綜合實力躍升至國內雲服務商第一陣營。
談及未來發展,楊傑坦言,中國移動將以移動云為關鍵載體,加快推進算力網路從泛在協同到融合統一再到一體內生,勇擔算力網路國家隊、主力軍、排頭兵,根植於「強富美高」新江蘇這片數字經濟的沃土,紮實踐行「為國建雲」使命擔當,與廣大合作夥伴攜手,努力建成技術領先、客戶信賴、開放合作的一流雲服務商,合力繪就算力網路的宏偉藍圖。
COCA 引領雲計算市場下一個黃金十年
值得注意的是,本次移動云為創新高性能計算框架,發布了一款數據中心級軟硬體化片上計算架構——移動雲COCA架構,推進DPU性能加速、SDN網路管控分離,自研高性能軟硬一體邊界網關,支撐打造無損網路。
隨著算力成為數字經濟新引擎,算力規模持續增長,算力結構發生改變,主動擁抱智算浪潮,持續輸出優質算力支撐數字中國建設,適配泛在化、異構化算力推動數智化轉型,正成為面向未來基礎設施新變革的重要思考。
當前,「封閉的技術生態,複雜的技術堆棧,碎片化的技術體系」已嚴重阻礙數字基礎設施的健康發展,這不僅會增加數字基礎設施的維護和升級成本,還會讓數字化轉型過程中的各種技術瓶頸更加難以解決。為了解決當前數字基礎設施發展中遇到的問題,移動雲COCA架構應運而生。「我們有一個宏偉願景,那就是利用移動雲COCA架構助力打造國家級自主可控的高性能算力基礎設施。」中國移動雲能力中心IaaS產品部總經理劉軍衛在大會同期舉行的「磐石算力底座論壇論壇」上這樣說。
劉軍衛解釋道:「為了實現這一願景,我們將持續布局中國化智算生態,與合作夥伴共建自主可控GPU DPU聯盟、聯合創建高性能網路技術,希望帶動中國化智算產業成熟發展,抓住雲計算技術定義權,引領雲計算市場下一個黃金十年。」
據了解,移動雲COCA架構面向算力網路研發GPU、DPU、HPN三大核心單元,旨在實現「算力 連接」集群化技術的橫向融合與垂直抽象。統一實現計算、存儲、網路、安全、管控能力的硬體卸載加速。
1、GPU單元異構協同
在GPU單元方面,劉軍衛透露,移動雲希望與合作夥伴共建自主的GPU聯合生態。統一算子接口標準、提供統一北向接口,兼容各GPU的深度學習框架。AI抽象降低客戶遷移成本,AI加速提高訓練 推理效率,AI池化提升GPU資源利用率。
移動雲這一布局可謂切中時弊。誠然,現階段,CPU負載高、缺乏GPU進行圖形處理和加速、整體體驗差等多維挑戰,持續影響著終端用戶獲得「完美體驗」,而生態協作則是推動應用落地的關鍵力量。「移動雲COCA架構面向GPU單元,將以異構協同的算力構建智算基礎設施能力基石。」劉軍衛補充道。
2、DPU單元軟硬一體
在DPU單元方面,移動雲以COCA架構為基礎,打造出包括網路引擎、存儲引擎、管控引擎、虛擬化引擎、安全引擎的磐石DPU五大卸載引擎,軟硬融合重構算力基礎設施,助力編程加速單元DPU成為新算力核心,重新定義算力時代雲計算技術新標準,構建算力時代新技術曲線。
3、HPN單元突破瓶頸
在HPN單元方面,移動雲旨在基於COCA架構攻克業界「卡脖子」的連接難題。
2023年,由於環境原因,我國本土化的高性能算力丞待突破。同時,自ChatGPT的爆火掀起生成式AI的浪潮以來,各類「大模型」如雨後春筍般冒出,這使得AI算力日漸緊俏。劉軍衛坦言;「基於COCA架構,我們以X-Link 自研「烏蒙協議」 分布式通信庫,三者協同配合攻堅「大模型」等應用場景的算力供給。攜手共進突破算力連接瓶頸,推動算力新基建能力躍升。
關於COCA架構的落地規劃,劉軍衛透露,2023年6月移動雲將發布COCA-DPU單元v1.0,構建軟硬一體行業標準;2023年9月。發布COCA-GPU單元v1.0,實現AI算力的融合加速;2023年11月發布COCA-HPN單元v1.0,實現自主可控高性能網路;2024年第二季度,實現COCA架構的全棧自主可控,助力國家數字新基建。
「我們願攜手各方戰略合作夥伴,共同打造國家級自主可控算力基礎設施,以COCA架構的技術生態,引領雲計算市場下一個黃金十年。」劉軍衛總結道。
COCA讓「磐石更堅」
在中國移動展區,至頂網探尋到了中國移動最新發布的「第三代磐石伺服器」。
磐石DPU,是磐石系列硬體產品核心。作為業內領先的DPU解決方案,磐石DPU擁有2*100G帶寬,對主機可呈現多達1000個虛擬設備,讀寫資源提升8倍,可實現零虛擬化損耗的高性能計算服務。整機存儲性能也可達100W IOPS(每秒進行讀寫操作的次數),存儲性能提升1倍。整體算力提升10%,核心性能達到業界頂尖水平。
展區工作人員告訴至頂網,磐石算力架構由自研的磐石DPU和支撐其生命周期的磐石伺服器組成,圍繞裸金屬、雲主機、容器等算力需求作統一算力底座支撐。
談及GPU方面,工作人員向至頂網展示道:「在這款磐石伺服器的GPU上運行的是基於COCA架構搭建的算力平台。」該工作人員坦言,COCA架構主要面向算力網路技術設施生態的算力卸載、解耦、無損構建目標,力圖構建算力的標準化接入生態同時彌補算力與應用間鴻溝。
現階段,在DPU產業迅猛發展的行業風潮下,通過 FPGA、NP、ASIC 等多種硬體路線實現 DPU 晶片的設計策略已經被國內廠商廣泛運用。同時,與國內雲廠商和各行業數據中心採取定製或聯合研發等模式,將有效推動DPU 在數據中心內更廣泛地落地,並將產業競爭發展持續推向新高度。