宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

讓數據常青,為AI立基,撐起AI基礎設施長期演進的底層邏輯

2026年01月16日 首頁 » 熱門科技

「21世紀什麼最重要?人才!」如今,21世紀已過半,人才依舊是推動產業前行的核心驅動力。但AI帶來了同等重要的新力量:算力成為推動產業升級的新驅動力,存儲則為AI和數字經濟的持續發展提供堅實底座。

根據IDC預測,到2025年全球每年產生的數據量將達到約213ZB,並在2029年超過500ZB 級規模,中國市場年數據產量也有望從約52ZB增長至136ZB以上,年複合增長率接近27%。

數據的高速膨脹,正在倒逼存儲架構的重構與升級。

XSKY用10年時間已經從一個初創團隊,現在已經肩負起中國核心產業5500PB關鍵數據的安全重任。

回顧XSKY發展歷程,2015-2017年,雲時代開啟,其用軟硬體架構解耦,打破了集中式存儲的硬體黑盒,把選擇權交還給客戶。

2017-2022年,面對大數據爆發,XSKY通過XEDP統一數據平台,打通了協議壁壘,實現了「一個數據中心,一套存儲」。

2022年,XSKY就預判了AI對於極致性能和數據治理的重要性,投入研發並發布了XSEA全閃底座和EasyData數據管理平台。三年的技術積累,也為支撐當前大規模AI場景和高性能計算提供了基礎。

2026年XSKY再次出發,通過架構創新,打造了全棧AI數據方案——AIMesh。

「有『三堵牆』 阻礙著AI進化:IO牆、重力牆、內存牆。」XSKY星辰天合CEO胥昕說道。既要守住數據安全的護城河,又要打破阻礙效率的三堵牆,解決之道既不能簡單的修補,也不能推倒重來,而要持續演進。今天企業真正的差異化優勢在於「專有數據」,XSKY的價值在於幫助企業在私有環境內,安全地將這些專有數據轉化為智慧。構築企業AI工廠的穩固、高效、靈活的數據底座,讓企業在AI時代占據競爭制高點。

讓數據常青為AI立基撐起AI基礎設施長期演進的底層邏輯

AIMesh織起三張網,撐起AI工廠的數據底座

AIMesh是面向AI工廠的一張數據與內存網。XSKY的目標只有一個:讓每一張GPU都被數據和上下文餵滿,而不是被I/O和內存拖慢。

AIMesh處在複雜的存儲資源層和算力層之間,構建了一個統一的抽象平面,平面上編織了三張網,實現了訓練、推理、數據湖,三網合一。第一張是訓練數據網。專為解決IO牆而生,讓數據像電流一樣極速供給GPU;第二張是推理內存網。它作為KVCache的L3外部內存,讓推理不再受限於顯存的物理邊界。第三張是全局對象網。它是AI全生命周期的數據總管,打破數據重力,實現EB級數據的自由流動。

MeshFS打破IO牆:化出專為AI訓練設計的並行文件系統

在AI場景下,存儲並不是「有沒有方案」的問題,而是長期存在的結構性取捨:HPC存儲足夠快,卻難以適配雲原生和多協議生態;而通用NAS易用性更好,但一旦進入高並發、小文件訓練場景,性能短板便迅速暴露。

這背後,本質是文件系統能力的斷層。早在七年前,XSKY就發布了面向高性能NAS場景的 XGFS文件系統。不同於單點突破型產品,XGFS的演進路徑,始終圍繞「協議完整性」和「企業級穩定性」展開:從NFS、SMB、FTP、S3,到大數據的HDFS、雲原生的CSI,以及最新支持SFTP,幾乎覆蓋了企業所有文件訪問路徑。

這套系統在工業質檢、EDA 晶片設計、量化交易、金融營銷與風控、基因測序、數字病理以及自動駕駛等高穩定性場景中長期運行,代表了文件存儲的「穩態能力」。

但AI時代改變了規則。極端並發、全閃介質、分布式訓練,讓「穩」不再足夠,「快」成為剛需。所以2023年發布的XSEA「星飛」全閃架構成為轉折點,基於Shared-Everything底座,其塊存儲產品XEBS-XINFINI在200Gb ROCE網路下實現了單卷410萬IOPS,刷新了行業紀錄。

針對「穩」和「快」兩個企業級AI場景的核心需求,XSKY選擇將XGFS成熟的POSIX語義與 XSEA的全閃極速底座深度融合,由此誕生了專為AI訓練的新一代並行文件系統——MeshFS。

MeshFS的設計邏輯非常明確:第一,全協議兼容。堅持提供標準的POSIX語義;第二,線性的極致性能。通過全分布式架構和元數據分片技術,MeshFS 的性能隨節點數線性增長;第三,企業級管理與智能分層。數據可以在全閃存層和低成本層之間透明流動。

實測中,MeshFS在順序讀寫、隨機IO等關鍵指標上,均顯著領先同類方案。其核心價值只有一句話:為計算讓路,讓訓練不再等待數據。

MeshSpace推倒重力牆:一個支持EB級數據的全局非結構化數據平台

如果說訓練數據網解決的是「快」,那麼下一道難題就是「大」。

過去九年,XSKY的對象存儲XEOS從V2.0演進到V6.4,長期位居中國對象存儲軟體市場份額第一。但真正值得關注的,是其在V6階段做出的一個看似「超前」的工程決策,挑戰單桶 1000億對象規模。

在當時,大多數廠商還停留在「十億級」對象的性能優化討論中。XSKY在XScale引擎的全局元數據管理、小文件索引歸併、以及海量數據下的追加寫(Append-only)上,投入了長達三年的底層重構與打磨。

這一決定,在AI時代也被證明是對趨勢的預判。當AI開啟了對物理世界的全量數字化,數據規模從TB躍遷至PB、EB,單集群對象存儲開始遇到無法迴避的物理極限,當年的「單桶千億」不再是天花板,而僅僅是AI數據湖的起跑線。

於是,架構需要一次從「有限」到「無限」的升維。XSKY將XScale架構進行了推出了MeshSpace,一個面向EB級數據的全局非結構化數據平台,其目標不再是「做大單集群」,而是打破集群邊界。

MeshSpace具備了三大核心能力,第一,平滑演進能力,無需遷移,現有XEOS集群可直接接入;第二,全局控制面統一,通過統一的DNS,將多地集群抽象為一個邏輯存儲;第三,數據治理全局化,跨全閃、HDD、磁帶的智能調度。

XScale引擎最新版本已進入「百萬 OPS 單桶時代」,並且分布式KV引擎進行了徹底的優化,讓AI訓練中關鍵的大塊寫性能提升了近50%,同時將延遲降低了30%。

從「單點極致」到「全局統籌」,MeshSpace 更像是為AI數據湖準備的一塊「無限底座」。

MeshFusion擊穿內存牆:面向KVCache的「持久化內存」方案

訓練之後,真正決定AI成本結構的是推理。隨著AI從簡單的Chatbox變成複雜的AI Agent(智能體),從幾句對話變成百萬級(1M+)超長上下文。KVCache 成為新的性能與成本黑洞。KVCache是AI「短期記憶」,為了記住一百萬字的上下文,顯存被迅速填滿,而用HBM 或DRAM擴容,代價更為昂貴。

XSKY的判斷是在HBM(L1)和DRAM(L2)之外,構建一層極其廉價、但性能又要跟得上的L3級外部內存。這就是MeshFusion的定位,面向KVCache的「持久化內存」。

MeshFusion直接運行在GPU伺服器內部,利用本地NVMe SSD構建高性能的資源池,擁有零拷貝、極致並發、協議自適應三大必殺技。

在多組實測中,MeshFusion與純DRAM的性能差距被控制在 10% 以內;在高並發和內存溢出場景下,甚至實現了20%的性能反超。MeshFusion的意義不在於「替代內存」,而在於用1%的成本,換取近乎無限的上下文能力。

AI基礎設施的長期命題,數據如何穿越算力周期

在AI時代,合作夥伴們也與XSKY建立起了更加密切的關係。雲計算時代,「存算分離」「私有雲建設」是企業私有雲繞不開的命題,ZStack與XSKY也由此形成了高度穩定的合作關係。一方以極簡、穩定的雲平台降低企業用雲門檻,一方以高性能軟體定義存儲夯實數據底座。「ZStack雲平台+XSKY存儲」,已經成為私有雲建設中的成熟組合。

這種信任被延展到新的技術周期,隨著大模型興起,ZStack的戰略重心從CPU管理轉向以 GPU為核心的AI基礎設施。依託AIOS 智塔,ZStack正在構建面向智算中心的平台體系,AIMesh中的MeshFS和MeshFusion,與ZStack的智算平台規劃高度一致。

這一判斷同樣得到晶片與模型側的驗證。Intel從硬體視角看到,算力決定速度,存儲決定供給效率,能夠跟上硬體演進節奏的存儲體系,是AI生態中不可或缺的底座。十年來,雙方合作從底層技術共創、到方案級驗證、再到新品首發協同,逐步形成成熟的軟硬協同路徑,這也直接體現在AIMesh針對I/O牆與內存牆的系統級設計中。

在模型側,Minimax的實踐進一步放大了這一價值。在多地域、多集群的混合雲架構下,性能、穩定性與成本成為核心指標。PB級核心訓練與推理數據的長期運行驗證了系統穩定性,MeshSpace的統一命名空間有效緩解了數據孤島問題;MeshFS在訓練與推理階段提供高吞吐、低延遲 I/O,為大規模模型與推理服務的快速上線提供了現實支撐。

未來算法快速疊代、架構持續演進,不確定性將成為AI時代的常態。面對這種不確定性,XSKY給出的答案是:堅持開放解耦,構建絕對中立的數據底座。不綁定任何算力路線,不預設任何硬體陣營,無論選擇哪一種晶片架構、部署在私有雲還是混合雲,AIMesh都提供統一、標準的數據服務。

這種「中立」和「解耦」源於一個清晰判斷:算力的摩爾定律正在放緩,而數據的價值定律正在生效。硬體平台的生命周期可能只有三到五年,但承載企業智慧的數據資產,往往需要十年甚至二十年的持續存續。用確定性的數據能力,對抗技術快速更替帶來的不確定性,成為底層戰略選擇。

從這個意義上看,算力是不斷輪換的「流水之兵」,而數據才是長期穩固的「營盤」。AIMesh的目標,正是構建這樣一個長周期、可演進的數據底座,以不變的基礎能力,支撐上層算力與模型的持續疊代。讓數據常青,為AI立基,這也是AI基礎設施走向成熟所必須具備的底層邏輯。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新