英偉達與亞馬遜正積極推進新一代儲存架構研發,該架構將允許GPU直接操控SSD等儲存設備,繞過傳統CPU調度環節。英偉達計劃率先在其下一代Vera Rubin AI平台上導入「GPU發起直接儲存訪問」(GIDS)技術。

推動這一架構變革的核心原因,是現有馮·諾依曼架構存在先天性數據搬運短板:所有數據必須經由CPU中轉、DRAM緩存,才能傳輸至GPU。
這直接導致了CPU線程處理能力與GPU數萬級並行算力之間的嚴重錯配,該矛盾已成為制約AI推理與訓練提速的核心瓶頸。
GIDS技術的突破性在於,它允許GPU直接向SSD或高速快閃記憶體發出儲存訪問指令,全程繞過CPU與DRAM,徹底剔除中間調度層級。
為配合GIDS落地,業界推出高頻寬快閃記憶體(HBF)以突破HBM的容量瓶頸,延世大學宋基煥教授團隊的數據顯示,6顆HBF搭配2顆HBM可將GPU儲存從192GB拉升至3120GB,容量暴增逾16倍。
需要指出的是,HBF適合AI推理場景中儲存基本不變的模型參數,高頻率訓練場景仍需仰賴HBM。
產業布局方面,多方已同步落子。 英偉達主導 GIDS 技術標準,亞馬遜優先落地雲端算力集群,微軟、AMD同步布局自研方案,三星發力Z‑NAND快閃記憶體搶占硬體市場。






