在此前的CES 2026展會中,英偉達發布了下一代的AI超級計算平台,Vera Rubin系統。在目前的環境體系中,此類LLM智能體需要依賴大量的長期記憶,並存儲下跨越多輪的對話,以及會話內容的上下文,以便AI能夠基於此前已經生成的推理內容進行繼承構建,而非從頭再來。這些內容也被稱之為KV緩存,按照傳統的做法這些緩存會被存儲在GPU的HBM緩存中,但很顯然以Vera Rubin那恐怖的算力來說,AI集群的數據需求增長,HBM已經無法承受。

因此,英偉達推出了全新的Bluefield-4 DPU來成為Vera Rubin平台中新的推理上下文記憶存儲平台(ICMS),從而提供更為高效的KV緩存復用。雖然這對於處理能力有著明顯的提升,但是大概率會對NAND產能引發新一波的短缺問題。

根據花旗的分析,一台Vera Rubin系統,每顆GPU就大約需要配備16TB的NAND容量,這意味著單單一套Vera Rubin NVL72配置就需要消耗掉1152TB。而根據推算,Vera Rubin的出貨量在2027年可能達到10萬台,如果按照這個數量級來看的話,那就需要占到未來幾年全球NAND總需求的9.3%。這樣算來,英偉達憑藉一己之力就可以造成供應鏈衝擊,但似乎NAND行業目前還沒有考慮好在現階段用哪些措施去應對如此龐大的增長需求。

無論是從DRAM還是NAND來看,一台AI系統所消耗的DRAM就差不多相當於100台普通家用PC,NAND也差不多相當於3台普通PC。對於存儲生產廠商而言,自然是優先保障能獲得大量訂單且高利潤的企業級用戶需求,剩下的邊角料才會來提供給本就處於優先級末尾的消費級PCDIY市場。這對於電腦玩家來說無疑是個非常不利的困境,前有堪比金條的記憶體,現在還得搭上固態SSD來作伴,更加雪上加霜。所以如果近期有著購買SSD的意向的話,建議還是從現在起就早早囤貨吧。






