在2026年國際消費電子展(CES)上,NVIDIA首席執行官黃仁勛正式揭曉了下一代人工智慧計算架構「維拉·魯賓」(Vera Rubin)。該架構預計將成為未來遊戲顯卡的基礎,並已進入全面投產階段,計劃於今年下半年開始向客戶交付。

作為當前Blackwell架構的繼任者,維拉·魯賓在性能上實現顯著突破。據NVIDIA介紹,其在推理任務中性能提升高達5倍,大型語言模型訓練效率提高3.5倍,同等任務所需GPU數量可減少至原先的四分之一。


該架構主要由六大核心組件構成:
基於Armv9.2的88核Vera中央處理單元
採用NVFP4格式、算力達50 petaflops的Rubin圖形處理單元
帶寬達3.6 TB/s的第六代NVLink交換機
ConnectX-9 SuperNIC網路適配器與BlueField-4數據處理單元
Spectrum 6以太網交換機

新架構在能效與可靠性方面尤為突出。通過集成Spectrum-X以太網光子技術與光學連接,功耗降低至原先的五分之一,連接可靠性則提升十倍。黃仁勛指出,這一飛躍得益於製造工藝的進步,儘管電晶體數量僅增加1.6倍,但整體效能大幅躍升。首批合作客戶將包括雲服務商CoreWeave與Microsoft Azure。
此次發布正值AI加速器市場競爭加劇之際。面對AMD等傳統對手以及谷歌等客戶自研晶片的挑戰,NVIDIA試圖通過維拉·魯賓架構實現性能與成本的雙重突破——預計將使AI推理的每token成本下降至原來的十分之一。






