NVIDIA Vera Rubin架構將為AI推理帶來十倍成本優化

在2026年國際消費電子展（CES）上，NVIDIA首席執行官黃仁勛正式揭曉了下一代人工智慧計算架構「維拉·魯賓」（Vera Rubin）。該架構預計將成為未來遊戲顯示卡的基礎，並已進入全面投產階段，計劃於今年下半年開始向客戶交付。

贊助商廣告

作為當前Blackwell架構的繼任者，維拉·魯賓在性能上實現顯著突破。據NVIDIA介紹，其在推理任務中性能提升高達5倍，大型語言模型訓練效率提高3.5倍，同等任務所需GPU數量可減少至原先的四分之一。

贊助商廣告

該架構主要由六大核心組件構成：

基於Armv9.2的88核Vera中央處理單元

採用NVFP4格式、算力達50 petaflops的Rubin圖形處理單元

頻寬達3.6 TB/s的第六代NVLink交換機

ConnectX-9 SuperNIC網路適配器與BlueField-4數據處理單元

Spectrum 6以太網交換機

新架構在能效與可靠性方面尤為突出。通過集成Spectrum-X以太網光子技術與光學連接，功耗降低至原先的五分之一，連接可靠性則提升十倍。黃仁勛指出，這一飛躍得益於製造工藝的進步，儘管電晶體數量僅增加1.6倍，但整體效能大幅躍升。首批合作客戶將包括雲服務商CoreWeave與Microsoft Azure。

此次發布正值AI加速器市場競爭加劇之際。面對AMD等傳統對手以及谷歌等客戶自研晶片的挑戰，NVIDIA試圖通過維拉·魯賓架構實現性能與成本的雙重突破——預計將使AI推理的每token成本下降至原來的十分之一。