今年GTC 2026在美國加州聖何塞會議中心舉行,主題演講以一段影片開場,將Token定義為現代AI的基本單位,是支持科學探索、虛擬世界、以及在物理世界中運行的機器的基石。隨後英偉達創始人兼首席執行官黃仁勛登場,表示「本次大會將涵蓋AI的五層蛋糕的每一層」。

黃仁勛提及了CUDA誕生20周年,並稱其為推動加速計算發展的「飛輪」,在「AI生命周期的每一個階段」都提供支持。另外還回顧了GeForce的發展歷史,與AI的發展全程相聯,稱英偉達是「GeForce打造的公司」,而正是這一平台把CUDA帶給了全世界。
黃仁勛宣布Vera Rubin平台正開啟代理式AI的下一個前沿,目前該平台搭載的7款新晶片現已全面投產,旨在擴展全球最大AI工廠的規模。現在Vera Rubin平台除了之前公布的Vera CPU、Rubin GPU、NVLink 6交換機、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太網路交換機外,還加入了Groq 3 LPU。這些晶片設計為協同運作,構成一台強大的AI超級電腦,可為AI的各個階段提供動力——從大規模預訓練、後訓練、測試階段擴展到實時智能體式推理。


今天英偉達還推出了NVIDIA BlueField-4 STX模塊化參考架構,可助力企業、雲計算及AI服務商輕鬆部署加速存儲基礎設施,以滿足代理式AI所需的長上下文推理能力。首個機架級部署方案集成了全新的NVIDIA CMX上下文記憶存儲平台,通過引入高性能的上下文層來擴展GPU記憶體,從而實現可擴展的推理和代理式系統,相比傳統存儲,每秒可處理的Token提升高達5倍。
此外,英偉達還帶來了NVIDIA Vera Rubin DSX AI Factory參考設計,這是一份用於構建協同設計的AI基礎設施的指南。同時正式發布完全兼容NVIDIA Vera Rubin DSX的NVIDIA Omniverse DSX Blueprint,旨在為大規模設計、建設及運營提供物理精確的AI工廠數字孿生。







