NVIDIA一直在準備Blackwell GPU的升級版本「Blackwell Ultra」,也就是B300、GB300,當然還是面向AI與高性能計算領域,今年晚些時候就會推出,然後才是下一代全新的「Rubin」。

Blackwell Ultra仍然是台積電4NP工藝、2080億個電晶體,還是兩個Die通過NV-HBI高速界面互連(帶寬10TB/s),配備總計160個SM單元(每個包含128個CUDA核心)、640個第五代Tensor核心,共享完全一致性的二級緩存。
GPU、GPU之間通過1.8TB/s帶寬的第五代NVLink互連,GPU、CPU之間則是900GB/s的NVLink-C2C通道,這些都沒變。
不同的是,Blackwell Ultra將首次開放PCIe 6.0支持,可用帶寬直接翻倍,HBM3E內存容量也從192GB增加到288GB(帶寬8TB/s),不過代價是最大功耗從1200W增加至1400W。
從NVIDIA的描述看,Blackwell本身就支持PCIe 6.0,只不過在此之前一直沒有開放而已。



性能方面,顯著提升的一是NVFP4 dense稠密性能大幅提升了50%而來到15PFlops,不過sparse稀疏性能還是20PFlops。
二是SFU(特殊功能單元) EX2下的注意力加速能力從5TF/s來到10.7TF/s,翻了一番還多。
FP8、FP16、TF16等數據格式的性能,則基本沒有變化。

Blackwell Ultra的主要部署形勢是GB300 NV72伺服器,液冷機架,每個節點還是包含兩顆B300 GPU、一顆Grace GPU。
