號稱Superchip超級晶片GB10 Grace Blackwell,可以說是NVIDIA今年最值得期待的產品,也被視為NVIDIA進軍桌面CPU市場的第一步(筆記本移動端則是N1系列),但它沒能在7月如期面世。
近日,NVIDIA官方終於公布了GB10晶片的諸多細節,特意強調這是與聯發科成功合作的成果。
其實在今年初,NVIDIA首次宣布代號Project DIGITS、後命名為DGX Spark的桌面迷你AI工作站的時候,就曾提及聯發科的共同參與,主要貢獻了CPU和互連部分的設計。

技術規格方面,GB10採用台積電3nm工藝製造、2.5D封裝技術,其中CPU部分和內存成為S-dielet,GPU部分成為G-Dielet。
CPU部分集成20個Armv9.2架構核心,分為兩組,每組10個,每個核心都有自己的獨立二級緩存(容量沒說),然後每一組共享16MB三級緩存。
GPU部分基於Blackwell架構,CUDA核心數量沒說但應該是6144個,也就是相當於RTX 5070,還有第五代Tensor核心、24MB二級緩存,支持光追、DLSS4,FP32格式算力31 TFLOPS,NVFP4格式算力1000 TOPS。

CPU、GPU之間是高帶寬低功耗的C2C通道,基於NVLink總線架構。
還有16MB系統級緩存,可以作為CPU的四級緩存,進一步提高在CPU、GPU等不同引擎之間共享數據的效率。
內存是256-bit位寬的LPDDR5X統一內存,最高頻率9400MHz,原始帶寬約301GB/s。
整體熱設計功耗高達140W,而作業系統是定製的DGX Base OS,能否運行其他發行版Linux甚至Windows on Arm尚未可知。
NVIDIA宣稱,搭配128GB內存,GB10可以運行最高2000億參數的AI大模型,或者最高700億參數的微調模型。
兩台DGX Spark可以通過ConnectX-7總線互連,大模型參數最高可達4050億。


