英偉達緊急發文：火速宣布DeepSeek V4已完成適配

DeepSeek V4正式發布當天，華為昇騰CANN官方通過直播宣布V4已在昇騰平台完成首發，國產模型與國產算力的組合首次進入實戰部署階段。

贊助商廣告

消息傳出的同一天，英偉達官方技術部落格緊急發文，宣布DeepSeek V4已在Blackwell平台完成適配，並曬出實測數據——GB200 NVL72上每用戶推理速度超過150 tokens/秒。

這份同日宣布，措辭專業、數據齊全，但發布節點之急迫，將焦慮暴露無遺。

更戲劇性的是，黃仁勛10天前才說過一句話。他在一檔播客中直言，如果頂尖AI模型被優先優化用於華為晶片而非英偉達平台，這對我們而言將是災難性的。

事實上，英偉達並非沒有技術底牌。V4-Flash採用FP4+FP8混合精度，FP4目前僅Blackwell及之後的高端晶片原生支持。

值得一提的是，只靠Blackwell才能跑V4的壁壘，發布當天就被國產方案繞了過去。

智源FlagOS同日宣布實現了FP4到BF16的精度路徑轉換，將V4-Flash適配到了海光、沐曦、華為昇騰、摩爾線程、崑崙芯、平頭哥真武、天數等8款以上國產晶片上，把適配周期從數周壓縮至數天。

華為昇騰Atlas 350加速卡是國內目前唯一支持FP4低精度的推理產品，單卡算力達到英偉達H20的2.87倍。

DeepSeek官方也在定價說明中透露，預計下半年昇騰950超節點批量上市後，Pro版價格將大幅下調。

目前英偉達的NVIDIA NIM微服務已上線DeepSeek V4，SGLang和vLLM同步提供部署方案。從首日表現看，英偉達即便仍是主角，但不再是唯一的主角。