DeepSeek V4正式發布當天,華為昇騰CANN官方通過直播宣布V4已在昇騰平台完成首發,國產模型與國產算力的組合首次進入實戰部署階段。
消息傳出的同一天,英偉達官方技術部落格緊急發文,宣布DeepSeek V4已在Blackwell平台完成適配,並曬出實測數據——GB200 NVL72上每用戶推理速度超過150 tokens/秒。

這份同日宣布,措辭專業、數據齊全,但發布節點之急迫,將焦慮暴露無遺。
更戲劇性的是,黃仁勛10天前才說過一句話。他在一檔播客中直言,如果頂尖AI模型被優先優化用於華為晶片而非英偉達平台,這對我們而言將是災難性的。
事實上,英偉達並非沒有技術底牌。V4-Flash採用FP4+FP8混合精度,FP4目前僅Blackwell及之後的高端晶片原生支持。
值得一提的是,只靠Blackwell才能跑V4的壁壘,發布當天就被國產方案繞了過去。
智源FlagOS同日宣布實現了FP4到BF16的精度路徑轉換,將V4-Flash適配到了海光、沐曦、華為昇騰、摩爾線程、崑崙芯、平頭哥真武、天數等8款以上國產晶片上,把適配周期從數周壓縮至數天。
華為昇騰Atlas 350加速卡是國內目前唯一支持FP4低精度的推理產品,單卡算力達到英偉達H20的2.87倍。
DeepSeek官方也在定價說明中透露,預計下半年昇騰950超節點批量上市後,Pro版價格將大幅下調。
目前英偉達的NVIDIA NIM微服務已上線DeepSeek V4,SGLang和vLLM同步提供部署方案。從首日表現看,英偉達即便仍是主角,但不再是唯一的主角。






