記憶體價格大漲引發了顯存漲價,這也讓AMD及NVIDAIA兩家GPU巨頭面臨壓力,剛剛我們報道了AMD的應對策略——承諾不缺貨,但可能會漲價。
那NVIDIA這邊的策略呢,前兩天的CES展會上黃仁勛已經提到他們準備重啟RTX 30系列顯卡,特別是RTX 3060。

這個顯卡曾經是Steam上最流行的遊戲卡,而且霸榜多年,也是歷代60系中的成功代表之一,採用三星8nm工藝生產,目前來說1080p遊戲性能也不會說不夠用,大部分遊戲沒問題(你要去開極限畫質就當我沒說)。
除了重啟舊卡,黃仁勛可能還有個大殺招,那就是AI技術,他提到會把AI技術下放給上一代顯卡上,表示這需要大量工程工作,但並非不可能,需要去研究一下。
實際上NVIDIA已經在這麼做,這兩天就有個不起眼但極為重要的升級,給RTX顯卡引入了NVFP4支持,而且這個支持不止限於RTX 50,以前的RTX 40甚至RTX 30系顯卡也能用。
FP4算法的作用我們之前解釋過,簡單來說就是比FP16、FP8算法能大幅提升性能,同時大幅降低顯存占用,理論上只要FP16的1/4顯存即可,同時也不會降低多少運算精度。
NVFP4則是NVIDIA自己的FP4實現標準,表現更為優秀,但是這個技術在Blackwell架構的顯卡上才是原生支持,RTX 40及RTX 30是模擬支持。

給RTX顯卡增加FP4支持之後,表現如何呢?NVIDIA自己公布了一些數據,不同AI中性能提升不同,少的只有30-40%提升,多的翻倍提升,而在Qwen Image中,性能最高提升了360%。

不僅性能暴漲,FP4還會大幅降低顯存占用,Flux.1中顯存占用從23GB減少到了9GB,Flux.2中從87GB直接降低到了26GB,Qwen Image中也從40GB降低到了18GB,總體上就是少則降低一半,多則可以減少2/3顯存占用。






