不久前,NVIDIA曾預告RTX 40系顯卡將推出三位新成員,分別是RTX 4070 SUPER、RTX 4070 Ti SUPER以及RTX 4080 SUPER。這是自RTX 20系之後以SUPER後綴命名的顯卡再次登場,說明SUPER並不是只為RTX 20推出的「臨時工」。
根據一個禮拜之前解禁發售的RTX 4070 SUPER的表現,證實了SUPER將延續它一開始的屬性——加量不加價,以幾乎等同原版型號的售價,提供更出色的性能。
如此這般,SUPER勢必成為往後每一代NVIDIA產品序列中玩家最期待的名字,後話暫且不表,RTX 40系SUPER的精彩在繼續——RTX 4070 Ti SUPER的首發售價6499元,跟一年前RTX 4070 Ti的首發售價一樣,今晚我們迎來這款顯卡發售以及性能評測的解禁。
筆者一開始以為GeForce顯卡後綴名稱的SUPER的定義與Ti類似,它們是相對唯一的,不重疊的。現在RTX 4070 Ti SUPER的出現說明它們有不同的定義,互相不衝突,SUPER可以出現在Ti的後面。就像上文提到的,SUPER可視作加量不加價的標誌,Ti作為即有型號當然也可以貼上這個標誌。
與RTX 4070 SUPER不同的是,這次NVIDIA沒有為RTX 4070 Ti SUPER推出Founder's Edition(公版,簡稱FE版),這一點似乎與RTX 4070 Ti是對應的,後者也沒有FE版。於是我們第一時間收到的RTX 4070 Ti SUPER產品是影馳的RTX 4070 Ti SUPER大將,符合MSRP標準(即售價和頻率參數符合NVIDIA默認標準),由它來代表NVIDIA官方標準完成本次首發評測。
遊戲與創作雙修
對於遊戲玩家來說,和其它RTX 40系列顯卡一樣,DLSS3/DLSS3.5依然是SUPER顯卡的核心賣點,包含超解析度、幀生成技術、光線重建和NVIDIA Reflex。
DLSS3專屬的Frame Generation(幀生成技術)可以將光流預估和DLSS相結合,在現有幀之間插入精確的合成幀,由較少的原始像素渲染量輸出成倍的幀畫面,實現幀數「翻倍」提升,讓玩家獲得更流暢的遊戲體驗。
而DLSS 3.5則引入的Ray Reconstruction(光線重建)是專為「光線」開發的一套AI模型,它將需要人工設計的降噪器,替換為NVIDIA超級電腦訓練的AI網路,通過高達原來5倍的訓練量,使採樣光線之間生成更高質量的像素,獲得更貼近真實的光影視覺體驗。
需要RTX顯卡的人不再限於遊戲用戶
自基於Volta架構的TITAN V開始,NVIDIA就算正式開始了在AI計算領域的布局,具體表現在首次集成在GPU核心中的張量計算單元——Tensor。專用於半精度、乃至四分之一精度海量並行計算能力的Tensor Core就是為AI量身打造的利器,無論是在遊戲應用領域的還是AI創作領域,Tensor Core都是支撐其運行的核心硬體基礎。
除了遊戲以外,最近兩年GPU在AI計算領域的應用如火如荼,整合Tensor core的NVIDIA桌面端顯卡讓AI應用進入千家萬戶。
NVIDIA專為生成式AI在GPU上的高性能推理、訓練推出了TensorRT For Windows的SDK,無需一定要購買像H100那樣昂貴的專業AI計算卡,廣大普通用戶也可以輕易使用GeForce RTX顯卡為AI加速。調用NVIDIA GPU中的Tensor core,根據訓練的模型條件,迅速推理生成想要的圖像、幀畫面,極大提高創作效率。
本次評測除了例行的遊戲測試之外,也還將為用戶展示RTX 40系顯卡在AI創作領域的一些典型應用。
規格參數解析
完全在意料之中,RTX 4070 Ti SUPER顯卡搭載的是AD103族系的晶片,因為它的原版型號RTX 4070 Ti採用的AD104-400晶片已經頂格,沒有再往上發展的空間。RTX 4070 Ti SUPER唯一可能的是基於RTX 4080的晶片族系,它的GPU具體型號為AD103-275,後者為AD103-300。
當然RTX 4080也不是頂格的,在它之上應該有更高規格的AD103晶片——RTX 4080 SUPER?這非本文的話題,留到RTX 4080 SUPER評測中再探討吧。
AD103-300架構示意圖(RTX 4080)
RTX 4080的AD103-300晶片有7個GPC,相比之下RTX 4070 Ti SUPER的AD103-275削減了其中一組包含5個TPC的GPC,減少了10個SM流式多處理器。由於每個SM內建128個SP32單元,即RTX 4070 Ti SUPER比4080少了1280個CUDA,為8448個。
AD103-275架構示意圖(RTX 4070 Ti SUPER)
GPC中包含的10個光追單元、16個ROPs、40個Tensor core和40個紋理單元也也相應減去,但令人欣喜的是顯存規格完整的保留了下來——擁有8×32bit=256bit顯存接口,配備16GB GDDR6X高速顯存,與RTX 4080的配置一樣。
AD103-275核心實拍照片
保留RTX 4080的顯存規格意味著RTX 4070 Ti SUPER對高解析度高畫質貼圖具有較強的負荷能力,遊戲遊戲可以用更高的畫質,並可能在大多數遊戲下勝任4K解析度,尤其是那些支持DLSS3的遊戲。
此外,AI推理和訓練對顯存容量、吞吐量的要求很高,顯存的變化對性能影響可以為說立竿見影,可以預見RTX 4070 Ti SUPER顯卡會比RTX 4070 Ti明顯出色的表現。
其餘細微參數不再文字贅述,可在規格對比表中自行查閱:
另外功耗方面值得一提:RTX 4070 Ti SUPER雖然是RTX 4080的親兄弟,但TGP比後者低不少,跟它的原版型號RTX 4070 Ti幾乎一樣,僅僅多5W,可謂加性能不加電費。
影馳RTX 4070 Ti SUPER大將介紹賞析
影馳大將一直是業內最具性價比的顯卡系列,堅實可靠的散熱加恰到實處的PCB做工用料,以及經濟實惠的售價,再加上雖不十分精緻,但也不令人討厭的外觀,它是廣大玩家手頭吃緊時的最優選擇。
影馳RTX 4070 Ti SUPER大將是這次以6499元起步價開售的型號之一,性能與官方標準吻合。
不含擋板長寬厚分別是321mm、125mm和61mm,體型屬於中等偏上,可以兼容當前幾乎所有中塔機箱和大部分支持長顯卡的小鋼炮機箱,採用星炙散熱器的三風扇布局,配備三個直徑9cm風扇。
「GALAX」字樣的影馳Logo位於側脊上,是該顯卡唯一的RGB燈光點綴
厚度不小,擋板為叄槽規格,輸出接口為3個DP1.4a和一個HDMI2.1
下面是顯卡運行狀態的燈光圖賞:
測試平台軟硬體介紹
本次測試選用9款遊戲充分全面考察這款影馳RTX 4070 Ti
SUPER 大將的性能,並且與它近鄰的RTX 4080以及原版型號RTX 4070 Ti做對比。其中2款遊戲支持最新的DLSS3.5,也就是光線重建,另外5款支持DLSS3,最後兩款則分別考察DLSS2和非DLSS遊戲的表現,儘可能覆蓋各種玩家的各種應用範圍。
測試平台軟硬體配置如下:
值得一提的是,鑑於AMD最近發布的Ryzen 7000系列X3D處理器在遊戲方面的優異表現(大部分超過了Intel i9 13900K),本次首測採用目前遊戲測試中最為亮眼的Ryzen 7 7800X3D作為測試平台。
為確保Ryzen 7 7800X3D處理器性能穩定發揮,測試平台選用微星MEG X670E ACE主板,這是該晶片組產品中的准旗艦型號,僅次於GODLIKE。這款主板的BIOS還針對X3D處理器做了優化,為CPU和內存都提供了一些高性能預設參數,期待參加測試的這些顯卡都能發揮出不同以往的表現。
3DMARK基準測試
首先是3DMARK基準測試,API涵蓋DX11、DX12以及DX12 Ultimate,解析度包括2K與4K,圖形技術涵蓋光線追蹤與DLSS。
通過3DMARK跑分可以初步看出,RTX 4070 Ti SUPER的性能剛好位於RTX 4080與4070 Ti的中間位置,而RTX 4070 Ti與4070 SUPER的性能則比較接近。
DLSS3.5遊戲-《電馭叛客2077》測試
《電馭叛客2077》自帶Benchmark程序,並且支持DLSS3.5的光線重建技術,測試將分為關閉DLSS、打開DLSS3(幀生成)以及打開DLSS3/3.5(幀生成)的三種狀態下運行,考察DLSS3的效能以及光線重建對性能和畫面的影響。
由於《電馭叛客2077》的Benchmark驅使的硬體運行狀態有不穩定性,所以測試結果可能出現倒掛,或者邏輯異常的情況,數據僅供參考。
DLSS開和關完全是兩個遊戲,尤其是2K和1080P直接從入門幀率變為暢爽。可能是測試程序不穩定的緣故,亦或者跟一些非開放的畫面設置參數有關,開啟光線重建有些時候會提升幀率,有些時候又會降低幀率。不過無論幀率如何,對光追視覺效果的提升是始終一致的。
下面為《電馭叛客2077》DLSS3.5光線重建開和關的畫質對比:
《電馭叛客2077》
《電馭叛客2077》
DLSS3.5遊戲-《心靈殺手2》測試
《心靈殺手2》沒有自帶的Benchmark程序,選擇遊戲開始時主角進入樹林中調查,並從樹林走到湖邊的一段負載較高的路徑來測試。
結果與《電馭叛客2077》類似,DLSS開與不開完全是兩個遊戲。而且由於該遊戲在非DLSS狀態下會默認打開DLAA,不但全解析度像素渲染還額外消耗性能,此時變成了一個不折不扣的硬體殺手,即使是1080P下幀率也是不可接受的。所以運行該遊戲必須開啟DLSS,而DLSS3.5的光線重建能夠進一步改善幀率,同時優化光追視覺體驗。
注意到在4K解析度下DLSS3測試,12G顯存的RTX 4070 Ti、4070 SUPER與16G顯存的RTX 4070 Ti SUPER、4080呈現斷崖式差距,應該是顯存容量瓶頸限制了前兩者發揮。相比定位2K解析度遊戲的4070 SUPER和4070 Ti,擁有與4080相同顯存的4070 TI SUPER彰顯出它面對4K遊戲的能力,通常一款顯卡所定位的遊戲解析度很大程度上與顯存配置有關。
下面為《心靈殺手2》DLSS3.5光線重建開和關的畫質對比:
《心靈殺手2》
《心靈殺手2》
《心靈殺手2》
通過開啟DLSS光線重建(DLSS 3.5)與關閉DLSS光線重建(DLSS 3)的畫面效果對比不難看出,在開啟光線重建之後,總體來說遊戲的圖像變得更加清晰,細節更為豐富,同時重影更少,並且在光線條件發生劇烈變化時響應更快,整體遊戲體驗變得更加逼真,代入感更強。
DLSS3遊戲-《F1 22》測試
《F1 22》運行遊戲自帶的Benchmark程序就好
作為賽車類遊戲本身對幀率要求就低,遊戲優化又非常理想,RTX 4070 Ti SUPER可無壓力用4K得到極致體驗。
DLSS3遊戲-《瘟疫傳說:安魂曲》測試
遊戲沒有測試程序,用第一章節跑步到城堡遺蹟下的路程來測試。
RTX 4070 Ti SUPER開啟DLSS3後4K解析度仍有流暢之力。
DLSS3遊戲-《霍格屈絲之異》測試
遊戲不自帶測試程序,利用軌道車上的一段自動路徑來測試。
遊戲對DLSS3的優化非常好,四款顯卡從1080P到4K都是通殺的。