NVIDIA在今年的CES2024上發布了新一代的「SUPER「系列顯卡,將在RTX 40系列中增設三款後綴SUPER的型號,分別是RTX 4070 SUPER、RTX 4070Ti SUPER和RTX 4080 SUPER。自RTX 20系之後SUPER顯卡重現江湖,它勢必代表比原版型號更激進的性能,但始發售價卻不一定會高多少。
其中RTX 4070 SUPER將於1月17日首先和廣大遊戲玩家們見面,成為NVIDIA在2024年發布的第一款新遊戲顯卡。

和RTX 20系中第一次出現的SUPER顯卡一樣,這次的SUPER系列同樣是在原有顯卡系列的基礎上,性能顯著升級,而價格幾乎保持不變。在世界普遍通脹,顯卡價格高企的今天,這屬實是不可多得的福利,讓廣大遊戲玩家們能夠享受到更具性價比的遊戲顯卡產品,印證了該系列的英文含義——SUPER超能力。
RTX 4070 SUPER相比RTX 4060有哪些變化?
RTX 4070 SUPER顯卡所採用的AD104-350核心擁有5個GPC,和完整的AD104-400核心相比只縮減了2個TPC,在規格參數上顯然更接近RTX 4070Ti顯卡,這意味著玩家只要花費RTX 4070顯卡的錢就能買到接近RTX 4070Ti的性能,可見這次NVIDIA的滿滿誠意。

RTX 4070 SUPER所使用的AD104-350核心架構

Ada LoveLace架構的SM流式多處理器微架構
按照Ada Lovelace架構的每個SM流式多處理器里包含了64個FP32單元和64個FP32/INT32混合單元,可視作為128個FP32單元,因而每個SM內為128個CUDA;按照每個SM配置了4個紋理單元、1個RT單元、4個Tensor core來計算,RTX 4070 SUPER一共擁有28組TPC、56個SM簇,共計7168個流處理器單元,224個紋理單元,56個三代RT單元和224個Tensor core。
按以上紙面數據計算RTX 4070 SUPER的性能預期可以達到RTX 4070Ti的93.3%,NVIDIA官方參數表呈現如下:


這次我們將以技嘉提供的RTX 4070 SUPER GAMING 魔鷹OC 12G顯卡(下文簡稱RTX 4070 SUPER 魔鷹)為例,來為大家展示RTX 4070 SUPER顯卡的真實性能表現,以及能為玩家們帶來怎樣的遊戲性能體驗。測試將包括常規的遊戲測試以及時下應用越發廣泛的AI創作測試。
RTX顯卡的價值不止眷顧遊戲玩家
自基於Volta架構的TITAN V開始,NVIDIA就算正式開始了在AI計算領域的布局,具體表現在首次集成在GPU核心中的張量計算單元——Tensor。專用於半精度、乃至四分之一精度海量並行計算能力的Tensor Core就是為AI量身打造的利器,無論是在遊戲應用領域的還是AI創作領域,Tensor Core都是支撐其運行的核心硬體基礎。

對於遊戲玩家而言,和其它RTX 40系列顯卡一樣,DLSS 3/DLSS 3.5依然是RTX 4070 SUPER顯卡的核心賣點,包含超解析度、幀生成技術、光線重建和NVIDIA Reflex。

DLSS3專屬的Freme Generation(幀生成技術)可以將光流預估和DLSS相結合,在現有幀之間插入精確的合成幀,由較少的原始像素渲染量輸出成倍的幀畫面,實現幀數「翻倍」提升,讓玩家獲得更流暢的遊戲體驗。

而DLSS 3.5則引入的Ray Reconstruction(光線重建)是專為「光線」開發的一套AI模型,它將需要人工設計的降噪器,替換為NVIDIA超級電腦訓練的AI網路,通過高達原來5倍的訓練量,使採樣光線之間生成更高質量的像素,獲得更貼近真實的光影視覺體驗。

魚和熊掌兼得的好事誰不喜愛?遊戲開發者通過DLSS可以保證遊戲質量還能降低配置需求,於是NVIDIA迅速建立起圍繞DLSS的遊戲生態,越來越多的新老遊戲加入了陣營。
目前已有超過300款遊戲和應用支持DLSS技術,而且數量還在持續不斷的增加,這也將會成為玩家選購RTX 4070 SUPER顯卡的重要理由之一。
對於RTX顯卡的需求不再僅限於遊戲用戶

花開兩朵各表一枝,另一方面,既然Tensor core可以即時優化處理遊戲裡的每一幀畫面,那麼給它更多時間,更多資源,它就可以生成更複雜的圖像。如今以Stable Diffusion為代表的AI繪圖技術正得到廣泛應用,NVIDIA專為生成式AI在GPU上的高性能推理、訓練而推出了TensorRT For Windows的SDK,讓廣大普通用戶可以輕易使用GeForce RTX顯卡為AI加速。調用NVIDIA GPU中的Tensor core,在數秒鐘內生成想要的圖像,亦可通過優化模型進度,提高推理吞吐量極大提高創作者的效率。
技嘉RTX 4070 SUPER魔鷹外觀與規格參數

技嘉RTX 4070 SUPER 魔鷹 顯卡採用了超公版的三風扇散熱設計,顯卡長度為30cm,高13cm,厚度約6.2cm,占用3條PCIe槽位。

技嘉RTX 4070 SUPER 魔鷹 顯卡採用了自家經典的風之力散熱系統,配置了3個9cm直徑的導流風扇,正反設計可以防止風扇之間的擾流現象,減少風扇噪音的同時能夠讓氣流更加集中,提高散熱效率。

顯卡配置了名為RGB幻彩光輪的燈效設計,在散熱風扇的轉軸和風扇外環上都安裝了RGB燈,默認模式下會隨著風扇轉動而閃爍亮起,當待機或者風扇停止轉動時滅燈,可以起到提示顯卡負載狀態的效果,也讓用戶能夠在待機狀態下暫時告別RGB光污染,玩家也可以通過技嘉智能管家(GCC)APP手動設置其它燈光效果或者和其它設備進行燈光同步。

外接供電接口背面有一個供電指示燈,供電正常狀態下不亮,供電異常時會不停閃爍,而燈未接供電時會常亮。
外接供電接口旁邊還有一個BIOS切換開關,分為OC和SILENT(靜音)兩個選項,不過經小編實際驗證,技嘉RTX 4070 SUPER 魔鷹的2套BIOS設置完全一樣,並沒有任何頻率、風扇策略的差異。

背面是一塊全尺寸規格的合金背板,能為PCB提供全面保護,尾部採用了吹透設計,露出大塊散熱鰭片,可以讓散熱風扇產生的氣流直接穿過散熱鰭片,進一步提高顯卡的整體散熱效率。

IO接口方面配置了3個DP1.4a和1個HDMI2.1影片輸出接口,可以滿足不同玩家的顯示設備連接需求,也方便用戶組建多屏顯示平台。

上面提到,技嘉RTX 4070 SUPER魔鷹雖然採用了OC、SILENT雙BIOS設計,但實際上兩套BIOS並沒有任何區別,核心頻率設置都是1980/2565MHz。相比公版技嘉魔鷹的Boost頻率高出了90MHz,驅動寫入功耗雖然和公版一致都是220W,但最大功耗值卻達到了320W,整整高出了100W,這意味著技嘉RTX 4070 SUPER魔鷹顯卡在超重負載下可有較小的降頻,和更穩定的性能發揮,也可能具有寬鬆的手動超頻空間,留給硬核玩家挖掘顯卡的超頻潛力。
技嘉RTX 4070 SUPER魔鷹顯卡拆解

技嘉RTX 4070 SUPER 魔鷹 顯卡的PCB為短板,長度只有17.5cm,相比顯卡外觀短了近一半。

RTX 4070 SUPER顯卡採用了AD104-350核心,周圍排布了6顆來自美光的GDDR6X顯存顆粒,單顆容量為2GB組成12GB的總容量,不過顯存位寬依然只有192bit,這也限制了RTX 4070 SUPER顯卡在超高清解析度下的輸出。

技嘉RTX 4070 SUPER 魔鷹顯卡採用了7 3相數字供電設計,7相為GPU核心供電,並且為每個MOSFET都提供了過溫保護設計,確保顯卡能夠持續穩定工作,給予玩家最強核心性能。

散熱鰭片採用了分段式設計,由6根6mm直徑的純銅熱管穿插連接,配合純銅散熱底座和下方的2根6mm純銅U型熱管,能夠將GPU核心產生的熱量迅速傳遞到散熱鰭片的各個角落,滿足顯卡的高效散熱需求,時刻保持顯卡最佳工作溫度環境。
測試平台軟硬體介紹
本次測試選用8款遊戲充分全面考察其性能,並且與它近鄰的RTX 4070以及上一代接近型號RTX 3070顯卡做對比。其中2款遊戲支持最新的DLSS3.5,也就是光線重構,另外4款支持DLSS3,最後兩款則分別支持DLSS2和不支持DLSS,儘可能覆蓋各種玩家的各種應用範圍。
測試平台軟硬體配置如下:

本次首測採用Intel最新消費級旗艦處理器Core i9 14900K,主板則選用做工用料卓越的技嘉Z790 AORUS MASTER X來保駕護航,確保測試平台穩定高效,能準確評估出RTX 4070 SUPER顯卡的性能。

Intel Core i9 14900K處理器

技嘉Z790 AORUS MASTER X是僅次於Extreme的准旗艦型號
3DMARK基準測試:DX11、DX12

技嘉RTX 4070 SUPER 魔鷹顯卡在3DMark Speed Way測試中的顯卡得分為5265。

技嘉RTX 4070 SUPER 魔鷹 顯卡在3DMark Time Spy Extreme測試中的顯卡得分為10292。

技嘉RTX 4070 SUPER 魔鷹 顯卡在3DMark Time Spy測試中的顯卡得分為21596。

技嘉RTX 4070 SUPER 魔鷹 顯卡在3DMark Fire Strike Ultra測試中的顯卡得分為12489。

技嘉RTX 4070 SUPER 魔鷹顯卡在3DMark Fire Strike Extreme測試中的顯卡得分為25902。
3DMARK基準測試光追與DLSS

技嘉RTX 4070 SUPER 魔鷹 顯卡在3DMark Port Royal測試中的顯卡得分為13412。

技嘉RTX 4070 SUPER 魔鷹顯卡在3DMark DirectX光線追蹤功能測試中的平均幀率為63.51FPS。

技嘉RTX 4070 SUPER 魔鷹顯卡在3DMark的DLSS3測試中,關閉DLSS為28.69FPS,開啟DLSS3為101.28FPS。

技嘉RTX 4070 SUPER 魔鷹顯卡在3DMark的DLSS2測試中,關閉DLSS為61.67FPS,開啟DLSS3為146.63FPS。
《電馭叛客2077》遊戲實測
由於RTX 40系列顯卡最具價值的優勢就是新增了對DLSS3的支持,因此遊戲測試環節我們選擇6款支持DLSS3,並且其中兩款還支持最新DLSS 3.5的遊戲大作來進行遊戲性能對比測試。
我們通過分別測試顯卡開啟DLSS3(RTX 40系列)、DLSS2(RTX 30系列),與關閉DLSS後的遊戲性能,來看看RTX 4070 SUPER顯卡比RTX 4070顯卡能領先多少,與RTX 4070 Ti顯卡有多少差距,DLSS3加持下的RTX 4070 SUPER能領先開啟DLSS2的RTX 3070多少。

電馭叛客2077


DLSS3.5的光線重構的功效並不僅是提升一些幀率性能,它還能優化光影效果,解決以往光追機制下出現的一些失真現象,令整體視覺效果進一步貼近現實邏輯。
下面為《電馭叛客2077》DLSS3.5光線重建開和關的畫質對比:

《電馭叛客2077》

《電馭叛客2077》

《電馭叛客2077》
《心靈殺手2》遊戲實測

心靈殺手2


下面為《心靈殺手2》DLSS3.5光線重建開和關的畫質對比:

《心靈殺手2》

《心靈殺手2》

《心靈殺手2》
通過開啟DLSS光線重建(DLSS 3.5)與關閉DLSS光線重建(DLSS 3)的畫面效果對比不難看出,在開啟光線重建之後,總體來說遊戲的圖像變得更加清晰,細節更為豐富,同時重影更少,並且在光線條件發生劇烈變化時響應更快,整體遊戲體驗變得更加逼真,代入感更強。
《戰錘40K:暗潮》遊戲實測

戰錘40K:暗潮


《瘟疫傳說:安魂曲》遊戲實測

瘟疫傳說:安魂曲

