影馳RTX 4070 Ti SUPER大將評測：生成式AI實現性能大飛躍

這周輪到RTX 4070 Ti SUPER 解禁發布了，說實話又是Ti，又是SUPER結尾，確實有點拗口和複雜。在上周的70S上我們看到了AI在SUPER系列上的強力作用。4070 Ti SUPER的AI Tensor Core中有著706 AI TOPS，以及高達44 SHADER TFLOPS、102 RT TFLOP比70S增加了138 AI TOPS，8 SHADER TFLOPS和20 RT TFLOP。

贊助商廣告

今天我們就來了解一下在AI助力下的影馳RTX 4070 Ti SUPER 大將究竟如何，在看性能之前，還是先來看一下大將的外觀。

外觀：

影馳RTX 4070 Ti SUPER 大將覆蓋黑色裝甲配合表面不規則突起的線條花紋猶如隱藏在黑夜中的將軍，彰顯霸氣。三風扇設計，帶來更好的散熱。

背面金屬背板上左邊印有GALAX和GeForce RTX字樣給人一種大氣之感，白色的噴塗在藍色底座上格外顯眼。右側大面積開孔，可以配合散熱，同時也用白色進行描邊，富含設計意味，也能把目光吸引在中間的散熱模組上。

贊助商廣告

側邊不鏽鋼I/O面板三個DP 1.4接口，一個HDMI2.1接口。

頂部GALAX字體在通電後會亮起，全面升級的ARGB燈效支持燈效同步會和主機板、記憶體條燈交相輝映。電源接口採用12VHPWR，包裝內可以找到一更雙8pin轉接線。

測試環境：

贊助商廣告

性能：

從參數性能上來看，影馳RTX 4070 Ti SUPER 大將，使用Ada Lovelace架構，核心代號AD103-275，核心工藝TSMC 4N，8448個流處理器，光柵單元96顆，紋理單元264顆，位寬256bit、頻寬672GB/s，基礎頻率2340MHz，加速頻率2640MHz，TGP功耗285W。相比RTX 4070 Ti 12GB，7680個流處理器，光柵單元80顆，紋理單元240顆，TGP功耗285W。RTX 4070 Ti SUPER增加了768個CUDA核心，顯示記憶體容量增加4GB，整體規格漲幅10%，但是功耗相同更加的節能。

影馳RTX 4070 Ti SUPER 大將使用的NVIDIA Ada Lovelace 架構，它涵蓋了如下創新技術：

（1）全新流式單元處理器（SM）可以提供高達 2 倍的性能和功耗效率。

（2）第四代張量核心（Tensor Core）能實現和加速變革性 AI技術，我們熟知的 DLSS 3的幀生成技術就得益於它。

贊助商廣告

（3）第三代光線追蹤核心（RT Core），有著高達 2 倍的光線追蹤性能，提供令人難以置信的細節，帶玩家前往前所未有的虛擬世界。

（4）著色器執行重新排序（SER）將光線追蹤操作提高了2倍。

（5）擁有48MB的 L2 緩存，提供更好的性能、減少記憶體總線流量和更高的能效。

（6）DLSS 3.5，AI 驅動圖形的革命性突破，可大幅提升性能，並通過神經渲染提升光線追蹤質量，帶來極為逼真的畫面。

（7）全新的第八代NVENC雙硬體編碼器，支持AV1，有效提升了生產力方面的表現，對於創作型用戶、遊戲主播等群體來說更是如虎添翼。

我們使用3DMark進行了幾項常規測試，並與RTX 3070 Ti來進行對比。每一項數據RTX 4070 Ti SUPER 都是碾壓的，整體數據提升了60%。僅僅是數據上就有如此大的差距，如果在遊戲中進行實測，開啟DLSS 3、Reflex等黑科技後，恐怕還會更加誇張。

贊助商廣告

我們使用Furmark進行十五分鐘左右的烤機，顯卡平均溫度在61.2度，功率約285W，顯示記憶體頻率2625Mhz。

散熱上，全新星烽散熱器，異形構造的外觀造型，多維度散熱體系，晶片、顯示記憶體、供電全覆蓋散熱，配合8根6mm複合熱管，能有效降低核心溫度。緻密的鰭片設計結合回流焊接工藝，金屬背板的尾端大開孔透氣設計，帶來了更強的散熱性能。三個92mm特製靜霜風扇支持智能啟停。

待機時，下那塊溫度26.2度，功耗13W，非常的節能。

NVIDIA的DLSS技術本質是通過深度學習算法將單幀的低解析度提升成高解析度，讓遊戲幀率獲得大幅度提升。DLSS 3在超解析度、DLAA的基礎上增加了幀生成技術：利用AI技術生成更多的幀，以進一步提高性能。當我們在遊戲中開啟DLSS 3後，遊戲渲染解析度降低，運算壓力也就變小了，AI就會智能的根據當前的圖像以及之前渲染好的圖像，自動運算構建出在高解析度下的畫面。

贊助商廣告

目前已經有超過500款遊戲和應用支持NVIDIA RTX技術，RTX遊戲玩家每周花費8700萬小時玩光追遊戲，其中97%的時間都是在玩《電馭叛客2077》.我們也期待未來有越來越多的遊戲支持這項技術。

我們在1440p 2k解析度下，在最高畫質下開啟DLSS，眾多遊戲都超過了100幀，也有接近200的。相比RTX 3070 Ti，平均漲幅高達120%。

目前DLSS已經升級到了3.5，主要是針對光追遊戲，增加了光線重建技術，這個AI模型可以進一步提升密集型光追遊戲和應用的光線追蹤圖像。光線重建將此前人工設計的圖形降噪器替換成了經過NVIDIA 超級計算器訓練的AI網路。光線重建可以從訓練數據中識別光照模式，例如全局光照或環境光遮蔽的光照模式，其最終效果比需要人工設計的降噪器更出色。

《電馭叛客2077》就是一款支持DLSS 3.5的遊戲，我們開啟和關閉光線重建來進行對比。這是一處水塘，正好反射出了一塊霓虹廣告牌，在沒有開啟DLSS3.5時，水面上非常模糊，幾乎看不清楚廣告上面的字。而開啟後，則是非常清晰，遊戲體驗拉滿。

贊助商廣告

《心靈殺手2》也支持DLSS3.5，地面上陽光照射在建築物上的倒影，通過肉眼我們能明顯的看出光線重建開關的區別。沒開時，地上的陰影就是一團黑，而開啟後建築的輪廓和邊緣能清晰的分辨。

NVIDIA Reflex技術普遍運用在FPS遊戲上，這一技術主要是同步GPU和CPU，通過刪除CPU到GPU之間的渲染隊列，優化響應速度並降低系統延遲。它包含兩項技術：一項是 Reflex 低延遲模式，用於縮短遊戲中的系統延遲，以幫助玩家提升競技表現；另一項是Reflex 分析器，用於輕鬆快速地測量系統延遲。

我們可以在FPS遊戲內將NVIDIA Reflex設置為開啟+增強，我們也是選擇了幾款熱門FPS遊戲如《Apex英雄》,《特戰英豪》進行測試。

贊助商廣告

1%low幀是將幀數進行從大到小排序，取最後1%範圍內的平均。可以發現它還是比較接近平均幀的，說明跳幀幅度很小。PC性能延遲也都小於10ms，在競技遊戲中能更好的展現水準。

影馳GeForce RTX 4070 Ti SUPER大將的TGP功耗在285W，但是不同遊戲的溫度和功耗也會不同，就像幀率一樣。在2k解析度下，各遊戲功耗大約在250W，GPU溫度也在50到55度的區間內。

除了遊戲方面，在STUDIO創作，SUPER系列也迎來了重大提升。NVIDIA STUDIO可為有110多款應用加速，影馳GeForce RTX 4070 Ti SUPER大將在3D渲染方面可以縮短渲染時間，DLSS功能的加入也能提升畫面幀數；支持AV1解碼器可以增加影片清晰度；還有比如超分圖片的全新生成式AI軟體的加入。

使用Blender Open Data benchmark進行測試，它會自動渲染官方支持的Blender基準測試場景，並顯示其渲染時間。他有三項測試，monster，junkshop和classroom，成績分別為3664，1759，1830個樣本每分鐘。

OctaneRender是一個公正且準確的 GPU 渲染引擎，能夠利用NVIDIA的CUDA和RTX系列GPU為創作者提供快速、高質量的渲染輸出。OctaneRender可用於所有創作3D軟體。該基準測試將測量 4 個單獨場景的渲染性能，每個場景使用 3 個不同的OctaneRender、Info Channels、Direct Lighting和Path Tracing 中的渲染選項，得分861.78。

贊助商廣告

GeForce RTX 40系列GPU使用第八代NVENC為AV1影片編碼器提供硬體加速編碼功能。AV1與H.265/H.264在相同的比特率下可以提供更好的視覺質量，在畫面質量相同的情況下使用AV1，比特率會更低，文件大小更小，影片上傳更快。除了添加AV1編碼支持外，40系列GPU還具有生成改進功能用於H.265（HEVC）編碼的NVENC。

在達芬奇18.6版本上就可以選擇AV1作為編解碼器。我們嘗試渲染導出了8k30幀和4k30幀，時長為44秒的影片，來對比AV1和H.265兩個編碼器的速度和圖像質量。兩者導出速度相差並不大。

在4K30FPS的影片下將兩個畫面進行對比，可以比較明顯的看出H.265在細節和暗部會比較模糊，尤其是背後的房間。

在觀看直播時也有AV1和H.264兩種編解碼器，在4k 60fps、10 Mbps體驗一下兩者的視覺質量。不難看出AV1下觀看直播，影片會高清非常多，H.264則模糊不清。

贊助商廣告

ON1 Resize A是圖片無損放大軟體軟體，搭載最先進的神經網路和領先的AI人工智慧技術以及全新的超解析度技術。原本一張6M的照片在放大後變成了30M，下圖是我們將兩張圖片放大3倍，可以直觀的圖像並沒有任何失真，色彩過渡自然，根本看不出這是經過放大過後的圖片。

D5渲染器是一款基於實時光線追蹤技術的3D渲染軟體，支持多種模型、材質和光源。它也融合了最新的 NVIDIA DLSS 3.5技術，例如DLSS光線重建以及現有的DLSS技術，例如DLSS超解析度，以及DLSS幀生成。

我們渲染了一段影片並通過開啟或關閉DLSS來觀察幀率的變化。在開啟DLSS後平均幀率翻了3倍，1%low幀與平均幀的差值也減少了。

接下來我們再來看一下開啟或者關閉光線重建畫面會有什麼樣的變化。第一張椅子腳的照片，可以看到關閉光線重建，噪點肉眼可見。第二張是桌子對窗外景色的反射，光線重建未開啟時噪點依舊非常明顯，而且畫面比較模糊。反觀兩幅圖在開啟光線重建後噪點大幅度減少了畫面也清晰了。

贊助商廣告

RTX VSR是一種AI技術用於提升影片播放質量上，在NVIDIA控制面板中，我們可以打開RTX影片增強，同時也有1、2、3、4四個擋位可以調節。1是最低，4是最高。

我們觀看了一段影片從關閉，質量1，質量3，三個擋位來對比畫面質量，肉眼就能非常直觀的發現，從充滿像素顆粒到清晰。

贊助商廣告

Stable Diffusion是一個基於圖像的AI模型，使用戶能輕鬆地將文本描述轉換為複雜的視覺表現。Stable Diffusion AI模型利用GPU加速優勢，使創作者能進行快速創建和完善，以獲得理想輸出，其速度比在CPU上處理AI模型快數百倍。

在1024×1024圖像數據上訓練SDXL模型並開啟TRT加速，耗時92秒，經計算得出每分鐘6.5張圖片。

在512×512圖像數據上訓練SD1.5模型並開啟TRT加速，耗時約20秒，經計算得出每分鐘30張圖片。

不開啟TRT加速時，在1024×1024圖像數據上訓練SDXL模型則耗時208秒，每分鐘生成了2.88張圖片。相比開啟TRT，速度慢了一倍還多。

贊助商廣告

也是在不開啟TRT加速的情況下，在512×512圖像數據上訓練SD1.5模型，耗時35.5秒，經計算每分鐘生成16.9張圖片。比開啟時慢了77%。

僅在SD1.5模型下使用更高批量大小來測試TRT性能，在512×512圖像下，耗時64秒，每分鐘可生成18.75張圖片。在768×768圖像下，耗時190秒，每分鐘可生成6.3張圖片。

贊助商廣告

在SD測試上，兩種模型在開啟TRT加速後，每分鐘生成的圖片都翻了一倍。NVIDIA為RTX 4070 Ti SUPER帶來了了全新的生成式AI，將AI應用的浪潮推向了PC，也將這張顯示卡的受眾拓展到了更加廣泛的領域，建模師，剪輯等等職業都非常適合。

總結：

現在的顯卡已經跳脫出了「遊戲」這一刻板印象，在生產力和創作上也能做出卓越貢獻。影馳RTX 4070 Ti SUPER 大將在一上手時就感覺用料非常紮實，因為確實很重，後面不管是遊戲測試還是生產力測試都表現出了不錯的成績，而且功耗也是相當的低。對於遊戲發燒友、影片剪輯、藝術創作者這部分人群還是相當合適的。最後是大家最關心的價格問題：加量不加價，完全是與RTX 4070 Ti持平的價格，突出一個高性價比。