前不久我們剛評測完索泰RTX 4070 SUPER,在這張卡上,我們也是見證了生成式AI的魅力。在遊戲和生產力上都能做到完美的平衡。今天我們繼續來看一下RTX 4070Ti SUPER會有什麼提升。
我們手中的這張顯卡是索泰RTX 4070Ti SUPER TRINITY OC月白,作為一張次旗艦定位的顯卡,外觀就極具特色,所以在了解性能之前,先來看一下外觀。
外觀:
放眼望去,索泰RTX 4070Ti SUPER TRINITY OC月白全身裝甲通過優雅的流線型曲面造型,帶來一種柔和感。在這張顯卡上幾乎看不到銳利的直角,取而代之的是空氣動力學設計的圓融柔美曲線外觀,配合雅致純粹的月白配色,給人一種清新而溫柔的視覺美感。
背面高強度合金材料一體鑄形而成的合金背板,可以增加顯卡結構厚度,保護顯卡的PCB,提升顯卡的靜電防護能力。尾部設計了獨特造型的開孔,讓風扇的氣流能夠低阻穿透鰭片和背板,實現更高效的散熱。
頂部搭載信仰LOGO燈,彩虹拱橋造型的ARGB燈帶,夢幻而優雅,支持1600萬色調節,在索泰Fire Storm中有多種燈效可供選擇。
左側不鏽鋼I/O面板區域,支持三個DP 1.4a接口和一個HDMI 2.1接口。
電源供電依舊採用的是16pin的12VHPWR,包裝盒內能找到一根雙8pin的轉接線。
散熱上,採用的是ICESTORM2.0散熱系統,加厚、加高的鍍鎳散熱鰭片模組,提升鰭片散熱面積和導熱能力,輕鬆應對散熱挑戰。三個9CM大尺寸仿生盾鱗2.0風扇,不僅扇葉面積提升,優化每一片扇葉的曲率和鱗狀仿生條紋,提升風扇風量、風壓和風流。FREEZE智能停轉功能,動靜交由AI掌握,可以在高、低溫度和負載之間讓風扇智能啟停,減少噪音,以提供更佳的使用體驗,增加風扇使用壽命。
測試環境:
性能:
從參數性能上來看,索泰RTX 4070Ti SUPER TRINITY OC月白,使用Ada Lovelace架構,核心代號AD103-275,核心工藝TSMC 4N。這張顯卡擁有8448個流處理器,光柵單元96顆,紋理單元264顆,位寬256bit、帶寬672GB/s,基礎頻率2340MHz,加速頻率2640MHz,TGP功耗285W。反觀RTX 4070 Ti 12GB,其擁有7680個流處理器,光柵單元80顆,紋理單元240顆,TGP功耗285W。與之相比,RTX 4070 Ti SUPER增加了768個CUDA核心,顯存容量增加4GB,整體規格漲幅10%,但是功耗相同更加的節能。
索泰RTX 4070Ti SUPER TRINITY OC使用的NVIDIA Ada Lovelace 架構,它涵蓋了如下創新技術:
(1)全新SM多單元流處理器可以提供高達 2 倍的性能和功耗效率。
(2)第四代張量核心(Tensor Core)能實現和加速變革性 AI技術,我們熟知的 DLSS 技術就得益於它。
(3)第三代光線追蹤核心(RT Core),有著高達 2 倍的光線追蹤性能,提供令人難以置信的細節,帶玩家前往前所未有的虛擬世界。
(4)著色器執行重新排序(SER)將光線追蹤操作提高了2倍。
(5)擁有64MB的 L2 緩存,提供更好的性能、減少內存總線流量和更高的能效。
(6)DLSS 3.5,AI 驅動圖形的革命性突破,可大幅提升性能,並通過神經渲染提升光線追蹤質量,帶來極為逼真的畫面。
(7)全新的第八代NVENC雙硬體編碼器,支持AV1,有效提升了生產力方面的表現,對於創作型用戶、遊戲主播等群體來說更是如虎添翼。
我們使用3DMark進行了幾項常規測試,並與RTX 3070 Ti來進行對比。每一項數據RTX 4070 Ti SUPER 都是碾壓的,整體數據提升了60%。僅僅是數據上就有如此大的差距,如果在遊戲中進行實測,開啟DLSS 3、Reflex等黑科技後,恐怕還會更加誇張。
我們使用Furmark進行30分鐘左右的烤機,顯卡平均溫度在66.7度,功率約285W,顯存頻率2625Mhz。
待機時,顯卡溫度26.2度,功耗13W,非常的節能。
NVIDIA的DLSS技術本質是通過深度學習算法將單幀的低解析度提升成高解析度,讓遊戲幀率獲得大幅度提升。DLSS 3在超解析度、DLAA的基礎上增加了幀生成技術:利用AI技術生成更多的幀,以進一步提高性能。當我們在遊戲中開啟DLSS 3後,遊戲渲染解析度降低,運算壓力也就變小了,AI就會智能的根據當前的圖像以及之前渲染好的圖像,自動運算構建出在高解析度下的畫面。
目前已經有超過500款遊戲和應用支持NVIDIA RTX技術,RTX遊戲玩家每周花費8700萬小時玩光追遊戲,其中97%的時間都是在玩《電馭叛客2077》.我們也期待未來有越來越多的遊戲支持這項技術。
我們在1440p 2k解析度下,在最高畫質下開啟DLSS,眾多遊戲都超過了100幀,也有接近200的。相比RTX 3070 Ti,平均漲幅高達120%。
目前DLSS已經升級到了3.5,主要是針對光追遊戲,增加了光線重建技術,這個AI模型可以進一步提升密集型光追遊戲和應用的光線追蹤圖像。光線重建將此前人工設計的圖形降噪器替換成了經過NVIDIA 超級計算器訓練的AI網路。光線重建可以從訓練數據中識別光照模式,例如全局光照或環境光遮蔽的光照模式,其最終效果比需要人工設計的降噪器更出色。
《電馭叛客2077》就是一款支持DLSS 3.5的遊戲,我們開啟和關閉光線重建來進行對比。這是一處水塘,正好反射出了一塊霓虹廣告牌,在沒有開啟DLSS3.5時,水面上非常模糊,幾乎看不清楚廣告上面的字。而開啟後,則是非常清晰,遊戲體驗拉滿。
《心靈殺手2》也支持DLSS3.5,地面上陽光照射在建築物上的倒影,通過肉眼我們能明顯的看出光線重建開關的區別。沒開時,地上的陰影就是一團黑,而開啟後建築的輪廓和邊緣能清晰的分辨。
NVIDIA Reflex技術普遍運用在FPS遊戲上,這一技術主要是同步GPU和CPU,通過刪除CPU到GPU之間的渲染隊列,優化響應速度並降低系統延遲。它包含兩項技術:一項是 Reflex 低延遲模式,用於縮短遊戲中的系統延遲,以幫助玩家提升競技表現;另一項是Reflex 分析器,用於輕鬆快速地測量系統延遲。
我們可以在FPS遊戲內將NVIDIA Reflex設置為開啟 增強,我們也是選擇了幾款熱門FPS遊戲如《Apex英雄》,《特戰英豪》進行測試。
1%low幀是將幀數進行從大到小排序,取最後1%範圍內的平均。可以發現它還是比較接近平均幀的,說明跳幀幅度很小。PC性能延遲也都小於10ms,在競技遊戲中能更好的展現水準。
索泰RTX 4070Ti SUPER TRINITY OC的TGP功耗在285W,但是不同遊戲的溫度和功耗也會不同,就像幀率一樣。在2k解析度下,各遊戲功耗大約在250W,GPU溫度也在50到55度的區間內。
除了遊戲方面,在STUDIO創作,SUPER系列也迎來了重大提升。NVIDIA STUDIO可為有110多款應用加速,索泰RTX 4070Ti SUPER TRINITY OC大將在3D渲染方面可以縮短渲染時間,DLSS功能的加入也能提升畫面幀數;支持AV1解碼器可以增加影片清晰度;還有比如超分圖片的全新生成式AI軟體的加入。
使用Blender Open Data benchmark進行測試,它會自動渲染官方支持的Blender基準測試場景,並顯示其渲染時間。他有三項測試,monster,junkshop和classroom,成績分別為3664,1759,1830個樣本每分鐘。
OctaneRender是一個公正且準確的 GPU 渲染引擎,能夠利用NVIDIA的CUDA和RTX系列GPU為創作者提供快速、高質量的渲染輸出。OctaneRender可用於所有創作3D軟體。該基準測試將測量 4 個單獨場景的渲染性能,每個場景使用 3 個不同的OctaneRender、Info Channels、Direct Lighting和Path Tracing 中的渲染選項,得分861.78。
GeForce RTX 40系列GPU使用NVIDIA NVENC為AV1影片編解碼器提供硬體加速編碼功能。AV1與H.265/H.264在相同的比特率下可以提供更好的視覺質量,在畫面質量相同的情況下使用AV1,比特率會更低,文件大小更小,影片上傳更快。除了添加AV1編碼支持外,40系列GPU還具有生成改進功能用於H.265(HEVC)編碼的NVENC。
在剪映專業版上已經支持AV1編解碼器加速。我們嘗試渲染導出了4k30幀,時長為10分鐘的影片,來對比AV1和H.264。AV1編碼導出影片的大小在1.52GB,而H.264編碼導出影片的大小則是1.98GB。
在觀看直播時也有AV1和H.264兩種編解碼器,在4k 60fps、10 Mbps體驗一下兩者的視覺質量。不難看出AV1下觀看直播,影片會高清非常多,H.264則模糊不清。
ON1 Resize A是圖片無損放大軟體軟體,搭載最先進的神經網路和領先的AI人工智慧技術以及全新的超解析度技術。原本一張6M的照片在放大後變成了30M,下圖是我們將兩張圖片放大3倍,可以直觀的圖像並沒有任何失真,色彩過渡自然,根本看不出這是經過放大過後的圖片。
D5渲染器是一款基於實時光線追蹤技術的3D渲染軟體,支持多種模型、材質和光源。它也融合了最新的 NVIDIA DLSS 3.5技術,例如DLSS光線重建以及現有的DLSS技術,例如DLSS超解析度,以及DLSS幀生成。
我們渲染了一段影片並通過開啟或關閉DLSS來觀察幀率的變化。在開啟DLSS後平均幀率翻了3倍,1%low幀與平均幀的差值也減少了。
接下來我們再來看一下開啟或者關閉光線重建畫面會有什麼樣的變化。第一張椅子腳的照片,可以看到關閉光線重建,噪點肉眼可見。第二張是桌子對窗外景色的反射,光線重建未開啟時噪點依舊非常明顯,而且畫面比較模糊。反觀兩幅圖在開啟光線重建後噪點大幅度減少了畫面也清晰了。
RTX VSR是一種AI技術用於提升影片播放質量上,在NVIDIA控制面板中,我們可以打開RTX影片增強,同時也有自動、1、2、3、4五個擋位可以調節。1是最低,4是最高。
我們觀看了一段影片從關閉到質量4五個個擋位來對比畫面質量,肉眼就能非常直觀的發現,從充滿像素顆粒到清晰。
Stable Diffusion是一個基於圖像的AI模型,使用戶能輕鬆地將文本描述轉換為複雜的視覺表現。Stable Diffusion AI模型利用GPU加速優勢,使創作者能進行快速創建和完善,以獲得理想輸出,其速度比在CPU上處理AI模型快數百倍。
在1024×1024圖像數據上訓練SDXL模型並開啟TRT加速,耗時92秒,經計算得出每分鐘6.5張圖片。
在512×512圖像數據上訓練SD1.5模型並開啟TRT加速,耗時約20秒,經計算得出每分鐘30張圖片。
不開啟TRT加速時,在1024×1024圖像數據上訓練SDXL模型則耗時208秒,每分鐘生成了2.88張圖片。相比開啟TRT,速度慢了一倍還多。
也是在不開啟TRT加速的情況下,在512×512圖像數據上訓練SD1.5模型,耗時35.5秒,經計算每分鐘生成16.9張圖片。比開啟時慢了77%。
僅在SD1.5模型下使用更高批量大小來測試TRT性能,在512×512圖像下,耗時64秒,每分鐘可生成18.75張圖片。在768×768圖像下,耗時190秒,每分鐘可生成6.3張圖片。
在SD測試上,兩種模型在開啟TRT加速後,每分鐘生成的圖片都翻了一倍。NVIDIA為RTX 4070 Ti SUPER帶來了了全新的生成式AI,將AI應用的浪潮推向了PC,也將這張顯卡的受眾拓展到了更加廣泛的領域,建模師,剪輯等等職業都非常適合。
總結:
從索泰RTX 4070Ti SUPER TRINITY OC上手給人的那一份厚重感開始,就註定了這張顯卡的不簡單。從4070Ti的12GB顯存提升到為了16GB,有著更強的數據處理能力,遊戲也會更加流暢。2k遊戲上超越100幀的表現,配合生成式AI在生產力上的巨大貢獻,或許沒有那麼讓人感覺到驚艷,但是如果告訴你它的價格與4070Ti持平,是不是性價比一下子就出來了呢。