RTX 40系列的三張SUPER系列顯卡已經全部上線了。這也是自RTX 20系列後又一次出現以SUPER結尾的顯卡。在生成式AI的加入後,遊戲與生產力都十分的出色。AI Tensor Core中擁有568 AI TOPS,以及36 SHADER TFLOPS、82 RT TFLOP。
我們也是收到了索泰RTX 4070 SUPER-12GB X-GAMING OC 歐泊白,先來看一下外觀再來看性能表現吧。
外觀:
索泰RTX 4070 SUPER-12GB X-GAMING OC 歐泊白的設計靈感來源於白歐泊石,在清新淡雅的白色基底色上採用多重特殊工藝處理,在顯卡外觀上呈現出如同歐泊變彩效應的視覺效果,充滿神秘和夢幻之感。
背面標配高強度金屬背板,輔助整卡散熱。尾部特有的開孔設計,讓風扇的氣流低阻穿透鰭片和背板。花紋繼承正面的塗鴉花紋設計,還有X-GAMING標識,彰顯這張顯卡的定位,是針對遊戲玩家,有著超越公版的性能,個性化外觀設計,性價比出色。
左側I/O面板配備了三個DP 1.4a接口和一個HDMI2.1接口。
電源供電方面使用16pin的12VHPWR,包裝盒內能找到一根雙8pin的轉接線。
全新升級的索泰FireStorm軟體,專為40系列顯卡優化打造,擁有更加直觀的GPU微調界面。還可調節燈光燈效,展現個性化。
散熱上,暗影疾風三風扇,智能FREEZE啟停功能,動靜由AI掌控,可以在高、低溫度和負載之間讓風扇智能啟停,減少噪音,獲得更佳的使用體驗,增加風扇使用壽命。
全新升級的高效能冰芯散熱系統,搭載靜音三風扇、大面積冰鏡導熱底座、冰脈2.0熱管、全覆蓋高密度鍍鎳鰭片,對流穿透散熱設計,能夠大大提升顯卡散熱效能,釋放核心全部潛能。鏡面拋光工藝底座,精密焊接打造的底座、熱管、鰭片渾然一體導熱模組,能夠更快速、均勻的導出GPU熱量,大大提升導熱效率。增加熱管壁厚度和內壁脈絡狀導液溝槽,升級更高導係數的導熱介質,加大冷凝液與熱管內壁接觸面積,加快冷凝液導熱循環。
測試環境:
性能:
從參數上來看,索泰RTX 4070 SUPER-12GB X-GAMING OC歐泊白顯卡擁有7168個流處理器、光柵單元80顆、紋理單元224顆,192bit顯存位寬,2505MHz的加速頻率,TGP功耗220W。反觀RTX 4070 12GB,其擁有5888個流處理器,光柵單元64顆,紋理單元184顆,TGP功耗200W。與之相比,RTX 4070 SUPER增加了1280個CUDA核心,功耗上漲了20W,整體規格漲幅21.7%。
索泰RTX 4070 SUPER 12GB使用的NVIDIA Ada Lovelace 架構,它涵蓋了如下創新技術:
(1)全新SM多單元流處理器可以提供高達 2 倍的性能和功耗效率。
(2)第四代張量核心(Tensor Core)能實現和加速變革性 AI技術,我們熟知的 DLSS 技術就得益於它。
(3)第三代光線追蹤核心(RT Core),有著高達 2 倍的光線追蹤性能,提供令人難以置信的細節,帶玩家前往前所未有的虛擬世界。
(4)著色器執行重新排序(SER)將光線追蹤操作提高了2倍。
(5)擁有64MB的 L2 緩存,提供更好的性能、減少內存總線流量和更高的能效。
(6)DLSS 3.5,AI 驅動圖形的革命性突破,可大幅提升性能,並通過神經渲染提升光線追蹤質量,帶來極為逼真的畫面。
(7)全新的第八代NVENC雙硬體編碼器,支持AV1,有效提升了生產力方面的表現,對於創作型用戶、遊戲主播等群體來說更是如虎添翼。
我們使用3DMark進行了幾項常規測試,並與RTX 3070來進行對比。
在與RTX 3070的對比中,不難發現每一項測試索泰RTX 4070 SUPER 12GB都碾壓,在整體數據上,平均提升有40%。僅僅是數據上就有如此大的差距,如果在遊戲中進行實測,開啟DLSS 3等黑科技後,恐怕要甩開3070好幾條街。
我們使用Furmark進行十五分鐘左右的烤機,顯卡平均溫度在61度,功率保持在220W。又強大又節能。
待機時,顯卡溫度28度,功耗12W.
NVIDIA的DLSS技術本質是通過深度學習算法將單幀的低解析度提升成高解析度,讓遊戲幀率獲得大幅度提升。DLSS 3在超解析度、DLAA的基礎上增加了幀生成技術:利用AI技術生成更多的幀,以進一步提高性能。當我們在遊戲中開啟DLSS 3後,遊戲渲染解析度降低,運算壓力也就變小了,AI就會智能的根據當前的圖像以及之前渲染好的圖像,自動運算構建出在高解析度下的畫面。
目前已經有超過500款遊戲和應用支持DLSS和AI驅動技術,RTX遊戲玩家每周花費8700萬小時玩光追遊戲,其中97%的時間都是在玩《電馭叛客2077》.我們也期待未來有越來越多的遊戲支持這項技術。
我們挑選了一些遊戲在1440p2K解析度下進行測試,即使是在最高畫質下,也有眾多遊戲超過了超過了100幀。在開啟DLSS3後與RTX 3070相比,索泰RTX 4070 SUPER 12GB漲幅翻了一倍,有些遊戲甚至更多。
目前DLSS已經升級到了3.5,主要是針對光追遊戲,增加了光線重建技術,這個AI模型可以進一步提升密集型光追遊戲和應用的光線追蹤圖像。光線重建將此前人工設計的圖形降噪器替換成了經過NVIDIA超級計算器訓練的AI網路。光線重建可以從訓練數據中識別光照模式,例如全局光照或環境光遮蔽的光照模式,其最終效果比需要人工設計的降噪器更出色。
《電馭叛客2077》就是一款支持DLSS 3.5的遊戲,我們開啟和關閉光線重建來進行對比。這是一處水塘,正好反射出了一塊霓虹廣告牌,在沒有開啟DLSS3.5時,水面上非常模糊,幾乎看不清楚廣告上面的字。而開啟後,則是非常清晰,遊戲體驗拉滿。
《心靈殺手2》也支持DLSS3.5,地面上陽光照射在建築物上的倒影,通過肉眼我們能明顯的看出光線重建開關的區別。沒開時,地上的陰影就是一團黑,而開啟後建築的輪廓和邊緣能清晰的分辨。
NVIDIA Reflex技術普遍運用在FPS遊戲上,這一技術主要是同步GPU和CPU,通過刪除CPU到GPU之間的渲染隊列,優化響應速度並降低系統延遲。它包含兩項技術:一項是Reflex低延遲模式,用於縮短遊戲中的系統延遲,以幫助玩家提升競技表現;另一項是Reflex分析器,用於輕鬆快速地測量系統延遲。
我們可以在FPS遊戲內將NVIDIA Reflex設置為開啟 增強,我們也是選擇了幾款熱門FPS遊戲如《APEX》,《特戰英豪》進行測試。
1%low幀是將幀數進行從大到小排序,取最後1%範圍內的平均。可以發現在這張顯卡上1%low幀還是比較接近平均幀的,說明跳幀幅度很小。PC性能延遲也都都在20ms左右,在競技遊戲中能更好的展現水準。
除了遊戲方面,在STUDIO創作,SUPER系列也迎來了重大提升。NVIDIA STUDIO可為有110多款應用加速,RTX 4070 SUPER在3D渲染方面可以縮短渲染時間,DLSS功能的加入也能提升畫面幀數;影片剪輯導出的時間也會大幅縮短;還有醫學比如超分圖片的全新生成式AI軟體的加入。
使用Blender Open Data benchmark進行測試,它會自動渲染官方支持的Blender基準測試場景,並顯示其渲染時間。他有三項測試,monster,junkshop和classroom,成績分別為3159,1520,1590個樣本每分鐘。
OctaneRender是一個公正且準確的GPU渲染引擎,能夠利用NVIDIA的CUDA和RTX系列GPU為創作者提供快速、高質量的渲染輸出。OctaneRender可用於所有創作3D軟體。該基準測試將測量4個單獨場景的渲染性能,每個場景使用3個不同的OctaneRender、Info Channels、Direct Lighting和Path Tracing中的渲染選項。
GeForce RTX 40系列GPU使用NVIDIA NVENC為AV1影片編解碼器提供硬體加速編碼功能。AV1與H.265/H.264在相同的比特率下可以提供更好的視覺質量,在畫面質量相同的情況下使用AV1,比特率會更低,文件大小更小,影片上傳更快。除了添加AV1編碼支持外,40系列GPU還具有生成改進功能用於H.265(HEVC)編碼的NVENC。
在剪映專業版上已經支持AV1編解碼器加速。我們嘗試渲染導出了4k30幀,時長為10分鐘的影片,來對比AV1和H.264。AV1編碼導出影片的大小在1.52GB,而H.264編碼導出影片的大小則是1.98GB。
在觀看直播時也有AV1和H.264兩種編解碼器,在4k 60fps、10 Mbps體驗一下兩者的視覺質量。不難看出AV1下觀看直播,影片會高清非常多,H.264則模糊不清。
ON1 Resize A是圖片無損放大軟體軟體,搭載最先進的神經網路和領先的AI人工智慧技術以及全新的超解析度技術。原本一張6M的照片在放大後變成了30M,下圖是我們將兩張圖片放大3倍,可以直觀的圖像並沒有任何失真,色彩過渡自然,根本看不出這是經過放大過後的圖片。
D5渲染器是一款基於實時光線追蹤技術的3D渲染軟體,支持多種模型、材質和光源。它也融合了最新的 NVIDIA DLSS 3.5技術,例如DLSS光線重建以及現有的DLSS技術,例如DLSS超解析度,以及DLSS幀生成。
我們渲染了一段影片並通過開啟或關閉DLSS來觀察幀率的變化。在開啟DLSS後平均幀率翻了3倍,1%low幀與平均幀的差值也減少了。
接下來我們再來看一下開啟或者關閉光線重建畫面會有什麼樣的變化。第一張椅子腳的照片,可以看到關閉光線重建,噪點肉眼可見。第二張是桌子對窗外景色的反射,光線重建未開啟時噪點依舊非常明顯,而且畫面比較模糊。反觀兩幅圖在開啟光線重建後噪點大幅度減少了畫面也清晰了。
RTX VSR是一種AI技術用於提升影片播放質量上,在NVIDIA控制面板中,我們可以打開RTX影片增強,同時也有自動、1、2、3、4五個擋位可以調節。1是最低,4是最高。
我們也是觀看了一段影片,開啟RTX VSR後畫面的變化還是比較明顯的,清晰度有了質的變化。
Stable Diffusion是一個基於圖像的AI模型,使用戶能輕鬆地將文本描述轉換為複雜的視覺表現。Stable Diffusion AI模型利用GPU加速優勢,使創作者能進行快速創建和完善,以獲得理想輸出,其速度比在CPU上處理AI模型快數百倍。
在1024×1024圖像數據上運行SDXL模型並開啟TRT加速,耗時119秒,經計算得出每分鐘5張圖片。關閉TRT加速,耗時246秒,每分鐘2.43張圖片。
在512×512圖像數據上運行SD1.5模型並開啟TRT加速,耗時約23秒,經計算得出每分鐘26張圖片。關閉TRT加速後,耗時43秒,每分鐘13.6張圖片。慢了將近一倍的時間。
僅在SD1.5模型下使用更高批量大小來測試TRT性能,在512×512圖像下,耗時80秒,每分鐘可生成12張圖片。在768×768圖像下,耗時253秒,每分鐘可生成4.7張圖片。
在SD測試上,我們在使用和關閉TensorRT加速時進行對比,無論是1024×1024還是512×512大小的照片,每分鐘生成的照片都翻了一倍。NVIDIA為RTX 4070 SUPER帶來了全新的生成式AI,將AI應用的浪潮推向了PC,也將這張顯卡的受眾拓展到了更加廣泛的領域,建模師,剪輯等等職業都非常適合。
AI作圖最近十分風靡,為推動AI在藝術與設計領域的發展,索泰與國內頭部AI藝術模型分享社區和在線運行平台吐司tusiart.com聯合發起「索泰顯卡AI創作大賽」。參賽者將使用吐司tusiart提供的在線AI運行平台,創作新的索泰品牌形象代言人「阿索」模型,以及根據索泰IP形象「天啟姬」和「莉達」進行創意繪圖,雙賽道進行創作,索泰給各位創作者準備了豐富的顯卡大禮,以助力他們在創意旅程上加速前進。
活動參與鏈接:在瀏覽器中打開:https://tusiart.com/blackboard/zotac
想要玩AI生圖,卻沒有付諸行動的小夥伴,無非就是被顯卡硬體門檻和AI生圖的學習門檻所勸退,但現在有個一石二鳥的活動等你來!可能一不小心就贏了張索泰RTX 4080 SUPER顯卡回家哦!
吐司tusiart創作平台的界面簡潔易上手,選好喜歡的模型風格,輸入提示詞,然後等待出圖即可,可以文生圖、圖生圖和文生動圖,不需要安裝和配置任何程序,簡直伸手黨福音。
吐司tusiart還支持最近很熱門的工作流模式,還能幫你解析圖片提示詞,方便你更可控地根據圖片生圖,無論初級用戶還是進階用戶都能在這裡找到適合自己的AI創作模式,更多功能還是等大家自己探索吧。最後對「索泰IP形象AI創作大賽」感興趣的小夥伴趕緊行動起來吧。
總結:
索泰RTX 4070 SUPER-12GB X-GAMING OC歐泊白是一張非常平衡的顯卡,性能超越了3090,在開啟DLSS後遊戲幀數更是3090的1.5倍,在DLSS的加持下,輕鬆應對2K遊戲需求,4K也足夠暢玩。用作生產力工具也能大大縮短渲染和導出時間,真的是性價比超高。