不知不覺,英偉達的RTX 40系顯卡已經推出超過半年的時間,在這半年內,英偉達憑藉像GeForce RTX 4090這樣的旗艦顯卡牢牢占據了高端顯卡市場,可以說幾乎無敵手,同時更是憑藉DLSS 3等新一代特效讓顯卡面對光線追蹤也絲毫不怵。不過之前發布的顯卡都是面向高端以及旗艦消費群體,而對於偏向主流的消費群體,他們的預算似乎不能滿足GeForce RTX 4090這樣的顯卡,因此像RTX 4070這樣的主流偏上的顯卡便是為他們所打造,實現2K光追遊戲超過100幀速率遊玩的願望。
這半年以來,除了像遊戲場景之外,AIGC的火爆程度遠超人們的想像,而利用GPU強大的算力實現AIGC成為了新用途,自然基於最新架構的RTX 4070顯卡在AI創作上也更加出色,比如說AI創作性能能夠比RTX 3070 Ti提升大約40%的幅度,將會成為創作者手中的一張神卡。那麼這塊顯卡的實際表現究竟如何呢?我們一起來看下。
架構說明
對於RTX 40系顯卡來說,想要滿足包括AI創作以及DLSS 3等特效的實現,就不得不說Ada Lovelace架構,而這也是RTX 40系顯卡的核心所在。相比較目前的安培架構Ada Lovelace架構在性能上有著巨大的飛躍,比如說流式多處理器的著色能力高達83TFLOPS,吞吐量是上代的2倍,第三代RT Cores 的有效光線追蹤計算能力最高可以達到191TFLOPS,是上代的2.8倍,第四代 Tensor Cores則新增了FP8張量引擎,張量計算達到了1.32PTLOPs,和上一代相比更是提升了整整五倍。也正是因為有了如此強大的算力,無論是遊戲玩家還是創作者都可以藉助RTX 40系顯卡實現更加高效的創作效率。
硬體光流加速器
今年RTX 40系顯卡最大的特點就是採用了全新的DLSS 3技術,能夠有效地提升遊戲在開啟光追等重壓環境下的幀率表現。
硬體光流加速器的原理就是提取其中的圖像光流資訊,同時參考遊戲引擎中的運動矢量資訊藉助AI生成新的中間幀,藉助插幀以及超解析度,讓RTX 40系顯卡只要傳統1/8的渲染量即可實現幾乎相同的畫面輸出。目前DLSS 3僅為RTX 40系顯卡所獨享,同時也是RTX 40系顯卡的一項殺手鐧。
在顯卡規格上,NVIDIA GeForce RTX 4070顯卡搭載的是AD104-250核心,擁有5888顆流處理器,36MB的L2高速緩存容量,184個TMUS,64個ROPS以及46個光追單元,除此之外NVIDIA GeForce RTX 4070顯卡的基準頻率為1920MHz,Boost頻率為2475MHz,而FP32單精度算力為29TFLOPS。
顯存上採用的是GDDR6X顯存,顯存容量為12GB,192bit的顯存位寬,顯存速率為21Gbps,總共擁有504GB/s顯存位寬,另外官方給這款顯卡的TDP為200W,當然實際測試的功耗有高有低。
外觀
我們這一次拿到的是英偉達NVIDIA GeForce RTX 4070 Founders Edition也就是大家所稱的公版顯卡。
毫無疑問在見慣了NVIDIA GeForce RTX 4090 Founders Edition這樣的龐然大物之後,NVIDIA GeForce RTX 4070 Founders Edition顯然小巧了很多,而且卡槽也變成了傳統的雙槽顯卡,這對於使用ITX機箱的消費者來說顯然是一個天大的好消息。
除此之外,NVIDIA GeForce RTX 4070 Founders Edition也和上一代的RTX 3070公版顯卡相差不大,在供電上繼續採用12 4Pin的接口,當然相比較之前的80和90,官方給的轉接線為雙8Pin轉12 4Pin,而RTX 4080、RTX 4090等顯卡則是三8Pin轉12 4Pin。
而顯卡的擴展接口基本上算是標準接口,包括一個HDMI 2.1以及3個DP 1.4接口,基本能夠滿足發燒友的使用。應該來說相比較RTX 4080以及RTX 4090,NVIDIA GeForce RTX 4070 Founders Edition的外觀還是跟RTX 30系公版顯卡差不多,沒有那種太過於驚艷的感覺,算是中規中矩吧。
測試平台
測試平台跟以前也大差不差,我們選擇Intel Core i9-1900K處理器作為這一次測試的CPU,此外主板採用了ROG的Z790 Hero主板,內存則是科賦DDR5 6200內存,總容量達到了32GB,除此之外,我們也選用了WD_BLACK SN850X PCIe 4.0 SSD,事實上這套系統應對RTX 4090也是綽綽有餘,更不用說RTX 4070顯卡。本次測試基於微軟Windows 11 22H2系統,採用的是Game Ready 531.42測試版驅動,未來顯卡的性能將會隨著驅動的完善而有所提升。
性能測試
理論性能
首先自然是理論測試,而理論測試的首選軟體當然是最為著名的3DMark,包括藉助FireStrike、TimeSpy以及Royal Port分別測試顯卡在DX11、DX12以及光追性能,而與NVIDIA GeForce RTX 4070 Founders Edition做對比的則是NVIDIA GeForce RTX 3070 Ti顯卡。
通過3DMark的測試可以看到,在傳統的光珊化測試中,NVIDIA GeForce RTX 4070 Founders Edition顯卡的理論性能比NVIDIA GeForce RTX 3070 Ti高出15%左右,似乎不是很高,事實上從FP32便可以看出,NVIDIA GeForce RTX 4070 Founders Edition的光柵化成績提升不是很明顯。而光追測試中,NVIDIA GeForce RTX 4070 Founders Edition顯卡的領先幅度可以達到25%。
實際遊戲測試
DLSS 3測試
當然如今的光追特效越來越擬真,對於顯卡要求也越來越高,對此像英偉達這樣的廠商便推出了DLSS等特效,藉助AI來協助顯卡在遊戲中取得更高的性能表現。當然經過不斷的疊代發展,目前的DLSS已經相當地成熟,並且幾乎所有主流的遊戲都會支持DLSS特效,同時RTX 4070顯卡藉助Ada架構還可以支持DLSS 3。那麼RTX 4070顯卡藉助DLSS,能夠在遊戲中取得多少的性能表現呢?
在基於DLSS的測試中,由於除了FP32單精度性能之外,更加重要的便是Tensor Core的性能,自然在遊戲表現中能夠取得更加出色的成績。而我們也可以看到支持DLSS 3的RTX 4070在遊戲表現中顯然要比RTX 3070 Ti更加出色,部分遊戲的領先幅度也更大。
光柵化遊戲測試
除了光追遊戲之外,傳統的光柵化遊戲仍然占據主流,當然相比較光追遊戲,光柵化遊戲的性能基本上就是考察FP32的性能。可以看到在光柵化遊戲中,NVIDIA GeForce RTX 4070 Founders Edition顯卡的性能實際上跟3DMark的測試差不多,與RTX 3070 Ti之間的性能相差幅度也就在10-15%上下,而《荒野大鏢客2:救贖》的領先幅度更是不到10%。
溫度和功耗
除了遊戲性能更加出色之外,Ada架構帶來的優勢還在於驚艷的能效,也就是說在提供更加出色的圖形性能之外,在溫度和能耗上的表現也更加地出色。我們自然也測試了在不同條件下的溫度能耗的表現,通過FrameView進行記錄。
通過對於3DMark以及《電馭叛客 2077》的性能測試可以看到,NVIDIA GeForce RTX 4070 Founders Edition顯卡的領先幅度可以說相當地巨大,功耗領先幅度在80W左右,而溫度也可以領先8攝氏度,顯然這跟高能效比的核心有很大的關係,除此之外,廠商對於散熱器散熱性能的冗餘也導致實際溫度表現比預期的更加出色。
生產力測試
如果說2K遊戲只是這塊顯卡的一部分的話,那麼從去年年底開始爆火的AIGC則組成了NVIDIA GeForce RTX 4070 Founders Edition顯卡的另一部分,如果說過去的生產力僅僅指的是傳統的利用GPU算力從事的影片渲染等任務,那麼新一代的生產力就應該是藉助AI來協助用戶創造更大的工作價值。因此目前越來越多的AIGC創作軟體營運而生,從而讓英偉達的AI性能有的放矢。其中包括Stable Diffusion、RTX影片超解析度等應用場景。
Stable Diffusion
Stable Diffusion是一款非常受歡迎的開源圖像生成模型,可以藉助擴散模型生成海量的圖片,極大地減輕了畫家的作圖時間,從而提升效率。當然早期的AI作圖還相當地稚嫩,出現大量不符合構造的圖片,不過如今隨著模型的不斷優化,AI作圖也日漸成熟,從而製造出符合大家審美需求的圖片,而Stable Diffusion模型目前基本上僅支持CUDA,因為也成為了英偉達顯卡的專屬。
在這裡我選擇了Stable Diffusion GRisk GUI進行測試,事實上想要實現AI畫圖也不是一件難事。比如說你需要增加眾多的特徵參數,來讓你的圖片滿足你的需求。而這也是目前比較火熱的一個職業,參數指定師。當設定了海量的參數之後,按下Render,隨後圖片就開始生成。
可以看到的是在AI合成圖片的過程中,GPU基本上都是處於100%的狀態,此外得益於出色的AI性能,實際上RTX4070隻要10餘秒便可以作出一副完整的圖片,以滿足你的需求,對於繪畫一竅不通的用戶來說,藉助Stable Diffusion模型打造的繪畫圖軟體無疑是一種超級神器。
RTX影片超解析度
我們在看影片的時候,尤其是在線影片,經常會出現畫面不清晰的時候,特別是片源清晰度過低,導致用戶的觀影體驗受到極大的影響,過去消費者面對這種方法顯然束手無策,不過現在用戶可以藉助顯卡實現畫面的優化,從而提升你的觀影體驗。比如說英偉達在RTX顯卡上實裝了RTX影片增強。
在安裝了最新的驅動之後,你可以在英偉達的影片設置中找到RTX影片增強,可以選擇超解析度,從而讓顯卡實現影片的清晰化,其中4檔的效果最為出色。
如果你開啟了超分特效之後,通過Chrome收看Youtube、bilibili等主流影片網站的影片,那麼英偉達的顯卡就會自動運算,通過超分來讓影片更加清晰,從而讓影片顯示更多的細節,當然打開超分之後,顯卡的負載也一下子達到了50%左右。
通過對比可以看到,在開啟RTX影片增強之後,F1賽車的畫面更加地平滑,鋸齒也得到了有效地緩解,字體也更加清晰,只是這種畫面上的區別基本上需要通過暫停畫面才可以直觀地感受到,對於收看直播尤其是體育類直播的觀眾來說,RTX影片增強只能稱得上是錦上添花。
除了在線影片網站之外,你也可以通過本地影片播放軟體來使用RTX影片增強功能,比如說最新版本的VLC軟體就可以支持RTX影片增強,當然與影片在線播放相差不大,影片的畫面表現略有提升,代價就是需要花費30-50%左右的GPU資源。
AV1影片編碼
目前直播的解析度越來越高,傳統的H265編碼已經不能滿足日益龐大的數據傳輸,此時AV1編碼應運而生,逐漸開始被主流的影像製作工作室所接受。相比較H265,AV1編碼能夠保持畫面幾乎不變的情況下,讓影片的碼率有所下降,同時大幅減少影片的體積。目前在達芬奇18等主流影片製作軟體中均已增加了對於AV1編碼的支持。
不過對於國內用戶來說,目前大紅大紫的剪映也實現對於AV1影片編碼的支持,對於剪輯小白來說也更加友好。
我們也使用剪映輸出一段4K影片,根據剪映預估的大小,基於AV1編碼下的影片體積為385M,而基於H264下的影片體積為513M。當然兩個影片實際文件大小均有所提升。通過實際文件對比,AV1下的編碼體積大約是H264的77%,實際畫面也沒有幾乎沒有什麼損失,對於減少影片大小還是很有用的。
總結
毫無疑問作為一款承上啟下的中高端顯卡,NVIDIA GeForce RTX 4070 Founders Edition顯卡的實際表現還是讓人感到滿意的。儘管在傳統的光柵化遊戲上,相比較上一代性能提升不是很明顯,但是在光追遊戲以及DLSS特效加持下,NVIDIA GeForce RTX 4070 Founders Edition顯卡的表現就遠超上代RTX 3070 Ti,此外英偉達也多次強調這款顯卡主要面向的消費群體是2K解析度的用戶,那麼開啟DLSS之後,這款顯卡也能在獲得超過100幀的成績,對於購買了高刷的消費者來說是一個福音。並且在提供更高性能的同時,顯卡的功耗以及溫度也讓人十分地滿意。
我們也看到,如今大紅大紫的AIGC對於顯卡的AI性能提出了更高的要求,而AI性能的飛躍也是RTX 40系顯卡的另外一個亮點,藉助強大的AI性能表現,用戶的工作效率也得到了巨大的飛躍,從而讓效益更高。
此外在AI軟體中,毫無疑問英偉達占據了絕大部分的市場份額,這也是未來NVIDIA GeForce RTX 4070 Founders Edition顯卡以及英偉達所擁有的巨大優勢,畢竟AI屬於專業計算領域,對RTX 40系顯卡來說也有著更加廣闊的發展空間。對於遊戲玩家來說,NVIDIA GeForce RTX 4070 Founders Edition顯卡顯然是全新的萬元裝機的首選,畢竟藉助DLSS 3等各種黑科技,在2K解析度下可以獲得超100幀的速率,對於擁有RTX 2070 SUPER顯卡的消息來說是一個相當不錯的更新換代的選擇。