就在今天,NVIDIA正式對RTX 4080 SUPER非公版顯卡的性能進行了解禁。作為RTX 40 SUPER系列家族的最後一名成員,RTX 4080 SUPER顯卡無疑是除RTX 4090以及RTX 4090D顯卡之外的最強天花板了。
而其RTX 4080 SUPER顯卡在保持了較RTX 4080有小幅度提升的前提下,公版售價還比其便宜了1400元,可以說是一款非常值得遊戲玩家們入手的「加料且降價」遊戲神器。
誠然,公版顯卡是一個標杆,非公版顯卡則是考驗廠商在其上邊「大刀闊斧」做文章的地方。不同的外觀設計,不同的供電、散熱用料甚至是不同的OC Boost頻率,如何做出玩家們最滿意的顯卡,正是廠商們所追求的。

談及七彩虹顯卡,除了冠以「火神」之稱的「Vulacn」系列高端顯卡之外,還有一款與之對應冠以「水神」之稱的「Neptune」系列。不過與「火神」系列顯卡不同,由於「水神」系列顯卡搭載360mm/240mm水冷散熱器的原因,對使用環境也有一定的要求。所以,「水神」往往都會出現在頂級旗艦級顯卡上邊。
而這次,我們就收到了七彩虹的iGame GeForce RTX 4080 SUPER Neptune OC 16GB水神顯卡,這塊顯卡究竟性能如何?與RTX 40系的頂級顯卡RTX 4090和它的「弟弟」RTX 4080相比又會有怎樣的差距?讓我們一起來看一下吧!

本次評測的主角是來自七彩虹的iGame GeForce RTX 4080 SUPER Neptune OC 16GB水神顯卡(下簡稱:RTX 4080 SUPER水神),該顯卡有別於其它的非公版顯卡,採用了360mm一體式水冷設計,其優勢是可以讓核心在保持高性能的情況下得到更好的散熱環境。
當然,由於其顯卡自帶冷排,對機箱的空間也有一定的要求,這個還請注意。
架構解析:

按照慣例我們還是生成了一副規格對比圖,以便大家可以直觀的感受到RTX 4080 SUPER水神顯卡與其它顯卡之間的參數差異。
本次RTX 4080 SUPER水神顯卡採用的是AD103-400架構,是AD103架構的完全體。該顯卡相比RTX 4080多了4組SM簇,512個流處理器以及24個Tenosr核心和4個RT核心。
且在頻率方面,RTX 4080 SUPER水神要比公版的RTX 4080 SUPER顯卡高了90MHz的Boost頻率和30W的TDP。

RTX 4080 SUPER水神顯卡GPU-Z
從2.57.0版本開始,GPU-Z已經可以識別所有的RTX 40 SUPER系列顯卡,該顯卡的BIOS版本為95.03.44.40.04,其顯卡像素填充率可達295.7Gpixel每秒。材質填充率則是844.8GTexel每秒。

RTX 4080 SUPER水神顯卡GPU-Z BIOS
通過RTX 4080 SUPER水神的BIOS可以發現,該顯卡默認功耗可達350W,最大功耗可達470W,不知後期七彩虹是否會推出「雞血版」BIOS,通過釋放GPU性能來榨乾360mm一體式水冷的散熱潛力。

RTX 4080 SUPER核心架構圖
通過核心架構圖可以發現,RTX 4080 SUPER水神顯卡啟用了6個滿血的GPC和1個去掉4組SM簇的GPC。共計達成了7個GPC以及6*12 1*8=80組SM簇。
而通過前邊的表格可以發現,AD103-400核心較RTX 4080的AD103-300核心一樣,都是8個顯存控制器,以及相同的64MB二級緩存。

RTX 4080 SUPER水神顯卡的AD103-400-A1核心
最後,由於在RTX 40系列顯卡的核心架構中,每個SM簇中含有4個第四代Tensor核心以及1個第三代 RT核心,所以,RTX 4080 SUPER的核心構成應為:
80組SM簇*128個流處理器=10240個流處理器
80組SM簇*4個Tensor核心=320個Tensor核心
80組SM簇*1個RT核心=80個RT核心
8個顯存控制器*32bit(位寬)=256bit(顯存位寬)
8個顯存控制器*2GB GDDR6X顯存顆粒=16GB顯存
RTX 4080 SUPER水神顯卡燈光效果影片

整個RTX 4080 SUPER水神顯卡共計3處RGB燈光區域,分為顯卡正面,顯卡側脊以及水冷散熱風扇。

顯卡的水冷是與顯卡連接在一起的,一般情況下無法將其分開,所以顯卡雖然尺寸較小,但是加上水冷部分,還是顯得比較誇張。

顯卡外觀同目前已經發布的RTX 4090水神、RTX 4090D水神一樣,都是採用了相同的尺寸,相同銀白色的合金外甲的水冷散熱器。

在顯卡正面可以看到貫穿顯卡的雙曲線波浪形RGB燈條,讓顯卡有一種「流動」的美感,以呈現亞特蘭蒂斯王國的藝術氣息——優雅和科技。

顯卡側脊可以看到iGame以及向右箭頭的英文標識,此處是第二處RGB區域,在顯卡不工作時這裡是鏡面,只有工作時才會亮起相應的燈光效果。

360mm水冷的每一個風扇都帶有RGB燈光,這是顯卡的第三處RGB燈光區域,該風扇的燈光隨著顯卡正面、側脊的燈光進行變化,給人一種非常優雅的藝術感。
顯卡本體外觀介紹:

顯卡尺寸為:253.5mm長*170.8mm高*41.5mm寬(含擋片)。其顯卡採用了越肩的形式,由於該顯卡為一體式水冷的設計,所以顯卡的PCB被整個散熱模塊包裹了起來,除了增強散熱性能的特點外,還有加固、保護顯卡以及防塵的效果。

與普通顯卡不同,七彩虹的RTX 4080 SUPER水神顯卡採用了全覆蓋銅底技術,超大的純銅散熱底座包裹了包括GPU、顯存以及供電系統在內的高熱量元件。可以通過該銅底將熱量傳遞到水冷液上,並通過水泵實現水冷液在冷頭和散熱冷排之間進行循環。以達到散熱的目的。

正面除了左下角iGame的LOGO之外,右上角還有NEPTUNE的英文標識。

顯卡側脊,左側是RGB燈光區域,前邊我們說過,在未運行時這裡是鏡面的樣式,當點亮時,裡邊會隨之亮起iGame的英文標識以及向右箭頭的標識。
側脊的中間則是GEFORCE的英文標識以及水冷管,右側則是供電區域。

顯卡採用ATX 3.0(12 4Pin)的輔助供電設計,旁邊則是與主板進行ARGB燈光同步的線纜接口,可以通過該接口實現與主板進行燈光同步。

背面,為了增加顯卡的堅固性,七彩虹的水神在背面增加了一個鋁合金背板。同時上邊印有GEFORCE RTX的英文字樣和iGame以及水神的標誌。

而在輸出接口方面,該顯卡採用了3個DP 1.4a加1個HDMI 2.1a的組合方案。同時,左上角的按鍵則是七彩虹顯卡特有的一鍵超頻鍵。
按下後可進入超頻版BIOS,此時GPU Boost頻率為2640MHz,彈出則是公版頻率,此時GPU Boost頻率為2550MHz。
顯卡水冷排部分介紹:

該顯卡的水冷冷排其尺寸為394mm長*119.2mm寬以及54.4 mm厚,冷排默認是安裝了3個12025規格的ARGB風扇。
其風扇的扇葉為9葉片,在設計方面有點類似於安耐美的「火蝠」系列風扇的的蝠翼形象。這樣的設計可以更好降低風扇轉動時風切產生的噪音,並起到增強風壓的效果。

同時風扇是通過螺絲固定,其拆卸並不是非常麻煩,這對於用戶後期的清理維護或者更換也顯得非常友好。

其冷排採用了標準的12水道設計,冷排也為了顏色統一性而選擇了和顯卡卡身一樣的白色。

3個風扇通過串聯的形式最終接在冷排上邊的HUB上。該HUB共支持3個風扇的PWM統一調控和1個ARGB的燈光統一調控。
顯卡與HUB之間的線纜是隱藏在兩根42cm水冷管的蛇皮我內部的,所以用戶在安裝顯卡水冷時完全不必擔心理線問題。

顯卡與冷排整體
測試平台介紹:


本次測試均採用七彩虹的頂級配置,測試平台如上圖所示。
Stable diffusion AI繪畫性能測試:
由於RTX 40系列顯卡顯卡使用的是第四代Tensor(張量)核心,核心的作用就是用於深度學習和AI運算方面。因此,RTX 40系列顯卡在運行AI相關的Stable diffusion(AI繪畫)軟體時,會變得更加得心應手。
而Stable diffusion的繪畫原理是通過用戶輸入自己想要的畫面關鍵詞,並進行部分調整(如權重,渲染次數,引擎等),來進行圖像生成。
就好比你是一個甲方,需要修改哪裡,只需要輸入相應的關鍵詞即可,剩下的便是由AI來根據你的意思進行修改。
當然了,AI繪畫是需要不斷通過學習積累的,根據不同的需要,AI的學習過程也有所不同,比如二次元風,水墨風甚至寫實風等等。這些不斷學習的過程就是一個個不同的模組(AI學習的資料庫)了,所以AI繪畫除了相應的關鍵詞外,還需要相應的模組庫才行。

但這畢竟是深度學習和計算的過程,因此NVIDIA的Tensor核心就有更好的用武之地了。在安裝好相應的插件([TRT] sd_xl base_1.0_0.9vae)後,在Stable diffusion中就可以就看到TensorRT(深度學習推理SDK)的選項卡了,如此即可實現利用NVIDIA RTX 40系列顯卡中的Tensor核心來進行深度學習後的AI繪圖。
下邊我將採用常規AI繪圖方式,以及RTX 4080 SUPER水神顯卡的TensorRT繪圖方式來進行對比。
兩次AI繪圖均採用設置如下:首先選擇模組(AI學習庫)為sd_xl_base_1.0_0.9vae.safetensors,採樣步數為50,採樣方法為Eular a,提示詞相關係數為7,隨機數種子為13,圖片寬度和高度為1024×1024,總批次數為10,單批數量為1。

首先是常規繪圖模式,此時不加載NVIDIA專門的插件,以完全默認的狀態僅調整參數來生成AI圖像。
測試結果:未使用Tensor核心進行AI計算的RTX 4080 SUPER顯卡總計生成圖片用時為2分18.6秒(138.6秒)。

之後選擇[TRT] sd_xl base_1.0_0.9vae插件,其它參數和之前一樣,再進行AI圖像的生成。
測試結果:使用Tensor核心進行AI計算的RTX 4080 SUPER顯卡總計生成圖片用時1分19.7秒(79.7秒)。
測試感想:
NVIDIA RTX 40系顯卡第四代的Tensor核心在AI繪畫方面算是得到了更加廣泛的應用,使用該項核心支持的技術來進行繪畫,其用時要大幅領先於標準設置,可以說提升了非常大的工作效率。
NVIDIA VSR 影片增強功能測試:

NVIDIA的VSR功能其實就是RTX影片增強,以提升顯示效果的功能,該功能位於NVIDIA的控制面板中,在左側列表最下方的調整影片圖像設置中即可找到它。
右側選項中,點選超解析度即可開啟該功能,質量方面有1-4四個選項。
點擊,開啟,就是這麼簡單,你完全不需要其它任何操作,它甚至可以應用於網路影片(即在網上看影片也有相應的變化)。
對此,我使用開啟後的質量4,以及關閉兩種狀態下分別播放了一段油管的影片,並使用採集卡進行了記錄。之後我將影片一分為二,讓大家看看開啟VSR功能和關閉VRS功能後,即使是在線觀看影片,會有怎樣的區別吧。
開啟和關閉VSR功能下的一段網路播放影片對比

通過對比影片可以發現,開啟RTX影片增強(質量4)後,其畫面要比關閉RTX影片增強色彩更加明亮一些,這樣的結果就是整個湖水不再像關閉後的那樣是給人以「死氣沉沉」的感覺。

之後我將影片放大5倍,來觀察一下細節方面,得益於光線的增強,山巒背面的陰影處也得到了更多細節方面的表現。
測試總結:
得益於VSR的影片增強,在讓影片變得更加明亮之後,許多暗部的細節也得以體現。且這項技術不需要額外下載任何插件,只需要在NVIDIA控制面板中點幾下鼠標即可。
應用則是即時的,甚至於嗶哩嗶哩,油管看網路影片也會有不同的效果。可以說是非常實用的工具了。
D5 Render DLSS實時渲染功能測試:
其實Stable diffusion主要是調用顯卡的算力來繪畫,而VSR則是NVIDIA控制面板中的功能。這次的D5 Render就是實實在在的軟體了。D5 Render是一個實時渲染的工具,它可以幫助用戶對生成的場景來進行較為逼真的展現。
但正因為場景展現是實時的,所以在普通顯卡進行如此複雜的計算時,它會變得很卡,尤其是特效全開後的表現。
如今的D5 Render已經加入了對NVIDIA 3.5版本的DLSS支持,加載了該技術後,相同場景下表現又會如何?一起來看下吧!

在D5 Render的DLSS 3.5選項中可以看到超解析度採樣、光線重建以及實時高幀率3個選項。其中光線重建功能是依託於超解析度採樣上的,即開啟後者才能開啟前者。

D5 Render的5種模式下場景的不同表現。

通過放大,觀察左側玻璃的反光可以發現,對場景表現有提升的是超解析度採樣以及光線重建功能,兩者依次遞進的可以更好的將玻璃反光的模糊雜質畫面給去除掉(需知D5 Render是渲染器,在這一場景中不應該有灰塵和不乾淨、凹凸不平的玻璃出現,顯然全關後的模糊也是不應該出現的)。
實時高幀率則是在以上的基礎上進行了幀率的提升。

最後,我們生成了一個對比表格,以便大家直觀了解在D5 Render中,3款顯卡在各種場景下的表現。
測試感想:
DLSS的加持,讓顯卡在運行D5 Render時變得更加輕鬆流暢,原本RTX 4080 SUPER水神顯卡在默認情況下表現為75幀,開啟超解析度採樣後直接上升到了125幀的水平,而在全開之後,幀數再次上漲到平均幀198幀。可以說得益於DLSS 3.5的加持。最終表現是比默認設置有了2.64倍以上的幀數提升且在畫質表現方面得到了增強。
3Dmark相關測試:

3Dmark Speed Way DX12 Ultra性能測試

3Dmark Port Royal光追性能測試

3Dmark Time Spy Extreme DX12 4K性能測試

3Dmark Time Spy DX12 2K性能測試

3Dmark Fire Strike Ultra DX11 4K性能測試

3Dmark Fire Strike Extreme DX11 2K性能測試

3Dmark Fire Strike DX11 1080P性能測試
光線重建及插幀遊戲測試:

《電馭叛客2077》4K解析度開/關光線重建功能測試

《電馭叛客2077》2K解析度開/關光線重建功能測試

《電馭叛客2077》1080P解析度開/關光線重建功能測試

《瘟疫傳說:安魂曲》4K解析度開/關幀生成功能測試

《瘟疫傳說:安魂曲》2K解析度開/關幀生成功能測試

《瘟疫傳說:安魂曲》1080P解析度開/關幀生成功能測試