隨著RTX 50系Blackwell GPU的正式發布,時隔兩年之久的GPU大戰再次打響,包括iGame在內的一眾AIC廠商也帶來了全套的新解決方案共襄盛舉。這次我們遊俠硬體組拿到了一張來自七彩虹的iGame GeForce RTX 5080 Advanced OC 16GB 16GB顯卡,看看七彩虹這張高端經典的iGame顯卡在Blackwell的加持下能夠帶來怎樣的火花吧。
圖形架構的超級革命
在介紹具體顯卡之前,我們還是需要再簡單過一下RTX 50系遊戲GPU在架構層面的改進。本次RTX 50系遊戲GPU搭載了NVIDIA最新的Blackwell架構,而基於NVIDIA以歷史上有名的各位大神為GPU微架構起名的傳統,本次Blackwell也是向著名數學家、統計學家,拉奧-布蕾克韋爾定理的提出人戴維·哈羅德·布蕾克韋爾的致敬。
由於半導體製造工藝以及商業可行的晶片尺寸逐漸逼近物理學極限,摩爾定律的終結已然是擺在檯面上的不可忽視的問題。在RTX 50系Blackwell GPU上,NVIDIA引入了一個全新的概念-Neural Shaders神經網路著色器。
從名字上也可以看出來,本次Blackwell GPU的著色單元高度依賴AI算力,每一組Blackwell SM單元均是針對神經網路著色器架構進行特化的產物,與上一代Ada GPU SM單元僅有一半核心擁有INT32能力不同,在Blackwell上,每一組SM單元的著色器核心都能夠執行FP32/INT32指令,搭配第五代Tensor Core與改進的著色器執行重排序(SER),能夠顯著提升顯卡在運行包括DLSS在內的各種圖形/AI負載時的效率。
在實際應用中,基於Blackwell GPU的Neural Shaders,開發者可以在遊戲中部署基於神經網路的模型、貼圖、材質與體積雲等效果。開發者可以通過訓練一個基礎模型,在用戶端進行實時推理的方式實現高質量、高效率且小體積的畫面效果。與在本地完整烘焙光照、打包分發相比,採用基於Neural Shaders實現的AI著色同樣也能顯著提升遊戲開發者的效率,可以說是讓所有人都幸福的解決方案了。
在面向包括DLSS在內的各路AI應用的Tensor Core上,本次Blackwell引入的第五代Tensor Core支持了更低精度的FP4規格數據,這能夠進一步壓縮負載時的顯存壓力,在顯存池受限的消費級遊戲GPU上更是能顯著提升如DLSS等技術的效果表現。同時,對於近年來逐漸成為業界焦點的Transformer模型而言,第五代Tensor Core的效果也是相當出彩,這一點在後面講DLSS 4的時候也會提及。
說到顯存,本次RTX 50系GPU全系引入革命性的GDDR7顯存。由於採用了PAM-3信號調製技術,GDDR7顯存能夠在實現更高頻率的同時顯著降低功耗,且提升幅度十分可觀:根據NVIDIA的說法,RTX 50系首發搭載的GDDR7顆粒能夠在帶來兩倍於GDDR6顯存的性能同時僅消耗一半的能量,提升幅度相當顯著。
大規模GPU的能耗問題在如今愈發顯著,而Blackwell架構通過更精細的電壓控制與頻率切換可以說是大幅優化了這一點。
對於消費級GPU而言,圖形輸出規格與影片編解碼能力也是一個相當重要的參數,在這方面Blackwell自然也是不遑多讓。本次RTX 50系GPU全面支持包括DP2.1 80Gbps在內的先進影片輸出規格,在消費級GPU中鶴立雞群。同時,NVENC與NVDEC分別升級到第九代與第六代,支持了AV1 UHQ、MV-HEVC與4:2:2規格影片的編解碼,而同時基礎的H.264解碼效率也同樣令人嘖嘖稱奇。無論是多屏用戶還是多媒體創作者,都能夠得益於Blackwell架構帶來的顯著提升。
更多光線,更快上線
自從RTX 20系Turing架構首次向全世界展示實時光線追蹤技術對電子遊戲的表現力帶來的革命以來,基於光線追蹤技術構建遊戲幾乎成為了3D遊戲的預設選項。隨著RTX 50系列的上市,第四代的RT Core也一併上線,與GPU架構的其他部分協作帶來了更出彩的光追體驗。
第四代RT Core在第三代Ada 光追單元的基礎上將三角形引擎拆分成求交與解壓引擎,並引入了線性掃描球體引擎,能夠大幅提升光追單元的計算效率,配合前文提到的在GPU微架構與顯存技術上的提升,提升幅度不可小覷。
在先進的光追單元加持下,本次RTX 50系Blackwell GPU引入了全新的RTX Mega Geometry與硬體加速曲線基元,結合前面架構分析時提到的神經網路著色器能夠為開發者提供更多樣的可能性,帶來革命性的畫面表現能力與遊戲體驗。
DLSS 4:一生二,再生三,再生萬物
憑藉著高性能的光流加速器與遊戲開發商的深度合作,RTX 40系Ada 架構搭載的DLSS 3功能可以說是廣受好評,去年推出的DLSS 3.5光線重建技術更是讓玩家們在如《電馭叛客:2077》與《心靈殺手2》這樣的遊戲中享受了數百小時的視覺盛宴,筆者自己就專程為了體驗《心靈殺手2》這部Remedy Entertainment十年磨一劍的神作專程組裝了一台搭載GeForce RTX 4080 SUPER 顯卡的旗艦台式主機。而隨著本次RTX 50系遊戲顯卡一併發布的全新技術 – DLSS 4更是在現有的幀生成管線上進一步拓寬了上限。
本次DLSS 4的一大亮點就是引入了Transformer模型替換了以往的卷積神經網路模型架構。傳統的卷積神經網路模型架構在多年的更新中已經觸及了性能極限,而全新的Transformer架構的性能不僅已經在Stable Diffusion等AI圖片生成應用、ChatGPT等大語言模型中已經得到一次次的證實,而且它有能力根據畫面的上下文進行推理,能夠帶來更穩定且符合邏輯的畫面,減少鬼影、閃爍等現象隨著DLSS 4的上線,包括超解析度、幀生成在內的全套功能都將由更先進的Transformer模型驅動,帶來顯著提升的畫面表現。
在這套截取自《心靈殺手2》亮瀑鎮警局後院的對比圖中,我們可以看到引入Transformer模型後,DLSS光線重建功能的畫面表現得到了顯著的提升。由於Transformer模型有能力通過「上下文」實現對畫面的整體理解,在柵欄上我們能夠明顯看到鐵絲的質感更為真實,而基於卷積神經網路模型的DLSS光線重建實現則由於卷積神經網路模型依賴卷積核的特性在這類場景中表現並不出色。
即使在像《地平線:西之絕境》這樣不支持DLSS光線重建,僅支持DLSS超解析度的遊戲中,我們也能看到類似的改善。埃洛伊背包上的皮革線條在Transformer模型加持的DLSS超解析度後仍然保持了相當明顯的立體感,玩家可以顯著的看到這個背包的縫製線條,對於遊戲整體畫面表現提升十分顯著。
除了底層架構的革新之外,DLSS 4的另一大亮點就是它引入了多幀生成功能,允許遊戲在DLSS 3幀生成技術的基礎上生成更多幀數。同時,由於需要高效生成遊戲畫面,本次DLSS 4也引入了全新的AI光流算法以替代硬體光流加速器來加速光流場計算。綜合而言,這套全新的DLSS 4能夠帶來40%的速度提升,同時還能降低30%的顯存占用,可以說是相當強悍了。
在《戰錘40K:暗潮》中,DLSS 4多幀生成能夠實現最高畫質下4K 137幀的遊戲體驗,提升高達10%,同時顯存占用也比DLSS 3降低了0.4GB,為遊戲開發者提供了更多空間用於引入高質量的畫面技術。
而當我們將DLSS 4多幀生成技術與之前所有DLSS技術放在一起考慮時,我們會發現,目前DLSS技術已經能夠做到讓每十六個像素點中有15個由AI生成。在傳統圖形渲染架構革新與製程進化速度不斷放緩的今天,依靠AI加速的DLSS而非暴力堆徹硬體規模(儘管NVIDIA在這方面也同樣是武林高手)反而能夠帶來更顯著的遊戲體驗上的提升。
而對於之前已經購買過NVIDIA GeForce RTX GPU的玩家而言,本次DLSS 4在底層架構上的提升也同樣能夠讓諸位受益,正如我們曾經在DLSS 3.5光線重建上見到的一樣。
Reflex 2:更低延遲的電競體驗
自從初代NVIDIA Reflex低延遲技術於2020年正式上線以來,這項通過優化遊戲圖形渲染以降低系統延遲的技術就在整個業界廣受好評。無論是遊戲開發商、外設廠商還是玩家都樂見並廣泛接納了這項極富盛名的技術,日前已有超過百款熱門遊戲進行支持,其中不乏如《絕對武力2》、《特戰英豪》等熱門電競大作,它也是DLSS 3幀生成功能實現高可用性的重要基石。
而隨著圖形技術複雜度越來越高,NVIDIA Reflex 2也應運而生。它在初版Reflex的基礎上引入了全新的Frame Warp技術,能夠基於鼠標輸入預判下一幀的畫面,進一步降低系統延遲。
針對Reflex 2實現首發支持的兩款遊戲分別將會是The Finals與無畏契約,而這項技術儘管首發支持RTX 50系GPU,將會在未來擴展到全部RTX GPU陣容,讓所有現代NVIDIA GeForce GPU的遊戲用戶體驗到次世代的電競體驗。
GeForce RTX 5080:完整的AD103
本次我們評測的GPU是RTX 50系GPU矩陣中的次旗艦產品-GeForce RTX 5080。這顆GPU基於完整的GB203核心打造,擁有7組GPC單元,42組TPC單元,84組SM單元,共計10752組CUDA核心。儘管仍然基於TSMC的4N定製工藝打造,但RTX 5080 GPU在前文提到的Tensor Core、RT Core、NVENC/DEC編解碼器上都有顯著提升,輔以全新的30Gbps GDDR7顯存顆粒,在顯存位寬保持256bit的前提下將顯存帶寬從上一代RTX 4080的716.8GB/s提升到960GB/s,在高帶寬要求的現代遊戲、圖形專業應用與AI負載下能夠帶來十分可觀的提升。全面的提升帶來了整卡的功耗的小幅上漲,從320W TGP上漲到360W,但考慮到增幅只有40W,現有RTX 4080/RTX 4080 SUPER的用戶應當可以在不更換任何配件的情況下直接升級。
引力環牽動的玩游引擎
ADVANCED系列作為iGame家族高端顯卡的中流砥柱,新一代RTX 50系的iGame Advanced系列顯卡在經典設計的基礎上進行了再生產。從神秘的環狀星系哈氏天體中汲取靈感的紅圈「引力之環」設計,以及其上銘刻著的產品銘文仍然得以保留,讓老用戶能夠一眼看出這就是他們熟悉的那個設計。
但與此同時,本世代產品引入了更多的圓角和曲線元素,在顯卡正面引入了一個靈感取自莫比烏斯環的∞設計,帶來了相當新穎的視覺觀感。同時,在配色上,本次的iGame GeForce RTX 5080 Advanced OC 16GB顯卡也引入了更多黑、灰等暗色調,對整卡的色彩風格進行了一次全面升級。
看到側面,本次的iGame GeForce RTX 5080 Advanced OC 16GB採用了雙槽擋板的設計,但卡身仍然是較厚的,尺寸來到了69.3mm,接近三槽多寬度。更厚的散熱模具對顯卡溫度的壓制與性能的釋放都有好處,這點就看各位裝機時的取捨了。在擋板上,除了RTX 50系通用的DP 2.1 80Gbps接口與HDMI 2.1 48Gbps影片輸出接口外,我們還看到了iGame家族祖傳的一鍵超頻按鈕,這項功能一直因為其能夠方便玩家在將顯卡裝入機箱後可一鍵切換VBIOS而廣受好評,相信也會幫到很多用戶。
iGame GeForce RTX 5080 Advanced OC 16GB顯卡的星環背甲通過螺絲與其他部分連接,能夠有效提升下整體結構的穩定性,同時環形的開孔設計也相當有利於風道構建,讓氣流能夠有效通過。同時,背部散熱孔還通過視覺上的特殊設計,讓用戶在橫插狀態下也能夠看到iGame的LOGO,十分具有設計感。
當然,為了應對顯卡的重量,七彩虹還隨iGame GeForce RTX 5080 Advanced OC 16GB附贈一套iGame金屬顯卡支架 ,可以保護主板PCIe插槽與顯卡PCB,讓電腦在長期使用中更為可靠。
漩渦散熱
高性能GPU繞不開的問題就是散熱,這張iGame GeForce RTX 5080 Advanced OC 16GB搭載了一套規格相當暴力的旋渦散熱裝置,能夠輕鬆應對RTX 5080的功耗。
iGame GeForce RTX 5080 Advanced OC 16GB顯卡正面的三把風扇裝配了大口徑「風鐮」扇葉,能夠使空氣形成旋渦吸入,提升冷風的風壓,增加進風量。這套風鐮扇葉也是本次旋渦散熱裝置的核心技術,九片扇葉如鐮刀般鋒利,並環環相連地安裝在顯卡上,搭配雙滾珠軸承電機,能夠性能噪音兩手抓。
iGame GeForce RTX 5080 Advanced OC 16GB散熱模組採用VC均熱板 7*8mm回流焊熱管 導流型鰭片三板斧豪華設計,搭配鋁合金中框帶來了相當富裕的散熱餘量,能夠輕鬆壓制顯卡的發熱。
在25度室溫30分鐘FurMark壓力測試中,這張iGame GeForce RTX 5080 Advanced OC 16GB顯卡一直維持在穩定的370W功耗下,頻率波動也近乎是一條直線。同時,GPU核心回報的溫度控制也相當出色。
而在更貼近實際遊戲應用的3Dmark Speed Way壓力測試中,這張iGame GeForce RTX 5080 Advanced OC 16GB也取得了幀率穩定度99%的成績,這套旋渦散熱裝置確實相當強勁。
軟體支持
為了全面發揮這張iGame GeForce RTX 5080 Advanced OC 16GB顯卡的性能,七彩虹為我們提供了全套的板卡套裝,我們最終用如圖所示的配置組裝了一台測試PC。
採用全家桶的一大好處是,用戶可以使用iGame Center軟體進行全面的監控與性能調優。除了我們之前見識過的RGB燈效和顯卡超頻之外,我們還可以使用更多樣的配置方式進行深度配置,這一點就相當方便了。
在iGame全家桶的加持下,整機的RGB燈效能夠輕鬆同步,效果十分出眾
前文提到的iGame金屬顯卡支架也能夠有效地支撐起顯卡的重量,裝機體驗相當出色。
遊戲體驗
我們在前面已經介紹了RTX 50系GPU搭載的DLSS 4技術,目前也有很多遊戲已經引入了DLSS 4的支持。當然,在測試遊戲性能之前,我們不妨先來看看在3Dmark這一經典的顯卡測試套件中,高性能的iGame GeForce RTX 5080 Advanced OC 16GB顯卡能夠帶來怎樣的表現吧。
NVIDIA為我們提供了一套能夠測試DLSS 4理論性能的3Dmark副本,我們就先從DLSS 4測試開始。可以看到,即使使用DLSS 3技術,iGame GeForce RTX 5080 Advanced OC 16GB的性能仍然顯著強於RTX 4080 SUPER,而且幅度相當可觀,甚至在引入Transformer模型和全套DLSS 4技術後還能再高出約10幀。從這個對比可以看出來,RTX 50系GPU中引入的、用於替換硬體光流加速器的AI確實是相當高效的存在,DLSS 4在實際遊戲中的性能表現十分值得期待。
既然都測了DLSS,那我們不妨把其他所有項目都測一遍。在傳統的光柵性能測試項目中,iGame GeForce RTX 5080 Advanced OC 16GB的表現相當可觀,即使只考慮顯卡分數也有斷崖式的領先,在Fire Strike這一傳統的1080P DX11性能測試中更是直接提升了10000分,這樣的性能進化幅度意味著即使你玩的遊戲並不支持DLSS,iGame GeForce RTX 5080 Advanced OC 16GB帶來的提升也一樣相當可觀。
3Dmark提供的兩項RTX性能測試里我們也看到了類似的顯著提升,iGame GeForce RTX 5080 Advanced OC 16GB作為一張次旗艦級別的非公RTX 5080 GPU,性能表現在已經很強的RTX 5080 顯卡基礎上實現了再進化,相當適合發燒遊戲玩家。
說了這麼多,終於要開始打遊戲了。考慮到GPU規模和定位,本次評測將只專注於4K性能,並且基本都在遊戲提供的最高畫面預設下進行遊戲。
首先是《心靈殺手2》, 這款遊戲是首批支持DLSS 4支持作品中相當突出的一款,這主要是因為它是首款引入NVIDIA RTX Mega Geometry技術的遊戲,這項技術能夠智能地集中處理並更新複雜幾何,實時進行光線追蹤計算,不僅可以降低GPU占用率、提高遊戲幀率,還能夠降低複雜光線追蹤場景下的顯存消耗。同時,至少在我們測試使用的開發者預覽版中,Remedy開放了選擇卷積神經網路或Transformer模型的權限,這使得我們可以更全面的對比幾個模式下的性能表現。然而,由於它原生針對DLSS 3.5開發的特性,這也是唯一一款我們在高畫面預設 高光線追蹤預設下進行測試的遊戲。
從數據上,我們可以明顯地看到,由於Remedy Entertainment無需考慮基於古老GPU的第八世代主機產品,心靈殺手2能夠以相當激進的方式引入包括全景光線追蹤在內的各類現代圖形技術和渲染技術,這款遊戲的光追體驗幾乎可以說是強綁定DLSS光線重建與幀生成,而搭載RTX 50系GPU的iGame GeForce RTX 5080 Advanced OC 16GB顯卡在這款遊戲中的表現就相當驚艷。即使不開啟多幀生成,完全依賴RTX 5080 GPU本身的架構升級與基於Transformer模型而非卷積神經網路的DLSS管線,心靈殺手也能夠在高畫面預設 高光追預設下輕鬆實現1% Low幀都有4K 60幀的表現,而在最高性能的DLSS 4X多幀生成模式下,目前最主流的4K 160Hz顯示器都能夠成為遊戲的瓶頸,這對於心靈殺手2這款遊戲來說確實令人震驚。
《電馭叛客2077》作為近幾年NVIDIA展示圖形技術革新的必備作品,在最新的2.21版本更新中也正式引入了DLSS 4技術,且同樣允許玩家選擇使用傳統的卷積神經網路模型還是Transformer模型進行遊戲,這也為我們提供了一個在實際遊戲中探索兩者表現的好辦法。
在電馭叛客2077中,我們使用光線追蹤超速預設進行測試,而我們也同樣能夠看到基於Transformer模型而非卷積神經網路的DLSS在與高性能的RTX 50系GPU協作下的性能提升:DLSS性能幾乎翻倍,從4K 30幀提升到1% Low幀都有4K 60幀,這樣的性能提升對2077這樣的一款依賴玩家操作的遊戲而言提升十分顯著。
當然了,在《霍格華茲的傳承》與《星際大戰:法外狂徒》這兩款同樣引入DLSS 4技術的遊戲中,我們也能看到類似規模的性能提升。可以說,從這四款遊戲中我們可以看出,iGame GeForce RTX 5080 Advanced OC 16GB在RDLSS 4的加持下可以在遊戲中實現相當可觀的性能提升,對於追求高性價比的4K高刷遊戲體驗而言相當出色。
當然了,除了我們上面測試的四款遊戲之外,還有很多遊戲暫未引入DLSS 4支持。同時,儘管玩家可以通過NVIDIA App優設功能在部分遊戲中實現手動開啟DLSS 4,我們出於數據可用性的考慮在這篇評測中將只覆蓋那些已經支持的遊戲。而對於像《黑神話:悟空》這樣的暫未引入DLSS 4的遊戲,我們也只能簡單看看在DLSS 3的技術上,iGame GeForce RTX 5080 Advanced OC 16GB到底能帶來怎樣的提升了。
由於《黑神話:悟空》暫未引入DLSS 3.5光線重建技術的支持,它對性能的要求其實相當可觀,兩張顯卡在原生渲染下都帶來了並不出彩的成績,但在Blackwell架構創新與iGame Advanced系列旋渦散熱模塊設計加持下帶來的兩板斧性能提升,iGame GeForce RTX 5080 Advanced OC 16GB顯卡在DLSS 3下亦能實現翻倍的性能提升,表現也同樣優異。
顯卡也能幹活
對於當代的AIPC產品來說,搭載NVIDIA GeForce RTX GPU的PC由於能夠無縫接入包括CUDA在內的全套NVIDIA技術早就成為了發燒友們的心頭好,而隨著更多應用程序開始引入AI加速,搭載RTX 50系GPU的AI PC平台也成為了生產力應用的好幫手。
對於工業級AI比較了解的讀者一定聽說過MLPerf的大名。作為行業標準級別的AI測試套件,我們本次引入了MLPerf Client這一面向端側應用的AI測試套件。它基於Meta開源的LLaMa 2模型,能夠有效測試系統在常見AI負載下的理論性能,我們以Token Generation Rate值為基準進行比較。可以看到,在所有四種負載中,iGame GeForce RTX 5080 Advanced OC 16GB顯卡都顯著超越了作為基準的RTX 4080 SUPER GPU,這意味著在各類AI應用中,這張全新的iGame GeForce RTX 5080 Advanced OC 16GB都能夠帶來更高效能的表現。
除了偏理論的MLPerf Client,我們還能夠通過Procyon套件測試RTX 5080顯卡在文生圖與LLM應用下的實際性能表現,先來看看文生圖。Procyon的文生圖測試基於FLUX.1 Dev模型實現,能夠分別測試FP4與FP8規格下的性能表現,這張表記錄的則是生成一張圖所需的平均時間。可以看到,iGame GeForce RTX 5080 Advanced OC 16GB在FP4或FP8下都擁有相當可觀的性能提升,尤其是在RTX 50系第一次原生支持的FP4格式下,性能提升更是相當顯著。對於日常使用的AI負載來說,採用FP4這樣的低精度格式能夠在不損失實用性的前提下顯著提升效率,十分好用。
而在大語言模型測試環節,我們也看到了不可小覷的性能進步,尤其是在顯存吞吐量更高的LLaMa大模型里。考慮到目前已經有很多在本地部署像Qwen或DeepSeek這樣的大語言對話模型的方案,iGame GeForce RTX 5080 Advanced OC 16GB帶來的性能提升顯然是十分可喜的。
當然,並非所有生產力應用都引入了AI加速,那作為算力基座,這張iGame GeForce RTX 5080 Advanced OC 16GB表現如何呢?我們使用同樣屬於業界標準的SPECviewperf 2020 V3.1進行了全套的性能測試。從結果上可以看到,iGame GeForce RTX 5080 Advanced OC 16GB顯卡實現了相當可觀且大幅度的領先,尤其是在Maya與Solidworks兩項個人用戶相當多的測試中提升十分顯著。
而Vray6渲染器測試中,我們也看到了相當出色的性能表現。
總結
作為iGame家族的次旗艦型號,iGame GeForce RTX 5080 Advanced OC 16GB不僅繼承了系列一貫的設計語言與視覺符號,還在現有的設計基礎上實現了大刀闊斧又細緻入微的進化,讓本就廣受好評的AD-OC系列顯卡在RTX 50系這一重大圖形技術革命節點更令人愛不釋手。同時,由強大的旋渦散熱裝置支持的高性能規格也讓這張顯卡在性能上超越一眾RTX 5080選手,進一步提升了自己的優勢。可以說,對於預算充足且擁有大尺寸機箱的玩家而言,這張iGame GeForce RTX 5080 Advanced OC 16GB絕對是不容錯過的優秀顯卡。
在發稿時,這張iGame GeForce RTX 5080 Advanced OC 16GB已在包括七彩虹官網商城與京東、天貓、拼多多、抖音等線上渠道以及全國授權零售經銷商在內的全部渠道全面上市開售。而除了它以外,七彩虹iGame家族這次還一併推出了Vulcan、Neptune、Ultra等多個不同系列的GeForce RTX 5080顯卡產品供用戶選購,對於想要升級RTX 50系的玩家而言,七彩虹iGame家族的顯卡產品也同樣值得考慮。