宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

2023年12月27日 首頁 » 熱門科技
 

AI畫圖作為目前AICG最具代表性應用案例,在今年也是震驚到了不少小夥伴,不過大眾消費者要是想體驗到這個神奇的AI功能,那就需要一張相對高端的顯卡,才可以有比較不錯的出圖速度,作為AI領域的領導者NVIDIA就幫大家解決難題了,他們在最近就為Stable Diffusion推出了一個TensorRT擴展,可以大幅提高GeForce RTX 系列顯卡的文生圖性能,同時也就間接降低了AI畫畫對顯卡的需求門檻。

NVIDIA TensorRT簡介

首先我們還是來簡單了解一下TensorRT是個什麼東東,它是NVIDIA專門用於高性能深度學習推理的SDK,此前TensorRT主要應用在行業和專業用戶,現在TensorRT開始面向Windows個人用戶,就在前不久NVIDIA推出了TensorRT-LLM for Windows,這是一款提升AI推理性能的免費開源軟體,用於在個人PC上提高大語言模型的推理性能,而這只需要配置有GeForce RTX顯卡(8GB及以上顯存)的,台式機或者筆記本電腦就能在本地部署運行,不僅在搭建成本上對個人用戶更友好,也帶來了更安全的個人隱私數據保護。

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

而在流行的AI畫圖工具Stable Diffusion Webui上面,用戶也能夠通過TensorRT for Windows的加持,調用GeForce RTX系列顯卡裡面的AI運算單元Tensor Core來針對AI畫圖進行加速,從而提升生產效率。

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

眾所周知,NVIDIA的GeForce RTX系列顯卡都是帶有Tensor Core的,所以除了最新的GeForce RTX 40系列顯卡,上一代的RTX 30系和更早的RTX 20系列顯卡都是可以調用這個TensorRT,而且它還優化了顯存占用,最低只需要8GB顯存,我們實測在進行較大尺寸的AI畫圖時,整體顯存占用也只是在5GB左右,所以一張8GB的RTX 4060也是足夠用的。

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

為了驗證TensorRT的加速效果,我們找來了NVIDIA目前全系GeForce RTX 40系列顯卡,RTX 4090、RTX 4080、RTX 4070 Ti、RTX 4070、RTX 4060 Ti、RTX 4060,以及目前仍然在主流級市場廣受歡迎的上一代顯卡,RTX 3060 12G來進行Stable Diffusion的AI畫圖測試。

測試平台

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

需要注意的是,Stable Diffusion在測試過程中生成第一幅圖像的速度,可能要比後面生產圖像的慢得多,這是因為最初可能需要將模型加載到內存中,因此我們每批測試都會運行 2 次來避免這個情況,並採用批次生成的第二次測試結果。

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

AI畫圖性能測試

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

從測試結果可以看到,RTX 4090和4080這兩張

高端顯卡

本來就很快了,在有了TensorRT的優化加持之後,相比xformers以及標準模式下面,有著接近翻倍的出圖性能提升,而其它幾張顯卡也都有大幅度的加速。

當中最值得一提的就是RTX 4060系列了,RTX 4060的出圖速度從原來基本不可用,現在翻倍到了17張每分鐘,而RTX 4060 Ti也直接翻倍到了22張,即使是輸出更大一點解析度,每分鐘也有9張出圖,這樣的表現其實已經接近標準模式下的RTX 4090了,TensorRT的加速效果非常明顯。

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

從不同單批數量的出圖測試也可以看出,在TensorRT的幫助下,其實上到RTX 4060級別,甚至RTX 3060 12G都已經有非常可用的出圖性能了,可以說是把AI畫圖真正普及給廣大RTX顯卡用戶了。

另外TensorRT還提供了自定義引擎的設置,可以根據顯卡的核心性能和顯存大小,調整出圖的解析度大小上限,靜態或者動態的單批數量輸出等等,在經過優化調整TensorRT的自定義引擎後,還可以做到更快的出圖速度。

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

總結

不難看出,有了TensorRT之後,NVIDIA的GeForce RTX顯卡在AI畫圖上面,可以更加充分發揮出硬體的優勢,不僅高端顯卡的出圖速度變得更快,入門級顯卡也有了可以上場一戰的能力,大大拉近了廣大普通用戶與前沿AI技術的距離。

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

考慮到AI如今處於蓬勃發展的階段,為了方便大家了解顯卡的AI性能高低,我們在

顯卡天梯榜

上加入了AI性能排名,可以看到目前NVIDIA的顯卡幾乎統治了榜單的前排位置,從綜合的AI畫圖性能以及運算能力精度上,都屬於是遙遙領先於AMD和Intel,可見NVIDIA是如今AI領域當之無愧的領跑者。

所以對於消費級用戶,如果你是內容創作者或者有生產力的需求,想要快速的AI畫圖,便於不斷調優自己的作品,並且想要輸出大一點的圖,目前最好的選擇是入手RTX 4070 Ti以上的高端顯卡

 

GeForce RTX顯卡Stable Diffusion測試:TensorRT助RTX 4060系列性能翻倍

 

至於主流級光追顯卡RTX 4060系列,RTX 4060和RTX 4060 Ti都藉助TensorRT,實現了AI出圖速度的翻倍,加上最近RTX 4060系列的售價都有所下調,這對於持有N卡的玩家來說,顯卡的附加價值在不斷增加,特別是對於初入門AI畫圖的愛好者,無論是用來體驗AI畫圖,或者用來學習調校提示詞,RTX 4060系列都會是性價比挺高的AI顯卡。

不得不說,NVIDIA這個TensorRT把原本高高在上的AI畫圖,現在讓主流RTX顯卡用戶們可以輕鬆體驗到,實在是一個非常不錯的福利功能,大家手上有NVIDIA RTX顯卡的話,不妨去下載來試試吧。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新