宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

CES 2026 │ 撕碎「顯存牆」,重塑「光追夢」,打通「生態路」 AMD開啟全新「統治力」

2026年01月06日 首頁 » 熱門科技

從2024年對「AI PC」概念的初步界定,到2025年NPU算力規模與軟體生態加速形成閉環。站在2026年,AMD正通過架構層面的重構,重新定義 AI PC 的進化路徑。

站在2026年,AI的用戶規模與應用滲透正在把端側算力推向「基礎設施級」的需求拐點。AMD CEO蘇姿豐在CES 2026的主題演講中表示,自ChatGPT推出以來,使用AI的活躍用戶已經從100萬人增加至10億人,這是網際網路花了幾十年才達到的里程碑,預計2030年使用AI的活躍用戶將達到50億人。為了讓AI無處不在,在未來幾年內,需要將全世界的計算能力增加100倍。也正是在這種需求指數級增長下,AMD正重新定義AI PC的進化路徑。

CES2026撕碎顯存牆重塑光追夢打通生態路AMD開啟全新統治力

AMD展示的技術產品版圖,不同於常規的頻率提升或核心堆疊,這一次,AMD致力於解決後摩爾時代棘手的兩個矛盾——端側大模型對顯存帶寬的渴求與物理空間限制,以及光追遊戲畫質與性能的「零和博弈」。

從「Strix Halo」完全體AMD 銳龍AI Max+系列的落地,到銳龍AI 400系列的能效重塑,再到 FSR Redstone對圖形算法的AI化改造,AMD的角色正逐漸轉變為異構計算生態的「布局者」,從矽片邏輯、技術參數、場景落地與產業博弈,加速推進2026年PC產業的劇變。

01   AMD 銳龍AI Max+「核顯怪獸」撕裂「顯存牆」

在很長一段時間裡,移動端高性能計算設備運行AI應用時,常常存在難以逾越的鴻溝:「Windows陣營」擁有強大的獨立顯卡,但受限於顯存容量(VRAM)和 PCIe 總線帶寬,無法高效運行大規模AI模型;而蘋果陣營擁有統一記憶體架構(UMA),但封閉的生態讓遊戲與工業軟體的兼容性始終是痛點。

然而,AMD 銳龍AI Max+系列的推出,本質上則是x86 陣營對UMA 架構的暴力改革,也是對「移動工作站」形態的重新定義。

AMD 銳龍AI Max+系列或許可以定義為「反傳統」的產品。從規格上看,其集成了16 核Zen 5 CPU、40 個計算單元(CU)的RDNA 3.5 GPU,以及最高128GB的統一記憶體。這種組合建立在AMD對Chiplet(芯粒)封裝技術的深度運用之上。

CES2026撕碎顯存牆重塑光追夢打通生態路AMD開啟全新統治力

要理解這顆APU的定位,首先需要對「40 個 CU」建立直觀認知。對比來看,桌面級的 AMD Radeon RX 7600 XT僅有32個CU,而索尼PS5的GPU規模為36個CU。也就是說,AMD 銳龍AI Max+系列實際上是在移動端APU中,塞入了規模超越主流「甜點級」獨立顯卡的GPU核心。

與此同時,其AMD 銳龍AI Max+系列的RDNA 3.5架構針對低功耗場景下的電壓/頻率曲線(V/F Curve)進行了重新調校。其60TFLOPS(FP16)算力,正是這一性能密度設計的集中體現。這一指標直接指向了AI推理等高並行計算場景。

CES2026撕碎顯存牆重塑光追夢打通生態路AMD開啟全新統治力

其實,AMD 銳龍AI Max+系列設計的關鍵優勢,在於能否解決GPU 的「帶寬饑渴」問題。對於40個CU的GPU而言,傳統移動平台常見的128-bit雙通道DDR5 / LPDDR5X,約100GB/s的帶寬顯然無法支撐其持續滿載運行。但從AMD 銳龍AI Max+系列「工作站級」的定位,以及支持128GB的統一記憶體容量推斷,AMD 銳龍AI Max+系列的記憶體帶寬量級,完全可以避免GPU因等待數據而空轉。

從工程角度看,這意味著將原本更多用於伺服器或高端平台的記憶體控制器複雜度,下放到移動端。

而真正將這一架構「串聯」起來的,是AMD的零拷貝(Zero-Copy)機制。在傳統獨顯移動PC中,CPU計算完成後需要通過PCIe總線將數據傳輸至GPU顯存,這一過程存在顯著的延遲與功耗損耗。相比之下,在AMD 銳龍AI Max+系列的統一記憶體架構下,CPU、GPU 與 NPU直接訪問同一物理地址空間。這對於大模型推理而言,意味著數據搬運環節被徹底省去,模型加載與執行效率不再受制於總線瓶頸。

技術突破的價值,最終也要體現在具體的應用場景之上。基於AMD 銳龍AI Max+系列的統一記憶體架構與算力配置,可以明確諸多具有代表性的移動辦公應用範式。

其中的典型,一方面是AI Coding「本地閉環」式的開發環境。在以往的移動辦公PC上,大模型調試受制於顯存容量。以70B級的開源模型為例,即便經過量化處理,依然需要40GB以上的可用顯存,這使得本地開發只能依賴遠程雲伺服器完成推理與微調任務,隨之而來的則是高昂成本、網路依賴,以及數據外流風險。

AMD 銳龍AI Max+系列支持最高128GB統一記憶體,從根本上改變了這一約束條件。在該架構下,大模型不再被「顯存牆」所限制,而是直接由系統記憶體承載。結合AMD RDNA 3.5 GPU提供的FP16算力,百億乃至更大規模參數模型的本地推理成為可行選項。

同時,統一記憶體與零拷貝機制消除了CPU、GPU之間的數據搬運開銷,使得模型加載、推理與輕量級微調可以在本地形成完整閉環。在這一模式下,AI Coding便脫離了對雲端資源的剛性依賴。

另一方面,是影視後期製作中「實時工作流」的下沉。在傳統移動工作站形態下,高解析度影片處理高度依賴獨立顯卡顯存與持續供電能力。8K RAW 素材的解碼、降噪與調色,往往需要犧牲機動性,以換取性能穩定性;同時,CPU與GPU之間頻繁的幀緩衝交換,也迫使設計師要採用代理剪輯等折中方案。

反觀AMD 銳龍AI Max+系列的40 CU集成的GPU與128GB大容量統一記憶體,共同構成了高帶寬共享緩存池。影片解碼、特效計算與渲染結果可在同一物理記憶體空間內完成流轉,避免了跨設備拷貝帶來的延遲。這使得高解析度素材的實時預覽與調整,從「固定工作流」延伸至移動設備,複雜度顯著降低。

從典型的場景中可以看出,AMD 銳龍AI Max+系列的意義在於通過其獨特的UMA架構與算力密度的組合,重塑了移動端設備的能力邊界——原本只能在雲端或桌面級工作站完成的任務,開始具備在本地、在移動環境中完成的現實條件。

02   「集團軍」壓境  AMD 銳龍AI 400 橫掃主流戰場

如果說,AMD 銳龍AI Max+系列是AMD的「核武器」,那麼AMD 銳龍AI 400系列則是其在主流市場的「集團軍」。事實上,AMD在這一代產品中展現出了極強的戰術素養,其核心在於異構核心的精細調度與NPU的算力冗餘。

CES2026撕碎顯存牆重塑光追夢打通生態路AMD開啟全新統治力

以AMD 銳龍AI 400系列的AMD 銳龍AI 9 HX 475為例,其12核心配置了4個Zen 5 超大核+8個Zen 5c「大核」。

當然,這裡需要糾正一個誤區:Zen 5c並不是E-core(能效核)。其擁有相同的基礎架構、完整的指令集(包括 AVX-512)和相同的IPC(每時鐘周期指令數),僅僅是通過縮減緩存和降低頻率上限來換取更小的核心面積。

這一設計的技術邏輯非常清晰。在移動端,大多數瞬時高負載(如打開網頁、啟動 App)需要2~4個高頻核心瞬間響應。而後台的AI代理、影片會議、數據同步等多任務並行,更適合由8個低功耗的Zen 5c 核心來吞吐。這種配置在15W~54W 的黃金TDP區間內,能效比收益則達到更高。

而在NPU方面,AMD 銳龍AI 400系列的算力出現了明顯的分級(AI 9 HX 475為60 TOPS,AI 9 HX 470為55TOPS,AI 9 465/AI 7 450等為50 TOPS)。這揭示了AMD的 Binning(晶片分級)策略。其XDNA 2架構引入了對BFP(Block Floating Point 16)數據格式的支持。BFP結合浮點數的動態範圍和定點數的計算效率,可在保持精度的前提下大幅提升吞吐量。60 TOPS的算力則意味著NPU有足夠的餘量在運行微軟Windows 11 AI+PC(40 TOPS)的同時,還能分出算力給第三方的本地Agent。 

算力的餘量在於為軟體形態的演進預留空間。AMD此次展示的AI Agent Framework,正是圍繞 AMD 銳龍AI 400系列,對商用辦公場景的系統級重構。

傳統移動PC的架構在使用影片會議時,背景虛化、實時轉錄、翻譯等功能,通常由CPU  GPU以「搶占式」的方式完成。這種模式抬高了瞬時負載,也直接推高了整機功耗,導致風扇頻繁介入、電池續航縮短,體驗上始終存在結構性瓶頸。

而利用AMD 銳龍AI 400系列,上述問題的解決路徑,變成了計算任務的重新分配。依託AI Agent Framework,視覺處理、語音識別與實時文本轉錄等持續性AI任務,由NPU獨立承載。這背後,在於NPU以極低功耗完成長時間穩定運行。

與此同時,後台的業務分析類Agent(如本地表格處理、數據清洗等任務),則優先運行在Zen 5c核心之上,僅在必要時才喚醒高性能超大核參與計算。這種分層調度機制,使得整機在多Agent 並行運行的情況下,依然能夠維持較低的平均功耗水平。

結果上,則體現出更持續、更穩定的狀態。影片會議、實時轉錄、翻譯與後台分析可以同時進行,不會引發系統整體負載飆升。在長時間使用場景下,電量消耗與機身熱量均得到有效控制。

這也意味著,AI不再以高功耗形式介入系統,而是以基礎能力的方式,融入到日常辦公之中。

從這一角度看,AMD 銳龍AI 400系列與AI Agent Framework的組合,則標誌著商用辦公從「功能疊加」,邁入了「異構協同、長期運行」的新階段。

03   代號「Redstone」FSR 終結光追焦慮

在遊戲圖形領域,CES 2026上,AMD展示了其代號「Redstone」的全新FSR技術套件(下稱「FSR Redstone」)。

FSR Redstone的優勢,在於其底層算法全面轉向機器學習驅動。這是明確的戰略轉折,意味著AMD 正式將AI視為實時圖形渲染體系中的核心組成部分,而非輔助工具。

其中最關鍵的技術突破,是光線重建(Ray Regeneration)。在實時光線追蹤中,由於算力預算有限,每像素可投射的光線數量(SPP)極低,直接導致原始渲染結果噪點密集。傳統方案依賴人工設計的降噪器(Denoiser)對結果進行平滑處理,但這種方式往往以犧牲高頻細節為代價,產生明顯的「塗抹感」與畫面不穩定問題。

FSR Redstone通過引入訓練完成的深度神經網路(DNN),用學習式重建替代了規則驅動的降噪流程。該網路基於低SPP的噪點圖像、運動矢量,以及幾何緩衝數據,對光照與反射資訊進行預測與重建,從而恢復更完整的光影細節。在提升畫質的同時,這一方案還取代了計算負擔較重的傳統降噪流程,反而在整體上降低了GPU的實時計算壓力。

此外,FSR Redstone 還結合了輻射緩存(Radiance Caching)技術,通過對光照結果進行預測與緩存,減少重複的BVH(包圍體層次結構)遍歷和光線求交計算,進一步提升了光追場景下的效率。

在3A遊戲場景中,FSR Redstone 的改進集中體現在「穩定性」與「細節完整度」維度。以高複雜度光追場景為例,傳統方案下常見的反射噪點、細小幾何體閃爍(Shimmering),以及幀率波動,在光線重建介入後得到顯著緩解。積水路面的倒影更加清晰,間接光照的過渡更為自然,高頻閃爍現象明顯減少。

在此基礎上,配合基於機器學習的幀生成技術,4K解析度下的高幀率光追體驗不再局限於旗艦級顯卡。從結果來看,FSR Redstone解決了長期存在的核心矛盾。光追不再意味著「性能不可接受」,而關閉光追也不再是畫質妥協。這使得光線追蹤轉變為真正具備普遍可用性的渲染選項。 

04  「狂飆」5.6GHz  AMD 銳龍7 9850X3D讓「1% Low」幀數穩如磐石

在AI的喧囂之外,AMD也沒有忘記它的基本盤。AMD 銳龍7 9850X3D,既是對「更強遊戲 CPU」名號的衛冕,也是對物理極限的一次挑戰。

回顧從前,AMD 銳龍7 7800 X3D的最大加速頻率在5.0 GHz,原因是堆疊在計算核心上方的3D V-Cache對電壓和溫度極度敏感。

而AMD 銳龍7 9850 X3D能跑到 5.6 GHz,這說明AMD在利用TSMC SoIC(System on Integrated Chips)封裝技術上的新突破。

在高幀率電競與高質量直播並行的場景下,前台遊戲對低延遲與穩定幀時間高度敏感,而後台推流、虛擬形象與音頻處理則持續消耗CPU 計算資源。為避免相互干擾,職業級主播普遍採用雙機推流方案,以物理隔離換取穩定性。

而搭載AMD 銳龍7 9850X3D的平台,可以提供單機層面的解決路徑。

在遊戲側,大容量的「L2+L3 」緩存(104MB)顯著降低了記憶體訪問延遲,使得《CS2》《無畏契約》等對幀時間極其敏感的電競遊戲,能夠維持1% Low的表現,從而有效抑制微卡頓現象,為超高刷新率顯示器提供穩定輸入。

在後台任務側,AMD 銳龍7 9850X3D可依託5.6 GHz 的運行頻率與Zen 5架構的IPC 優勢,同時承載高碼率OBS推流、虛擬形象捕捉,以及AI語音降噪等持續性負載,且不對前台遊戲線程形成明顯擠占。

CES2026撕碎顯存牆重塑光追夢打通生態路AMD開啟全新統治力

05  軟硬合璧  ROCm 7.2 為億萬 Windows用戶鋪平AI道路

再強的硬體,如果無法進入主流開發環境,其價值終究難以釋放。

本次CES 2026上,AMD推出ROCm 7.2,這是其軟體生態建設中的關鍵一步,目標直指廣泛的開發者使用場景。

ROCm 7.2的核心進展,在於 HIP(Heterogeneous-Compute Interface for Portability)在Windows及Linux平台上的完整落地。這使得基於HIP的PyTorch等代碼,可以在Windows等環境中直接運行在AMD Radeon RX 9000系列及銳龍AI系列上,僅需極少量適配,甚至無需配置。

 這一變化顯著降低了平台切換與環境維護成本。同一套代碼在不同作業系統間復用,開發流程更加連續。與此同時,AMD對底層矩陣乘法庫進行了針對性優化,使ROCm 7.2在 Windows環境下的推理性能相較舊版本實現了大幅提升,為實際應用提供了更穩定的性能基礎。

在AI創作與學習場景中,工具鏈複雜度往往構成隱性門檻。過去,許多框架與工作流依賴特定系統環境,部署與調試成本較高,限制了更廣泛人群的參與。

ROCm 7.2對Windows 的支持,使這一狀況發生轉變。AI工具可以在Windows系統中完成一站式部署,底層環境由系統自動配置,減少了對系統知識與手動排錯的依賴。在此基礎上,主流模型與插件的運行路徑趨於標準化,社區支持與經驗復用的效率同步提升。

當AI開發與創作不再被環境複雜度所阻擋,更多學習者與創作者才能進入這一生態,軟體能力才具備持續演進的土壤。

06 寫在最後

綜觀AMD在CES 2026展示的技術產品矩陣,不難看出清晰的戰略主線——以體驗為中心的算力重構。

AMD並沒有在單純的CPU頻率或GPU規模單一維度進行「消耗戰」,更多是利用Chiplet 和異構架構的靈活性,進行了精準的戰略布局。

AMD 銳龍AI Max+系列用「統一大記憶體」切入AI開發者的剛需,開闢移動AI高性能工作站的新藍海,加快占據更高的生態位。AMD 銳龍AI 400系列用「NPU 分級設計與能效核心」解決了移動辦公用戶對續航和隱私的焦慮,重新定義了主流移動PC的標準。FSR Redstone 用「AI 重構圖形」補齊了光追畫質的短板,讓顯卡算力花在刀刃上。AMD 銳龍7 9850X3D用「封裝技術的突破」鞏固了遊戲王座,滿足極客用戶挑剔的需求。

對於消費者、移動辦公用戶而言,2026年或許也是換機的絕佳時刻。畢竟,當強大的本地算力真正打破從靈感到落地的最後一道屏障,計算設備便成為了延伸人類智慧的「第二大腦」。

這,或許也是AI PC深度進化的下一個形態。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新