過去三年,GPU 幾乎承包了所有關於 AI 基礎設施的想像。
英偉達
的市值、雲廠商的資本開支
、模型公司的訓練節奏,最後都被折算成同一個問題:誰能拿到更多 GPU,誰就更接近下一輪 AI 競賽的入場券。
但在剛過去不久的 2026 年 COMPUTEX 主題演講的舞台上,英偉達創始人黃仁勛講出的新故事,已經不只圍繞 GPU 展開。

他一邊推出面向個人 Agent 的 RTX Spark 處理器
,把 PC 從「打開應用」重新定義成「提出需求、電腦執行」的新設備;另一邊,又把英偉達第一顆自研數據中心 CPU Vera 推到台前,稱它將成為新的主要增長動力,並指向一個 2000 億美元規模的 CPU 市場。
究其原因,伴隨著 Agent 浪潮的到來,只堆 GPU,已經不夠了。GPU 仍然負責最核心的模型推理,但每一次推理前後,都需要 CPU 處理編排、調度、工具調用和數據流動。
CPU,正在變成 AI 基礎設施的新焦點。
CPU,正殺回 AI 算力的牌桌
CPU 需求回升,首先來自 AI 應用形態的變化。
生成式 AI 爆發早期,行業重心幾乎都在模型訓練上。訓練要處理海量並行矩陣計算,這是 GPU 的強項。CPU 主要負責系統初始化、數據搬運、任務管理等輔助工作。
於是過去幾年,「重 GPU、輕 CPU」幾乎成了行業共識。但隨著 AI 從大模型訓練走向大規模推理,再進一步進入智能體時代,工作負載的性質開始變了。
智能體不是「問一句、答一句」的線性系統。它會把一個複雜任務分成多個步驟,調用外部工具,讀寫資料庫,執行搜索,運行代碼,處理權限驗證,管理上下文緩存,再判斷當前結果是否有效,並決定後續動作。

圖片由 AI 生成,僅供參考
一個用戶請求,可能同時觸發幾十個甚至上百個子智能體並行工作。這些編排、工具調用、內存管理,以及子智能體之間的協調,主要不在 GPU 上完成。
GPU 仍然可以負責模型推理,也就是最接近「思考」的那一步。但在兩次推理之間,CPU 要解析模型輸出,判斷接下來該調用哪個工具,管理執行計劃,處理文件讀寫,發起網路請求,再把結果重新交給 GPU。
英特爾一位副總裁曾用一個比喻解釋:智能體工作流
本質上是一組獨立智能體的協作。幾十上百個智能體要互相通信,就需要不同的「位置」來運行,而這些位置指的就是 CPU。

研究數據也支持這一判斷。喬治亞理工與英特爾在 2025 年 11 月的一篇論文中指出,在智能體工作負載中,CPU 上的工具處理環節占總延遲的 50% 到 90%。
也就是說,很多時候真正讓用戶等待的不是 GPU 本身,而是 GPU 在等待 CPU 完成工具調用、數據處理和任務安排,再把下一批輸入送過來。
滙豐證券研究報告則給出另一個角度:在現代智能體工作流中,而這個市場需要 CPU、GPU、ASIC 等多種技術並存。
然而,六到十二個月前,市場還很少討論 CPU,也沒人認為 CPU 會緊張。但隨著推理需求上升,CPU 重新回到舞台中央。在她
看來,未來五年,數據中心 CPU 市場的年複合增長率將超過 35%,遠高於過去幾年個位數的增速。

產品上,AMD 把重點放在代號 Venice 的第六代 EPYC 處理器上。
這款產品是行業首個在台積電 2 納米工藝節點上進入量產爬坡階段的高性能計算晶片。後續衍生型號 Verano 還將引入 LPDDR 內存集成技術,專門應對智能體帶來的大容量內存需求。
在第六代 EPYC 全面鋪開前,AMD 第五代 EPYC 已經憑藉高核心密度和能效比站穩市場。財報數據顯示,2025 年第四季度,AMD 數據中心業務營收達到創紀錄的 54 億美元,同比增長 39%。

英偉達的邏輯則稍稍不同。
英偉達想的則是讓自家最好的 GPU 不被外部組件拖慢。比起與英特爾、AMD 打價格戰,真正的算盤是消除外部 CPU、PCIe 總線和低速網路對 GPU 效率的拖累,把 CPU 內化成自家專有 AI 平台的一塊拼圖。
順著這個思路,英偉達拿出了首款定製 CPU Vera,專為 agentic AI
的編排、工具調用和長上下文管理設計,黃仁勛還把它定位成公司下一個數十億美元級的業務,並預測 Vera 將讓英偉達進入一個 2000 億美元的 CPU 市場。
最近,英偉達超大規模與高性能計算副總裁 Ian Buck 也將首批英偉達 Vera CPU
系統交付至 Anthropic、OpenAI、Oracle Cloud Infrastructure 以及 SpaceXAI。

參數顯示,Vera 搭載 88 個英偉達自研 Olympus 核心,兼容 Armv9.2 指令集,並在 CPU 層面原生支持 FP8 精度運算。
為了解決傳統超線程可能帶來的性能波動,Vera 採用空間多線程技術
,在物理層面對核心資源做硬分區,提供 176 個硬體線程,讓每個線程在處理複雜邏輯分支時獲得更穩定的尾部延遲表現。

而吃到這波 CPU 紅利的,還有昔日霸主英特爾。財報顯示,英特爾一季度 (Q1 2026)營收為 136 億美元,同比增長 7%,淨利潤同比暴增 156%。
英特爾 CEO 陳立武表示,基於 Intel 3 的至強 6 產品和基於 Intel 18A
的酷睿系列 3 產品已全面進入量產爬坡階段,但他也表示,英特爾尚未能完全滿足市場需求,增長勢頭預計將持續到明年。

面對 CPU 市場需求的暴漲,整個 AI 產業鏈正在進入一場圍繞先進制程產能的爭奪。
亞馬遜、微軟等超大規模雲廠商,以及蘋果、英偉達、AMD 等晶片設計巨頭,都在爭奪有限的代工窗口
。不過,在這場競爭中,利潤率更高、晶片面積更大的數據中心 GPU 訂單,依舊在擠壓通用 CPU 的生產配額。
在本就吃緊的 CPU 產能里,晶片廠會優先滿足利潤更高的伺服器訂單,緊張也最先在伺服器 CPU 這一端顯現,並傳導到價格和交期上。
英特爾已向中國客戶預警,部分伺服器 CPU 的交付周期長達六個月;AMD 部分產品的交期也延長到八到十周。英特爾在中國市場的伺服器晶片價格上漲超過一成,而中國市場占其總營收兩成以上。

與此同時,全球內存嚴重短缺又帶來提前囤貨效應。客戶為了鎖定整機系統價格,紛紛提前採購 CPU,使原本緊張的供給更加吃緊。
伺服器這邊吃掉了大部分產能,代價就傳遞到了消費端。面向個人和普通企業市場的 CPU 生產線被排到後面,大眾市場供應隨之趨緊、價格上行,出價更高的大客戶優先拿貨,普通採購方只能排隊。換句話說,AI 越火,你的下一部電腦很可能就越貴。
簡言之,AI 算力擴張帶來的壓力,正在沿著伺服器產業鏈向外擴散:GPU 、CPU、內存、DPU、高頻寬網路交換機、先進封裝、液冷散熱、整機櫃供電,任何一個環節跟不上,都會影響最終的算力交付。
AGI 無法逃離基礎設施的地心引力,它只是繞了一大圈,又回到了最樸素、卻最有殺傷力的現實中:先有龐大的能源,再有精密的機器系統,最後,才有可能誕生真正的智能。






