亞馬遜雲科技(AWS)的晶片業務正處於爆發式增長階段,自研晶片Trainium的性價比已超越英偉達
,企業客戶對AI算力的渴求甚至達到了試圖買斷全部可用容量的程度。
這些資訊來自亞馬遜CEO安迪·賈西在2025年年報中寫給股東的一封長達八頁的信。賈西的表態清晰反映出企業界對AI的全力押注,以及亞馬遜主導這場技術變革的雄心——在他看來,AI將像電力一樣深刻改變世界。
Info-Tech研究集團顧問研究員史考特·比克利指出:"綜合來看,AWS正在深入布局,全面掌控AI技術棧的每一層:底層是電力和數據中心,中間層是自研晶片,頂層是訓練與推理能力。"
算力供不應求,兩家大客戶試圖買斷Graviton全部產能
AWS在2025年新增了3.9GW的電力容量,並預計到2027年底將總電力容量翻倍。但賈西坦言:"即便如此,我們仍面臨容量瓶頸,存在無法滿足的需求。"
他特別透露,有兩家大型客戶因AI算力需求極為迫切,希望買斷AWS自研CPU晶片Graviton在2026年的全部實例容量。他強調,考慮到其他客戶的需求,AWS無法答應此類請求。
Moor Insights & Strategy副總裁兼首席分析師麥特·金博爾表示:"兩家大客戶試圖買下AWS全年的Graviton產能,這已經說明了市場現狀的一切。"
他認為,這不僅僅是供應鏈問題,更是一種"戰略性依賴"——企業爭搶算力,不只是為了自身需要,更是為了在競爭對手之前鎖定資源。"AWS面臨的風險不是建設速度不夠快,而是受限的客戶可能轉向Azure或谷歌雲平台(GCP)。"
這一現象也說明Graviton的受歡迎程度已遠超預期。金博爾指出,Graviton如今承載的不再是"輕量級晶片支撐輕量級工作負載",而是覆蓋了多種不同計算需求的複雜工作場景。他預測,隨著Azure Cobalt和谷歌雲Axion處理器的成熟,類似需求同樣會出現,屆時Arm與x86架構之間的市場競爭將更加有趣。
比克利也認同供應鏈瓶頸對AI基礎設施建設的影響"既廣泛又深遠"。即便有報道稱2026年約50%的規劃AI數據中心產能將無法落地,"眼下市場上的資源依然全面售罄"。
Trainium超越英偉達?性價比領先30%
進入2026年,賈西用"烈火燃燒"來形容亞馬遜的晶片業務。儘管AWS與英偉達保持著緊密合作並廣泛使用其半導體產品,但賈西認為處理器市場正在經歷一場"新的轉變"——客戶越來越看重性價比。
亞馬遜於2024年底發布了第二代自研AI晶片Trainium2,Amazon Bedrock平台目前已將大部分推理任務遷移至這款新一代加速器。賈西聲稱,Trainium2相比同類GPU性價比提升約30%,且"基本售罄"。
剛剛開始出貨的Trainium3,性價比較Trainium2又提升了30%至40%,目前"幾乎已被全額預訂"。更值得關注的是,距離大規模上市還有約18個月的Trainium4,其相當一部分產能已提前被預留。
"我們晶片的需求旺盛到了一個程度,以至於未來很可能會向第三方整機架銷售,"賈西表示。
比克利指出,亞馬遜的目標並非取代英偉達,而是在"AWS具備經濟性優勢的領域"降低對英偉達的依賴。AWS能夠通過與Bedrock的深度集成、自研互聯架構、更高效的Token經濟模型,以及基於PyTorch/JAX/vLLM標準工作流構建的軟體棧,提供差異化的性價比方案。
Trainium的核心應用場景是大語言模型、多模態模型及擴散Transformer的訓練與推理,參數規模覆蓋數千億至萬億級別。Anthropic和Uber等知名客戶正在實際驗證AWS的效率承諾;而Cohere和Stability AI等則更傾向於英偉達成熟的工具鏈和更強的晶片設計能力,並對AWS的服務穩定性提出了質疑。
金博爾還提到,AWS與Cerebras的合作同樣值得關注。Trainium擅長預填充(prefill),Cerebras CS-3擅長解碼(decode),兩者結合可在無需用戶干預的情況下實現最優推理性能。"這正是企業用戶所追求的'即點即用'的簡單體驗。"
在他看來,賈西正在用Trainium複製Graviton當年顛覆x86的路徑——在推理這一"企業AI中增長最快、對成本最敏感的工作負載"領域,Trainium正在取得最為顯著的進展。
76天造出推理引擎Mantle,6名工程師完成大規模重建
賈西在信中還強調,敢於推倒重來、"重新定向"的能力至關重要。以Amazon Bedrock為例,它最初快速構建並超預期擴展,但團隊隨後意識到,平台所需的不是小修小補,而是一套全新的推理引擎。
為此,Bedrock團隊藉助AWS智能體編程服務Kiro,組建了一支由6名"極具實力的工程師"構成的小組,在76天內交付了全新推理引擎Mantle。Mantle隨即成為Bedrock的核心支柱——賈西表示,Bedrock在2026年第一季度處理的Token數量,超過了此前所有年份的總和。
比克利認為,如此小的團隊在如此短的時間內完成如此大規模的重建,並同步上線有狀態對話管理、異步推理、更高默認配額等功能,"初看之下確實令人印象深刻"。他表示:"Mantle本身就應被視為一款重要的推理產品。"
金博爾則認為Mantle的誕生背後其實是"兩個故事":一是運營層面的(Bedrock需要新架構),二是效率層面的——6名工程師藉助智能體工具,完成了40人團隊也難以更快交付的工作,"項目周期、團隊規模、自研還是採購的決策邏輯,都將因此發生根本性轉變"。
"Mantle不只是一次重建,它是AI輔助開發正在改變行業邊界的又一個有力佐證,"金博爾說,"不是理論層面,不是營銷話術,而是真實發生在生產環境中的事。"
賈西最後寫道:"進步不會是線性的。會有加速的時刻,也會有需要調整方向的時刻。我們會持續實驗,向重要的事情傾斜資源,在不奏效時果斷收手。"
Q&A
Q1:AWS的Graviton晶片為什麼會出現被客戶試圖買斷的情況?
A:根據亞馬遜CEO賈西的股東信,兩家大型客戶希望買斷AWS自研CPU晶片Graviton在2026年的全部實例產能,原因是AI算力需求極為旺盛。分析師指出,這不只是供應鏈緊張的問題,更是一種"戰略性依賴"——企業爭相鎖定資源,是為了防止競爭對手搶先占據算力優勢。AWS已明確表示無法接受此類獨占請求,但這一現象充分說明Graviton已從輕量級晶片演變為承載複雜多樣計算需求的核心平台。
Q2:Trainium2和Trainium3相比英偉達GPU性價比究竟高多少?
A:根據賈西的說法,Trainium2相比同類英偉達GPU性價比提升約30%,目前已基本售罄。剛開始出貨的Trainium3在此基礎上再提升30%至40%,幾乎已被全額預訂。距離大規模上市還有約18個月的Trainium4也已有相當一部分產能被提前預留。Trainium主要面向大語言模型、多模態模型等大規模AI訓練與推理場景,Anthropic、Uber等頭部客戶正在實際使用中驗證其效率表現。
Q3:Bedrock推理引擎Mantle是怎麼做出來的,6個人76天完成意味著什麼?
A:AWS的Bedrock團隊在發現原有推理架構無法滿足需求後,藉助AWS智能體編程服務Kiro,組建了一支6人工程師團隊,在76天內完成了全新推理引擎Mantle的開發。Mantle上線後迅速成為Bedrock的核心,2026年第一季度處理的Token量超過此前所有年份的總和。分析師認為,這說明AI輔助開發正在重塑工程效率的邊界,團隊規模、項目周期乃至自研與採購的決策邏輯都將因此發生根本性改變。






