眾所周知,企業(特別是超大規模基礎設施運營商和雲服務商,但如今越來越多的普通企業也開始向生成式AI積極展開懷抱)正在AI加速器和相關晶片上投入巨額資金,旨在建立起屬於自己的AI訓練與推理集群。
但要說其間到底燒掉了多少真金白銀,恐怕沒有多少人說得清楚。各種媒體上的相關數字滿天飛,但由於我們很難劃清AI晶片與其他計算系統間各類組件的界線,特別是無法斷言伺服器被製造並銷售出去之後到底會被用作何途,所以AI市場的整體規模也總是隔著一層神秘的面紗。舉例來說,我們到底該如何判斷一台裝滿GPU的設備到底運行著多少AI負載或者高性能計算類應用?
去年12月,我們曾經深入研究過IDC發布的生成式AI支出預測。這份預測報告非常有趣,因為其中將生成式AI工作負載同其他類型的AI應用區分開來,並討論了構建生成式AI系統的硬體、軟體與服務支出。此外,我們還參考了AMD公司CEO蘇姿豐在2022年和2023年針對各類數據中心AI加速器(包括GPU及所有其他晶片)提出的初始與修訂後的目標市場總規模。
可能很多朋友已經不太記得,蘇姿豐表示數據中心AI加速器的總目標市場在2023年內約為300億美元,並將以約50%的複合年增長率到2027年底膨脹至1500億美元以上。但一年之後,隨著生成式AI熱潮的興起,以及去年12月發布的「Antares」Instinct MI300系列GPU,蘇姿豐稱AMD預計數據中心AI加速器的市場規模在2023年內就將達到450億美元。隨後的複合年增長率則將超過70%,意味著到2027年全球市場總規模將達到4000多億美元。
而這還僅僅只是加速器,不包括伺服器、交換機、存儲和軟體支出。
來自New Street Research的Pierre Ferragu團隊在科技領域一直擁有出色表現,也曾嘗試對這塊價值4000億美元的數據中心加速器蛋糕進行過細分,並在推特上發布了以下預測:
這仍然是個極為龐大的數字,即預計到預期結果間,AI伺服器、存儲和交換機的總目標市場銷售額將達到1萬億美元左右。
讓我們回到現實。2024年伊始,我們從富國銀行股票研究公司董事總經理兼技術分析師Aaron Rakers那裡獲得了GPU銷售預測結果,並將其整理成了電子表格。這套預測模型涵蓋了從2015年到2022年數據中心領域的GPU銷售金額,對2023年做出了預測(當時2023年尚未結束)並一路展望至2027年。富國銀行的模型同樣做出了預訂,只是比AMD要提前幾個月,後者表示2024年的GPU銷售收入將達到40億美元(我們則認為應該會達到50億美元)。
無論如何,富國銀行的模型顯示2023年的GPU銷售額為373億美元,全年出貨量為549萬張。不僅僅是高端GPU,包括所有類型的GPU在內,其總出貨量幾乎翻了一番。GPU收入則增長至3.7倍。預計2024年數據中心GPU出貨量將為685萬張,增長24.9%;收入則為487億美元,增長28%。2027年預計GPU出貨是為1351萬張,推動數據中心GPU銷售額來到953億美元。按照該模型,英偉達在2023年的市場收入份額高達98%,到2027年則將下降至87%。
這就是我們目前掌握的情況。Gartner和IDC最近也都發布了一些關於AI半導體銷售的統計數據和預測,值得大家認真分析。我們也據此嘗試著估算出AI晶片的當前情況以及未來幾年的走勢。這些企業的公開報告一直不願披露更多真實數據(畢竟這是他們的生計來源),但在字裡行間內已經足夠提供一些值得我們利用的有價值內容。
讓我們先從Gartner開始。大約一年之前,Gartner曾經發布一份關於2022年AI半導體銷售情況的市場研究報告,並預測了2023年及2027年的銷售情況。幾周前,Gartner又發布了一份修訂之後的預測報告,對2023年進行了重新歸納,同時就2024年及2028年銷售做出展望。第二報告的市場研究部分同樣包含一些統計數據,我們將其添加到下表當中:
我們假設計算電子產品包括個人電腦和智慧型手機,但構建這套模型的Gartner副總裁兼分析師Alan Priestly也強調,到2026年所有在售的PC晶片都將屬於AI PC晶片,因為屆時一切筆記本電腦和台式機CPU都將包含某種神經網路處理器。
這裡我們主要關注用於加速伺服器的AI晶片,這部分晶片收入(假設不包括附帶的HBM、GDDR或者DDR內存的價值)在2023年內為140億美元,到2024年預計將增長50%來到210億美元。但估計2024年至2028年期間伺服器AI加速器的複合年增長率僅為12%左右,因此最終銷售額將達到328億美元。Priestly指出,定製AI加速器(如TPU以及亞馬遜雲科技打造的Trainium和Inferentia晶片,這裡僅舉兩例)在2023年僅實現了4億美元收入,到2028年的收入也只會達到42億美元。
如果AI晶片占計算引擎總價值的一半,而計算引擎又占系統總成本的一半,那麼這些相對較小的數字加起來同樣有望給數據中心AI系統帶來相當可觀的收入。當然,這同樣取決於Gartner在哪裡劃線,包括螢幕前的各位如何設定這條類別邊界。
現在,讓我們再來看IDC發布的AI半導體與AI伺服器市場預測。該公司幾周之前亮出了下面這張有趣的圖表:
在這份圖表中,IDC匯總了數據中心及邊緣環境下使用的CPU、GPU、FPGA、定製ASIC、模擬設備、內存以及其他晶片的全部收入。之後IDC又提取了計算、存儲、交換機及其他設備的收入,因為這些設備也是AI訓練及推理系統中的組成部分。請注意,這些構成的並非全體系統的價值,而是系統中所有晶片的價值,所以並不包含機箱、電源、冷卻、主板、轉接卡、機架、系統軟體等要素。如大家所見,這份圖表包含2022年的實際數據,並對2023年至2027年的結果做出了估計。
這張圖表資訊密度確實有點大,所以待我們慢慢為您解讀。在IDC的分析當中,半導體市場中AI部分將從2022年的421億美元增長至2023年的691億美元,意味著2022年到2023年之間的增長率為64.1%。至於今年,IDC認為AI晶片收入(不僅涵蓋XPU的銷售數字,還包括數據中心和邊緣AI系統中的所有晶片收入)將增長70%,來到1175億美元。如果計算2022年到2027年之間的數字,IDC估計數據中心及AI系統內AI晶片總收入將保持28.9%的複合年增長率,最終在2027年來到1933億美元大關。
這份圖表來自今年5月底發布的博文,內容則基於2月的一份報告。所以在分析其內容時,應當考慮到這部分時間差。
在這篇帖子中,IDC還添加了一系列伺服器收入數據,並將AI伺服器與用作其他工作負載的伺服器區分開來。我們將原始IDC伺服器數字整理成了電子表格,希望根據IDC公布的真實數據算出2023年10月的AI伺服器支出。
IDC估計,2023年全球伺服器銷售數量將下降19.4%,來到略低於1200萬台。但由於AI伺服器的平均售價非常高(根據我們最樂觀的猜測,其價格可能相當於支持常規基礎設施應用類通用伺服器的45倍到55倍),因此AI伺服器的收入(基於我們去年對2022年AI伺服器收入的98億美元估算結果)增長至3.2倍,達到313億美元,占市場份額的23%。IDC預計,到2027年AI伺服器的銷售額將達到491億美元。IDC並未透露其對2027年伺服器收入的最新預測,但認為截至2023年底這個數字應該是1891.4億美元。
順帶一提,根據IDC對於伺服器市場的劃分方式,使用CPU上原生矩陣或向量引擎實現AI負載執行的設備不被劃入加速器類別,因此在我們的語境下並不屬於「AI伺服器」。
總而言之,我們認為目前各方對2027年AI伺服器收入的預期太低,或者說對2027年整體伺服器收入的預期太高。我們仍堅持相信,到2027年具備某種加速功能的AI伺服器將在總收入中占據接近半數,且屆時數據中心將迎來大量加速設備與生成式AI工作負載。
當然,對此我們也沒有明確的證據,但後續將密切關注市場的相關動向。