宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

AI熱潮正在拉動數據中心基礎設施支出

2023年10月04日 首頁 » 熱門科技

AI熱潮正在拉動數據中心基礎設施支出

如果說有哪種事物絲毫不受通脹態勢的抑制,甚至在一定程度上加劇了全球經濟的通脹壓力,那必然就是生成式AI。從我們目前掌握的關於全球伺服器和存儲支出的有限數據來看,AI基礎設施支出似乎已經成為伺服器和存儲領域的收入支柱。相比之下,面向其他類型工作負載的數據中心設備基礎支出則每況愈下,目前的銷售態勢甚至不及今年年初。

坦白講,核心伺服器與存儲市場正在陷入衰退。這是因為企業暫停行動,超大規模基礎設施運營商仍在「消化」去年年底已經採購的基礎設施。行業內唯一仍然保持旺盛活力的,就只有AI系統以及伴隨而來的爆發式需求增長。

事實上,傳統HPC仿真與建模社區一直都夢想讓「高性能計算」迎來這樣的爆發式增長,但卻從來未能如願。其實這頗有幾分遺憾,因為人們普遍認為,HPC在幫助我們創造新成果或修復舊方案時的貢獻要高於生成式AI。更不要說生成式AI中還潛藏著一種巨大隱患——直接在「適當的時候」消滅無數工作崗位。正因如此,亞馬遜公司首席執行官Andy Jassy在討論全球經濟的長期趨勢時,才總把這種威脅掛在嘴邊。

有點跑題了,但大家要記住上述前提條件,我們繼續對數據中心基礎設施市場展開分析。

大學物理教授曾經教導我們,在開始解決問題之前要先對答案做個粗略的估計,並在處理過程中不斷糾正錯誤。因此讓我們從今年夏初的傳聞說起,即英偉達在整個2023年內只能生產約50萬個「Hopper」H100 GPU。

假設英偉達的合作渠道商制定的H100 GPU平均售價為3萬美元,那麼單憑H100銷量就能支撐起150億美元的收入。IDC等公司也是據此計算季度收入數字的。但如果假設隨著2023年的推進,這50萬個H100 GPU在各季度的分布並不均衡(例如第一季度生產18%,第二季度生產22%,第三季度為27%,第四季度為33%),那麼在合理的增長猜測之下,H100 GPU單在2023年第二季度就能帶來33億美元銷售額。而如今的普通數據中心系統往往要搭載8個這樣的GPU,同時匹配與英偉達DGX H100類似的內存、閃存和網路接口。由此可知,這些基於H100的GPU型系統將帶來約52億美元的總銷售額。再加上英偉達其他加速器和可以進行大規模矩陣數學計算的在售加速器,也許其單憑AI熱潮就能斬獲約70億美元的收入數字。

下圖所示,為我們整理的粗略估算表,僅供大家參考:

AI熱潮正在拉動數據中心基礎設施支出

根據IDC公布的歷史數據,在這波生成式AI浪潮之前,伺服器的平均售價為7000美元——數字來自機器學習占據AI主流,大規模HPC系統保持穩定,IBM剛剛對大型機/Power Systems進行升級的2021年。(這也是IDC最後一次向公眾發布季度伺服器跟蹤報告。)

而在對IDC剛剛發布的2023年第二季度數據中心基礎設施支出數據進行切片剖析之後,我們認為390億美元支出總額中的很大一部分都來自AI系統。如果按照我們前面提出的70億美元預估數字來計算,那麼用於支撐其他類型工作負載的全部基礎設施該季度支出將為320億美元。而且可以看到,2023年第二季度伺服器與存儲基礎設施的整體支出僅增長了1.3%,要比IDC今年4月報告的第一季度8.2%的增幅要低得多。當然,第一季度與第二季度間出現連續增長絕對是件好事,從第一季度的358億美元起步,現在我們正逐步向著2022年第三季度的407億美元回歸,也期待這波生成式AI的革命能拉動市場重回2022年第四季度的428億美元支出峰值。

以下是IDC在2021年推出的數據中心伺服器存儲模型的匯總數據,其中消除了伺服器與存儲銷售額之間被重複計入的部分。對於超大規模基礎設施運營商和雲服務商來說,所謂存儲已經不再是純粹的存儲,而是大容量磁盤/閃存加上較弱CPU的組合。在這種情況下,我們該如何劃分,它算是伺服器還是存儲?IDC認為全都算,也就是說除非能搞清楚IDC在計算中使用的原始數據,否則我們根本沒法搞清二者的確切數字。

下表所示,為2020年第一季度至2023年第二季度期間用IDC新方法統計得出的雲與非雲基礎設施支出數據:

AI熱潮正在拉動數據中心基礎設施支出

表中紅色粗體的部分,是我們為了填補數據空白而添加的估計值。

因為上個禮拜2023年的第三季度才剛剛過去,所以目前還沒有可用的數據。加上IDC也需要一段時間來核對上市企業的所有財務數據,包括構建數據中心支出模型,所以我們可能要到2024年1月才能看到今年第三季度的統計結果。

在今年第二季度,超大規模基礎設施運營商和雲服務商在共享雲基礎設施(同時涵蓋伺服器和存儲,但不包括網路)上的支出增長了13.7%,達到179億美元;但在專用雲基礎設施方面的支出(也就是成規模的企業數據中心或者主機跨站託管設施)同比下降超5%,來到67億美元。第一季度,專用雲支出同樣下降1.5%,總額為58億美元。連續兩個季度下降,當然可以理解為衰退。

AI熱潮正在拉動數據中心基礎設施支出

非雲基礎設施(例如大型x86、Power或大型機系統,及其支持關係資料庫與ERP、供應鏈管理、倉庫管理和客戶關係管理應用程序所使用的SAN存儲)的支出下降了8.3%,來到144億美元。同樣的,這部分非雲細分市場較2023年第一季度的138億美元實現了環比增長,但非雲基礎設施的整體支出第一季度下降了0.9%、第二季度繼續下降8.3%,連續兩個季度的縮水同樣代表需求衰退。

目前的情況是,GPU供不應求的客觀現實導致生成式AI領域最具實力的三位參與者——微軟、谷歌和亞馬遜雲科技,正在從英偉達處獲得優先配額,這反過來又加快了雲服務商對外租賃基礎設施的腳步。畢竟只要有短缺,這種「二道販子」式的行為就不可能斷絕。但根據報道,英偉達方面有望在2024年將H100 GPU的生產能力提升至150萬至200萬個,屆時產品稀缺性或將有所緩解、價格隨之下降,伺服器市場也將重新歸於正常。類似的情況在2018年和2019年的伺服器內存領域也曾出現,當時DRAM價格曾經暴漲一倍,同樣拉高了伺服器的平均售價。

AI熱潮正在拉動數據中心基礎設施支出

關鍵在於,如果大家需要2萬到2.5萬個GPU來訓練最先進的生成式AI模型,那麼50萬個H100 GPU就只能構建20到25個大規模集群。目前全球也只有20到25家機構願意承受這麼高的建設成本。再考慮到模型的實際訓練往往需要幾個月時間,包括篩選數萬億個參數並消化同等規模的數據token,也許整個基礎設施將由數百個組織或部門進行共享。也就是說,即使2024年英偉達能夠把H100 GPU的產量推向最樂觀的200萬,還是不一定能滿足生成式AI的旺盛需求。

如果真是這樣,那麼GPU的售價將繼續居高不下,導致AI系統的成本也將保持高位。

更令我們擔心的是,第二季度伺服器和存儲出貨量下降了23.2%——我們不清楚實際出貨的機器數量,因為IDC沒有發布這項數據。而且2023年第一季度,伺服器與存儲出貨量已經縮水了11.4%。連續兩個季度的萎縮,自然就是需求衰退的標誌。

AI熱潮正在拉動數據中心基礎設施支出

展望今年下半年,IDC預計雲基礎設施的支出將增長10.6%,來到1014億美元;高於三個月前提出的全球7.3%的增長預期。2023年全年,共享雲部分的銷售額預計將增長13.5%,達到720億美元;專用雲部分將增長4.1%,來到294億美元。非雲伺服器和存儲支出則將會下降7.9%,來到585億美元。我們認為雲領域的所有增長都將由AI伺服器所驅動,而AI伺服器又以英偉達GPU及其競爭對手的其他AI引擎為底層驅力。

從長期來看,預計2022年至2027年(含)間雲基礎設施支出將保持11.3%的年均複合增長率(CAGR),到2027年年底時將達到1567億美元,占伺服器與存儲總支出的69.4%。到2027年,共享雲規模將達到1097億美元,年均複合增長率為11.6%;專用雲規模將達到470億美元,年均複合增長率為10.7%。而且不管大家是否相信,IDC預計非雲伺服器和存儲支出也將增長至691億美元,在2022年至2027年之間實現1.7%的處均複合增長率。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新