在一個經濟體內,我們所獲得的就是我們集體預期的。在2023年頭幾個月里發生了各種話題和怪事,業界公司現在對於在各種系統的過度投資有些顧慮也就不奇怪了。因此,即使AMD在過去幾年來一直在伺服器市場快速增長,現在也開始略感宏觀經濟的疼痛。
但如果事情按照Lisa Su及其團隊的計劃發展,AMD下半年將恢復強勁的發展勢頭,「Genoa」Epyc 9004正在快速發展中,而「Bergamo」超分頻器和雲計算CPU則已經推出,「Antares」Instinct MI300混合CPU-GPU也已經曝光並且安裝在蘿倫斯利弗莫爾國家實驗室的El Capitan級超級電腦上。
(我們在上面將MI300非正式地命名為「Antares」,原因是AMD似乎不太明白我們有必要使用同義詞。既然MI100基於「Arcturus」GPU,MI200系列基於「Aldebaran」GPU,那麼為什麼不以夜空中最大的星星之一「Antares」來命名MI300呢,Antares是天蠍座中的一顆紅色超巨星。)
事實上,Su在與華爾街分析師的電話會議上證實,AMD預計今年下半年將重回正軌,與2022年下半年相比的增長超過50%,而2022年下半年的表現相當不俗。但2023年第一季度則稍稍有點差,看起來2023年第二季度也會如此。
AMD第一季度的總收入為53.5億美元,下降了9.1%。AMD在旗下未來數據中心路線圖進行了大量投資,加上PC市場還在吃去年的CPU和GPU庫存的老本,AMD在該季度虧損1.39億美元。儘管如此,AMD持有的現金為59.4億美元,環比增長1.4,但同比下降9.1%,一年前持有的現金為65.3億美元。
許多超大型商家和雲計算構建商無疑都在等待128核Bergamo Epycs及其Zen 4c核心,這些核心是為專門他們的一些特定工作負載設計的,而且他們去年已經拿到了Genoa Epyc 9004的大部分份額。其中許多商家甚至在2022年11月Genoa伺服器CPU正式發布之前就拿到了Genoa Epyc 9004的份額。現在他們放慢購買CPU的速度並不令人意外。而且業界對大型語言模型興趣在爆炸性地增長,大型語言模型正在推動他們自己的消費以及雲計算構建商想要銷售的東西。
由於英特爾類似Bergamo的「Sierra Forest」要到2024年上半年才上市,因此AMD在Bergamo這一塊並不擔心來自超大規模商家和雲構建商的競爭壓力。在這些多核伺服器CPU方面,AMD可能比英特爾領先了三個季度的時間。(Sierra Forest擁有144個核心,而Bergamo擁有128個核心,英特爾在核心方面將會有輕微的優勢,這是長期以來第一次出現這種情況。)
AMD在銷量下降的同時對CPU、GPU和DPU路線圖進行了投資,數據中心組的銷售只能達到收支平衡。在3月份這個季度,數據中心產品的銷售額增長了兩成,略低於13億美元,營業收入為1.48億美元,下降了65.3%。根據我們的模型(與華爾街同行的模型一樣充滿了數字魔法),AMD的Epyc產品線收入為12.2億美元,同比增長60%。Instinct GPU的銷售額為6500萬美元,下降了18.8%,Pensando DPU的銷售額為1000萬美元左右,這要歸功於在微軟的一個大型安裝項目,該項目已經進行了一段時間了。我們還估計數據中心團隊的銷售額環比下降了21.8%。
相比之下,我們上周報道的英特爾的數據中心和人工智慧集團的收入為37.2億美元,同比下降38.4%,至強SP處理器的出貨量下降了50%。英特爾的運營虧損為5.18億美元。英特爾的網路和邊緣集團在數據中心有一些業務,其銷售額為14.9億美元,同比下降32.7%,營業虧損為3億美元。
再回到AMD的財務狀況。我們不清楚AMD的銷量是多少,但是我們知道平均銷售價格下降了,因為雲計算構建商和超大規模商家在第一季度用了更多的CPU組合。我們還認為,出貨量的下降速度快過收入,因為AMD每個季度的CPU平均售價都能上升,AMD在架構上增加了內容,而且銷售的Genoa晶片比上一代的「Milan」Epyc 7003更多。
我們認為,Epyc CPU對雲計算構建商和超大規模商家的銷售額達9.52億美元,同比增長15.4%,但環比下降22.5%。這意味著最終流向企業、電信公司、小型服務提供商、政府和學術界的CPU銷售額為2.68億美元,下降30.9%。
但AMD總裁兼首席執行官Lisa Su現在考慮的是在人工智慧領域提升競爭力。她指出,PyTorch人工智慧框架已經被移植到Instinct GPU加速器的ROCm環境,芬蘭LUMI超級電腦基於Instinct MI250X GPU和Epyc 7003 CPU,現在正在用於訓練一個非常大的芬蘭語語言模型。
Su在與華爾街分析師的電話會議上解釋表示,「客戶對我們用於人工智慧訓練和大型語言模型推理的下一代Instinct MI300 GPU的興趣增加了很多。我們在本季度取得了很好的進展,實現了關鍵的MI300晶片和軟體的可用性里程碑,我們正按計劃在今年晚些時候推出MI300,提供對蘿倫斯-利弗莫爾國家實驗室的El Capitan exascale超級電腦和大型雲計算AI客戶的支持。」
上面一段最後說的El Capitan是以前沒提過的,大家想知道El Capitan會用掉幾多CPU-GPU複合晶片,又會留下多少提供給雲構建者和超大規模商家購買和部署。很難說Nvidia(英偉達)能生產多少「Hopper」H100 GPU(其中有些是用「Grace」Arm伺服器CPU擴展的),但我們持強烈懷疑態度,大型語言模型方興未艾,這方面的需求將遠遠超過供應。這將推高Nvidia GPU和CPU的價格,也將迫使至少一些客戶考慮AMD替代品。
Su還表示,AMD各部門和集團的所有人工智慧團隊已被合併為一個單一組織,該組織將由FPGA製造商賽靈思前首席執行官和AMD嵌入式集團總經理Victor Peng管理。新的人工智慧部可能是那種虛擬的、跨集團組織,新的人工智慧部將推動AMD的端到端人工智慧硬體戰略以及旗下人工智慧軟體生態系統的發展,包括橫跨公司所有計算引擎的優化庫、模型和框架。
Su解釋表示,「我們正處於人工智慧計算時代的早期階段,採用和增長速度比近代歷史上的任何其他技術都要快。最近對生成性人工智慧的興趣做了很好的說明,要將大型語言模型和其他人工智慧能力的好處帶到雲、邊緣和終端就需要大幅提高計算性能。AMD在利用這種計算需求的增長方面具有非常好的優勢,我們擁有廣泛的高性能和自適應計算引擎產品組合,我們與各種不同大型市場的客戶建立了深厚的關係,我們擁有不斷擴展的軟體能力。我們對人工智慧領域的發展前景充滿期待。人工智慧是我們的頭號戰略重點,我們正在與我們的客戶群深入接觸,為市場提供聯合解決方案。」
AMD錯過了HPC仿真和建模GPU加速的第一波,但在目前的CPU和GPU以及ROCm堆棧方面在一定程度上追了上來。而在人工智慧訓練GPU加速的第二波中,AMD遠遠落後於Nvidia。但這一塊的需求超過供應,而且HPC社區在追趕超大規模商家,有助於AMD抓住機會瓜分這塊人工智慧蛋糕。不管怎樣,與英特爾面對的GPU和OneAPI堆棧相比,AMD要更輕鬆些,因為AMD一直是一個可預測的CPU供應商,而且現在還是GPU供應商。
也許對Nvidia、AMD和英特爾來說最重要的是,人工智慧現在幾乎是無往而不利。如果一定要給個說法的話,就叫「網聊熱潮」吧。