宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

為拯救至強CPU業務,英特爾寄希望於AI推理類負載

2023年10月31日 首頁 » 熱門科技

為拯救至強CPU業務,英特爾寄希望於AI推理類負載

毫無疑問,生成式AI及其他各類機器學習應用將在未來幾年之內,廣泛滲透進各個行業、各類應用技術棧以及各種具體軟體產品。而同樣可以預期的是,針對最先進模型的AI訓練(特別是那些包含數萬億個參數和數據標記的神經網路)將繼續產生高昂的成本。如果要在生產環境中部署生成式AI,就必須找到一種以更低成本實現AI推理的可行方法。

目前體量最大的生成式AI模型,大約需要在數萬個GPU上花三到四個月才能完成訓練。但推理流程對資源的需求則沒那麼誇張,一般只需要一到兩個節點、每節點搭載8個GPU,即可建立起嵌入至實際應用場景的生成式響應能力。如果未來的GPU沒辦法變得更小巧、更便宜,那麼CPU廠商就得在自己的產品中添加更多矩陣數學功能,藉此從GPU或其他類型的矩陣數學加速器手中爭奪這部分市場份額。而且換個角度看,如果CPU沒法依靠更強大的矩陣性能從GPU中奪回一部分業務空間,那麼生成式AI的成本就很難下降到合理水平——至少就目前的GPU成本來看,這項技術還做不到廣泛普及。

這就帶來了新的有趣難題,而且目前很難差別形勢會朝著哪個方向發展。英特爾憑藉其「Ponte Vecchio」Max系列GPU在矩陣數學加速器領域處於相對弱勢的地位——其最大缺點就在於發熱量太大、製造成本太高。另一方面,儘管旗下的Gaudi 2和Gaudi 3神經網路處理器(NNP)晶片備受好評,但還不清楚客戶要如何利用它們進行生成式AI推理。另外,Gaudi系列計劃在2025年內被下一代「Falcon Shores」GPU-NNP融合晶片所取代,所以在短短兩年之內,很難相信英特爾能夠製造出比英偉達或者AMD更好、更便宜的GPU產品來。此外,也沒有跡象表明英特爾會在未來的至強SP核心中大幅擴展AMX單元的低精度數學功能。

但我們仍然相信,英特爾上寫希望儘量在其CPU上運行AI推理負載。只是最大的問題在於,考慮到目前最先進的生成式AI模型需要大量算力才能把對提示詞的響應延遲控制在可以接受的範圍之內,所以用CPU跑AI推理似乎仍不具備可行性。

面對生成式AI全面爆發的時代背景,加上AMD在x86伺服器CPU領域的步步緊逼、以及英偉達和AMD雙方在數據中心GPU市場上的快速崛起,我們不由得要為英特爾當前的數據中心計算業務捏一把汗。沒錯,儘管晶片巨頭截至9月的第三季度表現好於預期,我們也確實希望激烈的市場競爭能夠進一步拉低各類數據中心計算產品的價格,但這場決定數據中心市場格局的對抗還遠未結束。事實上,這很可能成為一場綿延數十年的持久戰,沒有哪家廠商能夠明顯勝出。英特爾當初徹底掌控數據中心計算市場的經歷,也許將成為特定歷史時期下一種特殊的歷史現象。哪怕是正在數據中心領域瘋狂攻城掠地的英偉達,也必須接受這類場景下仍存在大量非AI工作負載的現實。那麼,這種群龍無首的狀況還會持續多久?據我們估計,至少在未來四、五年內,AI訓練和推理就將占據總體伺服器收入的約一半左右。屆時最關鍵的問題就是,這些AI訓練和推理工作負載到底在哪裡運行、由誰來運行?

英特爾公司CEO兼數據中心業務總經理、曾在晶片巨頭輝煌時期擔任首席技術官的Pat Gelsinger在回顧第三季度的財務業績時,做出了如下論述。

為拯救至強CPU業務,英特爾寄希望於AI推理類負載

 「雖然過去幾個季度以來,業界看到CPU與加速器之間的市場份額比例發生了一些變化,伺服器市場也進入了庫存消化周期,但在進入第四季度之後,我們發現高層需求開始重歸常態。這也推動總體潛在市場(TAM)迎來了適度的環比增長。對於大多數客戶來說,預計2023年將以比較健康的庫存水平迎來尾聲,而計算核心需求量的增長也將在年末從低迷周期恢復至比較正常的歷史水平。更重要的是,我們對發展路線圖的成功執行正通過四代階段增強自身產品組合,而後續五代至強、Sierra Forest和Granite Rapids產品將幫助英特爾重新奪回數據中心份額。此外,我們預計憑藉由Gaudi主導的AI加速器套件,英特爾將在2024年內把握住不斷增長的加速器市場份額。Gaudi正與MLCommons和Hugging Face等第三方共同建立領先的基準性能結果。我們對英特爾的加速器產品組合、特別是Gaudi表現出的客戶吸引力感到滿意。過去90天內,我們的銷售渠道幾乎增加了一倍。」

這部分銷售渠道對應著約20億美元的市場空間,且主要集中在Gaudi系列加速器之上。縱觀英特爾過去幾個季度的運營策略,這些加速器有望在英偉達和AMD GPU嚴重供不應求的背景之下有所斬獲。但在我們看來,整個2023年之內,AI推理與訓練伺服器的總收入將接近500億美元。所以在將渠道銷售額與實際銷售額比較時務必得考慮到整體業務需求的增長,畢竟渠道對應著理論出貨空間、能否轉化成實際收入仍然有待觀察。另外英特爾在市場上還面對著不同的競爭對手,其業務定位各有差異、也都在全力以赴追逐這波AI浪潮中的商業機遇。

正如前文提到,如果英特爾能夠開發出一套合理的矩陣數學引擎並承載起TensorFlow和PyTorch,那麼產品銷量應該不成問題。而英特爾選擇的路線卻是將4000台Gaudi 2設備部署在雲端,而非直接出售給AI初創企業。這樣的現實不禁令我們心生好奇。從表面上看,這似乎意味著英特爾沒辦法直接向客戶出售這部分計算容量。但換個角度,多年以來AI處理能力所產生的收入高達設備直接銷售收入的約2.5倍,這就解釋了為什麼英特爾非得自建雲體系,並努力拉攏Stability.ai(Stable Diffusion生成圖像處理平台的母公司)成為其主要客戶。

鑑於英偉達「Hopper」H100 GPU的產能有限,再加上AMD那邊不知道能產出多少「Antares」Instinct MI300A和MI300X GPU,相信英特爾目前的Gaudi 2加速器、以及後續號稱性能將倍增的Gaudi 3加速器都將獲得不錯的市場表現。但問題最終還是要著落在,這一切是否能夠轉化成實質性的收入增長、又能否為未來的Falcon Shores GPU奠基開路。

為拯救至強CPU業務,英特爾寄希望於AI推理類負載

英特爾數據中心與AI部門(簡稱DCAI)銷售額為38.1億美元,下降9.4%;但營業利潤來到7100萬美元,達到去年同期的4.2倍。

英特爾還提出了新的市場受眾概念,即MNC——跨國公司。這部分客戶以往被稱為「大型企業」,區別於中小企業(SMB)、超大規模基礎設施運營商和雲服務商。Gelsinger在電話會議上表示DCAI部門的表現稍微超出了英特爾的預期,收入環比略有增長,而全球十大雲服務商已經開始將今年1月推出的「Sapphire Rapids」四代至強SP納入生產部署。Gelsinger還強調,英特爾Sapphire Rapids在本季度初的出貨量已經突破100萬顆,11月出貨量預計將突破200萬顆。他同時對第六代「Granite Rapids」至強SP也寄予厚望,其AI處理性能將達到Sapphire Rapids的2到3倍。

Gelsinger提醒大家,第五代「Emerald Rapids」至強SP只是對Sapphire Rapids的小改款,計劃於12月14日推出。第六代「Sierra Forest」至強SP則甚至「Sierra Glen」能效核、而非「Redwood Cover」性能核。至於第六代Granite Rapids至強SP,將繼續沿用相同的「Birch Stream」插槽及平台。Sierra Forest將在單一晶片上封裝144個核心,並採用可容納288個核心的雙晶片插槽,推出時間預計在2024年上半年。Granite Rapids則將緊隨其後。

但英特爾的設計水平和供應能力到底跟不跟得上宣傳,還有待時間來驗證。畢竟AMD仍在著力更新自家Epyc CPU產品線,英偉達和Ampere也在某些伺服器領域表現出了競爭力。谷歌和微軟都在開發自己的Arm架構CPU,亞馬遜雲科技更已宣布將在今年11月推出其Graviton 4晶片。

在向美國證券交易委員會提交的10-Q文件中,英特爾對其DCAI部門做出了更具體的論述。工程學院表示,第三季度伺服器銷量(主要是CPU,但也包含部分主板和晶片組)下降了35%,對於這個令人震驚的數字,英特爾將原因歸結於「CPU數據中心市場的整體疲軟」。這話其實沒錯,畢竟雲服務商和超大規模運營商正在將大量資金投入到運行生成式AI負載的GPU之上,所以其他採購計劃開始相應放緩。有趣的是,儘管超大規模基礎設施運營商和雲服務商的消費量下降,但伺服器平均售價(ASP)卻上漲了38%,而繼續購買至強SP的客戶(包括超大規模及雲服務商)現在也更樂於選擇那些核心數量更多的高端CPU。

從今年的情況來看,截至第三季度末,DCAI部門的收入下降了22.5%、至115.4億美元。英特爾還在10-Q文件中提到,其中伺服器銷量下降了41%,但平均售價上漲了17%。FPGA的銷量倒是貢獻了一部分收入,但展望未來,英特爾認為FPGA的銷售增長恐怕也將放緩。過去9個月以來,DCAI部門的運營虧損為6.08億美元;相比之下,該部門在2022年前三個月的運營收益為19.2億美元,銷售總額則高達148.9億美元。

據我們所知,從財務角度看2023年第一季度絕對是英特爾數據中心的近年最低點,而能否跌破歷史低谷仍有待觀察。

現在,DCAI部門雖已涵蓋英特爾旗下的多項數據中心業務,但仍未徹底包攬。其網路和邊緣(NEX)部門還在向數據中心及其邊緣擴展銷售設備。今年第三季度,NEX部門的銷售額下降達46%、至14.5億美元,營業利潤下降77.3%、至1700萬美元。過去9個月間,NEX部門的銷售額下降36.8%、至43億美元。利潤方面,該部門也從2022年前9個月的正營收6.82億美元轉為2023年前三季度的虧損4.7億美元。不妙,相當不妙。

而將DCAI和NEX兩個部門結合起來看,我們就得到了英特爾數據中心業務的總體表現。這裡涵蓋了英特爾的閃存、存儲、FPGA和物聯網等各項業務,基本反映了晶片巨頭「真實」數據中心業務隨時間推移之下的變動情況,特別是在經歷了一系列產品剝離、停運和競爭壓力之下的整體趨勢。下面來看圖表:

為拯救至強CPU業務,英特爾寄希望於AI推理類負載

曾經見證過英特爾在2000和2010年代輝煌與榮光的朋友,肯定很難預料短短十年間其數據中心業務就會跌破圖中的紅線、陷入運營虧損。

現已停產的Optane 3D XPoint持久內存屬於純伺服器產品,現在被劃入「其他」類別當中。出於好心,我們就不把「其他」業務在2023年第三季度這22.5億美元的虧損納入「數據中心」業務了,否則晶片巨頭的成績單會更加難看。另外,加速計算和圖形(AXG)業務已經被拆分和併入DCAI及客戶端計算(CCG)部門,所以一知道這部分業務又對應著多大的虧損數字。

有趣的是,英特爾甚至不再討論部署在阿貢國家實驗室「Aurora」超級電腦中的Ponte Vecchio GPU了。在這部分業務上,英特爾開始集中精力主推Gaudi 2和Gaudi 3產品。相信不久之後,我們就會聽到關於搭載Gaudi矩陣數學引擎和Gaudi胖以太網通道的Falcon Shores融合GPU的消息了……

根據我們的計算,英特爾的「真實」數據中心業務縮水了19%、至517億美元;營業利潤減少了一半,至8600萬美元,只占總體收益的1.7%。說句誅心之論,這跟英特爾數據中心業務的頂峰時期根本無法相提並論:該業務在2020年第二季度的銷售額為90.6億美元,營業利潤為34.3億美元,約占總收益的37.8%。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新