宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Intel 正式錯失數據中心 AI 市場良機

2025年02月05日 首頁 » 熱門科技

 

Intel 正式錯失數據中心 AI 市場良機

 

在上周四的財報電話會議上,Intel 再次放棄了一個 GPU 架構,這標誌著該公司在 AI 加速器市場上與 Nvidia 和 AMD 競爭的希望徹底破滅。

臨時聯合 CEO Michelle Johnston Holthaus 透露,原計劃於今年推出、旨在結合 Intel Xe 圖形能力和 Gaudi AI 性能優勢的 Falcon Shores 項目將永遠停留在實驗室階段。"我們計劃僅將 Falcon Shores 用作內部測試晶片,不會推向市場。"

這意味著 Intel 可能還需要一到兩年才能推出下一代代號為 Jaguar Shores 的 GPU 架構,而且這還要假設它不會重蹈 Ponte Vecchio、Rialto Bridge 和現在的 Falcon Shores 的覆轍。

這已經不是 Intel 第一次或第二次終止開發能夠與 Nvidia 甚至 AMD 競爭的 GPU 了。近兩年前,Intel 砍掉了原定為美國 Aurora 超級電腦提供動力的數據中心級 GPU Max 晶片的繼任者 Rialto Bridge。至少早期的 Max 晶片在美國阿貢國家實驗室、英國的 Dawn 超級電腦和德國的 SuperMUC-NG Phase 2 系統中有過限量部署。

之所以說是限量,是因為 Intel 在 2024 年年中停止了 GPU Max 的生產,presumably 是為了專注於 Gaudi 系列加速器並為 Falcon Shores 的首秀做準備。

在這種背景下,Falcon Shores 的消亡似乎在所難免。Intel 的路線圖原計劃在 2024 年發布,但在 Rialto Bridge 被取消時推遲了一年。當時,Falcon Shores 項目包含了一個在單個封裝中結合 CPU 和 GPU 晶片的 XPU 變體。到 2023 年中期,這些計劃被縮減,只保留了更傳統的 GPU 方案。現在 Falcon Shores 基本上完全終止了。

那麼 Gaudi 呢?

儘管在高端 GPU 上的三次嘗試只成功了一次,但 Intel 並未完全退出 AI 領域。該 x86 廠商仍然擁有 Gaudi3 加速器。

從理論數據來看,這款在四月份發布的專用 AI 加速器表現不俗。它在 8 位或 16 位精度下可提供 1,835 teraFLOPS 的密集浮點性能。對於通常以 BF16 運行的計算密集型工作負載,Gaudi3 的性能幾乎是 Nvidia H100 或 H200 的兩倍。

對於推理等內存密集型工作負載,Gaudi3 配備了 128GB HBM2e 內存,帶寬達 3.7 TBps,使其能夠處理比 Nvidia H100 更大的模型,同時理論上提供更高的吞吐量。

不幸的是,Gaudi3 已不再與 H100 競爭。雖然它在 2024 年初亮相,但直到去年年底才開始向系統製造商少量供貨,計劃在本季度全面上市。

這意味著潛在買家現在要將其與 Nvidia 的 Blackwell 和 AMD 的 MI325X 系統進行比較。在訓練方面,Blackwell 提供更高的浮點精度、更多更快的內存以及更大的擴展域。與此同時,AMD 的 MI325X 擁有兩倍的容量和高出 62% 的內存帶寬,在內存容量和帶寬至關重要的推理任務中占據優勢。

這可能解釋了為什麼儘管時任 CEO Pat Gelsinger 堅稱 Gaudi3 將在 2024 年下半年帶來超過 5 億美元的加速器收入,Intel 最終仍未達到這一目標。而且這還是在與 Nvidia 相比具有極具競爭力的價格優勢的情況下。

造成這種情況的原因可能有很多,從系統性能到競爭對手軟體生態系統的成熟度都有可能。然而,Intel 更大的問題是 Gaudi3 是一個沒有後續的平台。

它的繼任者本應該是 Falcon Shores 的一個變體,據我們了解,這個變體原本計劃將其巨大的脈動陣列與 Intel 的 Xe 圖形架構相結合。

也許我們會看到 Gaudi3 在 2025 年取得一些進展,但考慮到完全沒有升級路徑,以及對 Jaguar Shores 的不確定性,很少有人會在有其他具有明確路線圖和成功記錄的晶片設計商的替代平台的情況下冒這個風險。

Intel 在 AI 數據中心的地位日益縮小

無論數據中心運營商最終購買哪種 GPU 或 AI 加速器,他們仍然需要主機 CPU,因此 Intel 不會完全被排除在 AI 數據中心之外。

Holthaus 本周向華爾街表示:"我們在 AI 伺服器的主機 CPU 方面處於領先地位,隨著 AI 融合應用的普及,我們繼續看到本地和邊緣 CPU 推理的重要機遇。"

去年推出的 Intel Granite Rapids Xeon 已證明是其多年來最具競爭力的產品,擁有高達 128 核心、256 線程,支持 8,800 MT/s MRDIMM,每個插槽最多 96 條 PCIe 5.0 通道。

然而,這個領域的競爭也越來越激烈。AMD 在數據中心的 Epyc 處理器系列持續取得的進展令人難以忽視。根據 Mercury Research 的數據,AMD 現在占據伺服器 CPU 市場約 24.2% 的份額。

同時,長期使用 Intel CPU 的 Nvidia,在其多代 DGX 參考設計中都採用了 Intel 的處理器,現在越來越依賴其基於 Arm 的 Grace 處理器來支持其頂級加速器。Nvidia 仍然支持我們熟悉的每系統八個 GPU 的 HGX 規格,因此 Intel 仍然可以在這個領域爭取份額——至少目前如此。

但是,隨著 AMD 強調其 Turin 一代 CPU 對 GPU 伺服器的優化程度,我們預計供應商在某種程度上會傾向於採用全 AMD 配置,即 Epyc 和 Instinct 的組合,這進一步限制了 Intel 在這個領域的競爭能力。

邊緣機遇

雖然 Intel 在數據中心利用 AI 熱潮的機會正在減少,但它在網路邊緣和 PC 領域仍有機會。

像大多數個人電腦硬體製造商一樣,早在 Microsoft 公布其 40 TOPS Copilot 性能要求之前,Intel 就開始大力宣傳 AI PC。

雖然這導致了一個尷尬的局面,即在幾個月內 Qualcomm 是唯一一家兼容 Copilot 的處理器供應商,但 AMD 和 Intel 都通過在七月和九月分別推出 Strix Point 和 Lunar Lake 趕上了進度。

正如我們在 Computex 上探討的那樣,Lunar Lake 在 GPU 和 CPU 之外還配備了一個 48 TOPS 的 NPU,Intel 聲稱這些片上系統可以在三者之間提供總計 120 TOPS 的系統性能。

更重要的是,Intel 仍然控制著 PC CPU 市場的主要份額。

雖然這些 AI 功能最終對 PC 客戶有多重要仍有待討論,而且 Intel 在 PC 高端市場面臨來自 AMD、Qualcomm 和 Nvidia 的激烈競爭,但它仍然穩固地參與其中。

除了新興的 AI PC 市場,Intel 的 CPU 戰略還可能幫助其在網路邊緣取得勝利。在這裡,它可以利用從 Sapphire Rapids 開始就已經集成到其 CPU 中的 Advanced Matrix Extensions (AMX) 計算單元,無需 GPU 就能運行機器學習和生成式 AI 工作負載。

Intel 此前已經演示過,由於其 MRDIMM 內存支持,其 Granite Rapids Xeon 可以以合理的每秒 12 個 token 的速度運行經過 4 位量化的 700 億參數 LLM。

推算這一性能,我們預計對於 80 億參數的模型,在批量大小為 1 的情況下,生成速率可達每秒約 100 個 token。正如我們之前詳細探討過的,僅使用 CPU 的 AI 在經濟性上仍然不太理想,批量大小是限制因素之一。

但是,對於可能只需要定期運行模型的網路邊緣設備來說,這不僅不是問題,而且與基於 GPU 的解決方案相比,還可能有助於減少複雜性和故障點。

不要過早排除東山再起的可能

如果 AMD 在後 Bulldozer 時代的重生能教會我們什麼,那就是不要過早排除 Intel 東山再起的可能性。

當 Ryzen 和 Epyc 在 2010 年代後期首次亮相時,這些產品並不是性能最強的,但它們具有差異化優勢,為客戶提供了他們無法從 Intel 獲得的東西:大量價格實惠且足夠好用的核心。

在 GPU 領域,AMD 採用了類似的策略,首先專注於在高性能計算 (HPC) 應用中提供比 Nvidia 更好的性能。這幫助 AMD 為其 Instinct 加速器贏得了美國的 Frontier 和最近的 El Capitan 超級電腦等多個重要項目。

通過 MI300 系列加速器和向 AI 的轉型,AMD 再次實現了差異化,目標是提供比 Nvidia 更大的內存容量。這幫助它贏得了 Microsoft 和 Meta 等主要超大規模數據中心和雲服務提供商的訂單,這些公司試圖降低包括推理在內的內存密集型工作負載的成本。

我們提到這一點是因為放棄 Falcon Shores 的決定為 Intel 提供了一個重新開始的機會,可以構建一個不受不再代表市場實際需求的架構決策限制的產品。

將 Jaguar Shores 重新聚焦於機架級設計的決定是未來發展的一個積極信號。如果 Intel 能找到一種方法使其下一代 GPU 實現差異化,並提供客戶想要但無法從競爭對手那裡獲得的東西,它至少有機會在數據中心重新站穩腳跟。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新