宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

英特爾Lisa Spelman:Sapphire Rapids是一場代價沉重的學習之旅

2023年12月20日 首頁 » 熱門科技

憑藉Emerald Rapids,晶片巨頭的至強路線圖正在重回正軌——只要保證接下來別出岔子就行了。

英特爾的第五代至強伺服器處理器正降臨多年以來競爭最為激烈的CPU戰場。

英特爾Lisa Spelman:Sapphire Rapids是一場代價沉重的學習之旅

不斷變化的市場需求給晶片製造商們帶來了大量機會,可以隨機為邊緣、雲、AI乃至高性能計算應用等場景開發出高度優化的對應產品。

AMD的第四代Epyc和Instinct加速器就能滿足這些市場需求。與此同時,AmpereComputing憑藉其Arm兼容的雲處理器獲得了成功;英偉達的AI和HPC優化型超級晶片更成為系統製造商們眼中的「硬通貨」。

我們還發現,各主要雲服務商對於定製晶片的需求也在日益增加,包括亞馬遜的Graviton和微軟Cobalt。關於部分需求,我們將在後文中具體探討。

面對紛繁複雜的行業態勢,技術媒體The Register採訪了英特爾至強部門負責人Lisa Spelman,希望了解不斷變化的市場態勢和過往障礙將如何影響英特爾數據中心處理器的發展軌跡,晶片巨頭又是否對重振路線圖、保持市場主導地位充滿信心。

尷尬、痛苦的Sapphire Rapids時刻已經過去

近年來,最令至強團隊頭疼的問題無疑出在Sapphire Rapids身上。

這款晶片原定於2021年推出,號稱是英特爾有史以來最雄心勃勃的至強產品。在認可了AMD在小晶片架構方面的早期探索之後,英特爾希望把Sapphire Rapids打造成首款支持DDR 5、PCIe 5.0以及新興計算快速鏈路(CXL)標準的數據中心晶片。不光如此,該晶片還計劃支持大型四插槽與八插槽配置,並能夠為高性能計算(HPC)客戶提供封裝有高帶寬內存(HBM)的專用版本。

但事實證明,Sapphire Rapids的問題可能就出在太過雄心勃勃。於是英特爾不得不一再宣布延期交貨,最初是2022年第一季度,之後又推遲到2022年年底。一系列難題最終導致這款處理器的出貨時間定在了2023年1月,這無疑削弱了人們對於英特爾遵循至強產品路線圖的信心。

在談起Sapphire Rapids這段踉踉蹌蹌的量產之路時,Spelman的態度倒是輕描淡寫,只表示「我們在10納米製程方面確實略有落後,所以接下來的工作就都被耽擱了……當然,這只是最淺表的解釋。」

她進一步補充稱,英特爾公司內部也圍繞著Sapphire Rapids的開發失誤而進行了一系列結構性調整。Spelman告訴我們,「英特爾梳理了數據中心CPU交付過程中的每一個步驟並進行了相應調整。我們意識到公司在矽前模擬驗證方面的投資總體不足,還需要考慮更大的集群規模和容量需求。」

Spelman還強調了至強團隊與代工部門在合作方式上的變化。實際上,英特爾現在更像是晶圓代工(IFS)客戶,而這樣的轉變也在客觀上迫使工程師們更努力地思考如何進行CPU設計。

她在談到Sapphire Rapids評論稱「這是一場代價沉重的學習之旅。如果可以,我們絕對不想再來一次,但我也相信這段經驗能讓我們從根本上成為一家更強大的公司。」她還補充道,Emerald Rapids以及即將推出的Sierra Forest Granite Rapids處理器產品線都將從這些變化中獲益。

差異依然存在

說起英特爾的Emerald Rapids至強,這款產品已經成功達成了20%的平均性能提升,這在很大程度上要歸功於3倍於上代方案的L3緩存和更精簡的小晶片架構(使用雙晶片、而非上代至強的四晶片)。

這些變化使得英特爾成功將核心數量增加到64個,已經較主流Sapphire Rapids平台的56核心有所進步,但仍遠低於競爭對手平台上的96、128、144甚至是196核心。

不過這也在情理之中。畢竟英特爾長期以來的路線就是優先考慮每核心性能、而非一味強調核心數量,所以多年間跟競爭對手AMD走的就不是同一條路線。但從當下的市場變化來看、尤其是以雲端使用場景為例,客戶對於高核心數處理器的需求正愈發強烈。

但Spelman堅稱,其實很少有客戶因為核心數量相對較少而放棄英特爾產品。「我不是說完全不存在這種情況——畢竟高性能計算就是核心越多越好的典型用例——但具體還是要取決於客戶的工作負載和應用程序需求,要看實際運行情況,還要考慮處理器能否更好地融入現有系統。」

「至強產品線有很多功能亮點是參數規格表所無法直接體現的。」

不過英特爾似乎也意識到多核CPU的競爭優勢。Spelman坦言,「我們也會通過路線圖朝著更高核心數量的方向發展,希望藉此切實滿足這部分客戶的需求。」

根據她的說法,英特爾首款真正的多核CPU(當然,不包括至強Phi)不僅在核心數量上具有競爭力,而且只要一切進展順利,其最終效能還將大幅超越競爭對手。

代號為Sierra Forest的雲優化至強處理器計劃於明年上半年上市,預計其旗艦級版本將提供多達288個能效核(E核),比Ampere One的192核還多出50%。

英特爾的Granite Rapids至強處理器將於2024年晚些時候發布。目前關於晶片巨頭下一代性能核(P核)至強的詳細資訊仍然有限,但據了解它將擁有更高的核心數量、更強的性能表現,同時將在內存和I/O吞吐量方面迎來大幅提升。

Spelman表示,「結合市場的發展方向和現實需求,我們正進一步豐富性能核與能效核的產品線組合。」

英特爾在雲領域仍在發展空間

隨著越來越多雲服務商轉向定製晶片,以及Arm推動所謂計算子系統(CSS)的shake-'n-bake CPU設計,目前還無法判斷英特爾是不是已經錯過了雲優化處理器這波市場機遇。

當前定製晶片領域的標杆無疑是亞馬遜雲科技,其坐擁Graviton GPU、Trainium與Inferentia AI加速器以及Nitro smartNIC。而且其他選擇構建自有晶片的廠商還有很多。

經過多年的行業討論,微軟終於推出了Cobalt 100 CPU。這款CPU主要基於Arm的CSS構建模塊,擁有128個處理器核心。除了Cobalt之外,微軟還打造出用於訓練和推理工作負載的Maia 100 AI加速器。

微軟對Arm CSS的使用特別值得關注,這也是迄今為止Arm架構在CPU設計中最趨完整的體現。Arm的目標顯然是吸引更多超大規模基礎設施運營商和雲服務商以CSS作為起點,藉此開發自己的定製化Arm CPU。

除了亞馬遜雲科技和微軟之外,還有其他廠商選擇採用Arm核心。據傳谷歌也在開發自己的晶片,代號為Maple。從報道來看,該晶片將使用Marvell的設計方案。雖然甲骨文還沒有著手構建自己的定製化CPU,但已經在Ampere Computing的Arm兼容處理器上投入了大量資金。

Spelman肯定了亞馬遜雲科技及其Graviton在Arm生態系統中的「出色表現」,但並不擔心英特爾公司在雲領域的市場前景。

她解釋道,雲服務商「專注於以最高效的方式幫助客戶解決問題。」也就是說「即使他們打造出自有產品,也不會拒絕外部廠商提供的更優選項。」

但Spelman也承認,如果英特爾能早一點啟動Sierra Forest產品線,結果肯定會更好。

英特爾的AI戰略

儘管英特爾在推動至強路線圖重回正軌方面面臨挑戰,但Spelman表示晶片巨頭在推動CPU與AI加速功能融合方面做出的努力已經開始有所回報。

「回顧七、八年前英特爾和我自己在Ronak Singhal和Sailesh Kottapalli項目上做出的決定,即占用一部分晶粒空間來承載AI加速功能,無疑極具前瞻性。畢竟在當時,人們都覺得我們在CPU上搞AI加速純粹是瘋了。但時間終將證明一切。」

Spelman指的當然是今年早些時候伴隨Sapphire Rapids共同推出的高級矩陣擴展(AMX)技術。AMX旨在加速常見AI/機器學習推理工作負載,幫助客戶減少對獨立加速器的依賴。

這項功能也成為英特爾本周公布的Emerald Rapids至強處理器的一大核心賣點。這些晶片將對AMX引擎做出改進,並擁有更快的內存和更大的緩存。英特爾表示,其CPU產品線如今能夠以更低的延遲運行體量更大的模型。

Spelman還提到,AMX引擎不會損害專門負責Gaudi AI加速器項目的英特爾Habana團隊,後者對於推動計算技術持續發展同樣非常重要。

根據之前的相關報道,英特爾新一代至強處理器能夠在可接受的延遲水平下承載最大約200億參數的AI模型。對於規模更大的模型,還是建議客戶配合使用獨立加速器。

回顧過往,Spelman表示她對至強團隊取得的進展感到滿意。「從管理者的角度來看,我現在的主要目標就是保持警惕、萬萬不可鬆懈。」

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新