宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

英特爾至強路線圖步入正軌,288核「SIERRA FOREST」即將推出

2023年09月20日 首頁 » 熱門科技

英特爾至強路線圖步入正軌,288核「SIERRA FOREST」即將推出

有時候能成為新聞的不只是變化,特別是從過去幾年間英特爾的情況來看,CPU路線圖的不變本身就是新趨勢。但在本周於聖何塞召開的Innovation 2023大會上,英特爾給至強SP帶來了好消息,逐步融入GPU-AI加速器的發展戰略也在一步步得到鞏固。

英特爾首席執行官Pat Gelsinger是這家晶片設計與製造巨頭的第二代領導人之一,當年曾直接在公司聯合創始人Gordon Moore、Robert Noyce、特別是Andy Bryant手下學習技術。而本輪變革的重任,也落在了他的肩上。如他所言,新的「晶片經濟」正在推動價值5740億美元的產業,進而撬起總值近8萬億美元的全球科技經濟。這些數字體現為個人與企業級計算、存儲、網路和數據中心支出,又將反過來推動所有軟體與IT服務供應商、電信企業和服務商、超大規模廣告與搜索業務,甚至包括在線零售業務。Gelsinger要做的並不是釐清整個「晶片經濟」中的每個細節,而是要確保開發者達成共識:英特爾,將在這個時代繼續保持「統治」。

在我們看來,開發商首先定義需求,再逐步滿足需求並加以維護。在此過程中,有少數開發商建立起如今聲名顯赫的軟體公司,又或者打造出超大規模雲體系,最終身居市場高位指點江山、規劃經濟活動。所以市場不會說謊,誰在統治、誰被裹挾可謂一目了然。換言之,儘管整個世界的發展和演變是開發者們集體努力的結果,但我們必須承認的是真正主導一個個關鍵節點的、往往並不是全球數千萬開發者這個集體。

接下來,讓我們認真看看英特爾的數據中心計算引擎,先從至強SP系列開始:

英特爾至強路線圖步入正軌,288核「SIERRA FOREST」即將推出

此次重大消息是,基於英特爾能效(E)核(代號「Sierra Glen」)的至強SP「Sierra Forest」變體將迎來規格翻倍,晶片上最多可容納288個核心。

Sierra Forest將對接與後續「Granite Rapids」至強SP相同的「Birch Stream」伺服器平台,前者計劃採用「Redwood Cove」性能(P)核並於2024年推出。而下一代能效核晶片「Clearwater Forest」將於2025年亮相,但目前還沒有公布所搭載核心的具體代號(上圖所示為Gelsinger發布的演示幻燈片,其中沒有提到這三款伺服器CPU將在「Mountain Stream」之後迎來哪款繼任平台)。

再來看Gelsinger在Innovation 2023的主題演講上興起的Sierra Forest樣片:

英特爾至強路線圖步入正軌,288核「SIERRA FOREST」即將推出

我們仍在認真研究能效核和性能核兩大架構。從之前的情況來看,能效核不包含AVX-512向量單元或AMX矩陣單元,也不會採用英特爾HyperThreading同步多線程所實現的每核雙線程設計。

Sierra Forest晶片將採用Intel 3,即5納米極紫外(EUV)工藝進行蝕刻。之所以取名叫Intel 3,是為了與競爭對手台積電的3納米工藝3N在名頭上保持對待。但Intel 3實際屬於5納米製程工藝,如此定名明顯透露出英特爾的一股不自信。

截至目前,英特爾表示Sierra Forest晶片將擁有144個核心加6條DDR5內存通道。英特爾的工程師們找到一種方法,可以將2個Sierra Forest小晶片塞進單一Birch Stream插槽,從而實現單插槽288核心加12條DDR5內存通道的誇張配置。這些Sierra Forest晶片與基於性能核的Granite Rapids至強SP同樣採用Intel 3製程工藝;兩款產品均計劃在2024年內投放市場,且Sierra Forest已確認將在2024年上半年與用戶見面。

但英特爾目前對於Granite Rapids的一切性能參數均含糊其辭,僅表示它會緊隨Sierra Forest之後發布。從這樣的表述看,其上市時間有可能是2024年5月或6月,但僅僅只是猜測。英特爾目前之所以不想過多談論Granite Rapids P核晶片,是為了防止搶掉當前「Sapphire Rapids」至強SP v4處理器的風頭。後者今年1月才正式推出,而且已經確定會被12月14日發布的「Emerald Rapids」至強SP v5所取代。

也就是說,這些晶片已經在超大規模基礎設施運營商和雲服務商手中運行好幾個月了……下代Emerald Rapids仍將採用改良版Intel 7(某種程度上類似於改良版的10納米製程,但名義上是與7納米製程對打)工藝進行蝕刻,與當前Sapphire Rapids至強SP v4晶片保持一致。

英特爾研究員兼至強SP系列首席架構師Ronak Singhal在採訪中表示,Emerald Rapids晶片的核心數量將適度增加(猜測會從60核增加為64核),並匹配更高的DDR5內存速率,配合UltraPath互連(UPI)對接多插槽系統中的各個插槽。與Sapphire Rapids晶片所使用的「Golden Cove」核心相比,Emerald Rapids CPU中使用的「Raptor Cove」核心在微架構上有所變化,但具體情況尚不明確。Gelsinger則明確表示,在相同的發熱量之下,Emerald Rapids在AI等關鍵工作負載上的性能將比Sapphire Rapids高出40%。

Gelsinger在主題演講中介紹稱,「我還記得當初推出首款4核產品時的情景。」相信大家也同樣記得,那是在2009年3月,經濟衰退對全球市場造成了嚴重打擊,而英特爾則逆勢發布「Nehalem」至強E5。「而現如今,核心數量已經來到288個……可能我已經老了,但這個數字真的讓我感到震撼。對於整個CPU行業、包括我們的至強客戶來說,2024年將是非常值得期待的一年。」

在性能方面,Gelsinger表示與之前的Sapphire Rapids至強SP v4晶片和Granite Rapids至強SP v6性能核晶片相比,Sierra Forest能效核處理器的機架計算密度提高了2.5倍,每瓦性能來到2.4倍,能夠提供的AI性能預計將達到Sapphire Rapids晶片的2到3倍。看起來,這次能效核也將迎來AMX矩陣運算的加持。

英特爾也沒有提及預計將在2025年推出的「Diamond Rapids」至強SP v7會對Granite Rapids產生怎樣的影響。但如果Clearwater Spring至強SP v6能在2025年攜Intel 18A製程順利推出,那我們似乎有理由相信Diamond Rapids也會從Intel 20A轉向Intel 18A(正如Granite Rapids從Intel 4轉向Intel 20A一樣)以發揮製程升級帶來的潛力。

而下一步順理成章的改進方向,自然就是把Max GPU系列跟Habana Gaudi矩陣數學加速器進行融合。

英特爾至強路線圖步入正軌,288核「SIERRA FOREST」即將推出

英特爾目前正在銷售7納米Gaudi 2矩陣引擎,Gelsinger也再次提醒我們,這款產品在大規模AI工作負載上擁有出色的性價比,而採取5納米製程升級和架構改進的Gaudi 3引擎也已經進入流片階段。但在此之後,英特爾將把自家GPU跟NNP(神經網路處理器)產品線合併起來,似乎是打算用Habana矩陣數學引擎及軟體、集成以太網網路、外加Xe GPU向量引擎共同打造未來的「Falcon Shores」計算引擎。雖然這跟英特爾最初為Falcon Shores設置的CPU-GPU混合計算引擎定位有所區別,但仍算得上是個可行的解決思路,也的確能把英特爾當前的GPU客戶(雖然不多)跟NNP受眾結合起來。但千萬不要誤會,Falcon Shores屬於GPU、而非NNP。

英特爾還高興地看到,其Developer Cloud已經順利啟動並承載起Gaudi 2設備、Sapphire Rapids CPU、Max系列CPU的HBM變體,以及「Ponte Vecchio」Max系列GPU。英特爾此次宣布,正在構建一套包含4000台Gaudi 2設備、主要進行數學計算的混合CPU-NNP集群,Gelsinger稱這將是全球排名「前15」的AI超級電腦,主要客戶包括發布了知名生成式AI繪圖模型Stable Diffusion的初創公司Stability.ai。

Stability.ai似乎不大可能直接買下這套集群,選擇租賃的幾率更高。另外,還不清楚該集群是否會被納入英特爾Developer Cloud或者交由第三方服務商進行託管。目前,Stability.ai正在使用亞馬遜雲科技提供的Ezra-1 UltraCluster(號稱是全球第五大超級電腦)運行其Stable Diffusion平台。

看來英特爾已經發現並把握住了新時代的脈搏。在AI浪潮的輕拂之下,任何一家晶片廠商只要能以合理的價格和發熱水平交付一套矩陣數學引擎,並能在其上順暢運行TensorFlow或者PyTorch,但它就完全可以拿來賣錢——或者選擇更划算的方式,拿來出租。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新