在一年一度的Hot Chips會議期間,英特爾揭秘了其第六代至強數據中心處理器的架構變化,並詳細講解了其新一代架構、E核和P核處理器技術,包括內存I/O子系統的設計改進,並披露2023~2025年的最新產品路線圖,不過英特爾並未公布關於這兩款至強處理器的具體規格。
英特爾宣布將在明年推出兩款採用Intel 3工藝的第六代至強處理器,代號分別為Granite Rapids和Sierra Forest,前者為為計算密集型和人工智慧工作負載優化的高性能核心(P核)處理器,後者則針對高密度和橫向擴展工作負載優化的高能效核心(E核)處理器。
儘管英特爾計劃在一代中提供兩個截然不同的至強處理器,但二者將共享相同的平台,這意味著同樣的插槽、內存、固件,以及相同的基於小晶片的設計理念等。在晶片的架構設計上,Granite和Sierra均基於chiplets設計,通過英特爾的EMIB封裝技術將計算和I/O小晶片組結合起來。雖然這並不是英特爾在至強處理器上的首次運用,但這是chiplets設計的一次演變,它使用了不同的計算和IO chiplets,而不是將其他「完整」的至強chiplets拼接在一起。
值得注意的是,英特爾首次證實了第六代至強可擴展平台具有自啟動功能,使其成為真正的SoC。由於英特爾在I/O晶片中集成了運行所需的所有I/O功能,因此無需外部晶片(或 FPGA)即可運行這些處理器。這使得英特爾的至強系列處理器在功能上更接近於AMD的EPYC系列處理器,後者在此前就已具備類似的自啟動功能了。
通道數量和內存帶寬上,第六代至強也有不小的進步,支持12條內存通道,並可根據現有計算晶片的數量和功能進行擴展。並且將率先支持全新MCR DIMM,本質上是將兩組/列內存晶片組合在一起,以使進出DIMM的有效帶寬加倍。英特爾表示,憑藉更高的內存總線速度和更多的內存通道,該平台的帶寬是當前第四代至強處理器的2.8倍。
至於 I/O,最高配置的第六代至強處理器將能夠提供達136條的PCIe通道,以及多達6 個UPI鏈路(總共 144 個通道)用於多插槽連接。在I/O方面,該平台支持 PCIe 5.0以及更新後的CXL 2.0標準。與英特爾此前的大核至強的一樣,Granite Rapids處理器將可擴展至8個插槽。而Sierra Forest則只能擴展到2個插槽,英特爾表示,這主要是考慮到CPU核心的數量以及英特爾希望客戶使用的情況不同。
當然,第六代至強處理器最大的不同是引入高能效核心(E-Core),這是英特爾首次嘗試為至強處理器提供E核。英特爾第六代至強可擴展處理器將提供P核和E核兩種版本的核心架構,二者均基於Intel 3工藝打造,其中P核至強Granite Rapids針對計算密集型和AI工作負載的性能進行了優化,E核至強Sierra Forest針對高密度和橫向擴展工作負載的能效進行了優化。
兩種架構所擁有指令集也略有區別。P核Granite Rapids依舊是採用此前的至強架構,對每核性能進行了優化並提高了能效,新軟體功能包括支持用於AI/ML的FP16的高級矩陣擴展(AMX)、長度256位的內存加密秘鑰、Code SW預取和取指分支提示、單線程MBA L2高速緩存分配技術/代碼和數據優先級(CAT/CDP);同時Granite Rapid的微架構對性能也進行優化,包括:64KB、16路指令高速緩存(I-cache),改進分支預測和錯誤恢復,3-cycle浮點乘法,更好的內存請求和預取能力。與當前的第四代至強相比,其容量是前者的2倍,浮點乘法也從4/5個周期減少到3個周期。
E核Sierra Forest則採用英特爾全新的至強架構,擁有優化的能效吞吐量性能,軟體功能支持BF16、FP16轉換,並支持HLAT、CMPccXADD、LAM、LASS、AVX-IFMA、AVX-DOT-PROD-INT8等。該處理器將擁有144個核心,可提供雙插槽配置。在微架構上,Sierra Forest也進行了優化和改進,包括64kB 指令緩存、6-wide解碼器、5-wide分配器、8-wide retire、2核或4核共享4MB L2。
英特爾表示,與當前第四代至強處理器Sapphire Rapids相比,基於E核打造的至強處理器Sierra Forest在雲計算領域可將機架密度提高250%,將每瓦性能提高240%。全P核的Granite Rapids處理器經過優化,可為高性能核心需求和通用計算工作負載提供支持。Granite Rapids將進一步增強處理器的AI性能,內置加速器可提高特定工作負載的性能和效率。英特爾稱,Granite Rapids可以為混合人工智慧工作提供2到3倍的更高性能表現。
E核至強處理器Sierra Forest預計將在2024年上半年正式推出,而P核至強處理器Granite Rapids將緊隨其後登場。