宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

打破常規!英特爾至強CPU為AI時代大模型推理提供全新選擇

2024年03月21日 首頁 » 熱門科技

生成式AI引發的算力需求在持續增加,企業紛紛轉向GPU,不過現實卻很殘酷,缺貨、禁運等問題成了棘手難題。

英特爾市場營銷集團副總裁、中國區數據中心銷售總經理兼中國區運營商銷售總經理莊秉翰告訴記者,大模型是對業務的輔助,比如聊天機器人、內容生成、提綱分析等,這些只是幫助企業提高生產力。尤其是在私有雲上,企業沒有必要再重新部署新的GPU平台。因為一個新的平台意味著需要考慮開發、運維等因素,成本有可能增加,而這對於企業來說也可能會成為負擔。在CPU上運行大模型是一個非常好的選擇。

基於已有認知,CPU並非是運行大模型的選擇,然而,第五代英特爾至強可擴展處理器的問世讓CPU運行大模型成為了現實。那麼英特爾是如何做到的呢?

將硬體能力轉化為用戶價值

第五代英特爾至強可擴展處理器不僅針對不同工作負載實現了性能優化、助力高能效計算,並通過CPU將AI應用到更多場景,同時也為客戶提供了較高的運營效率和可擴展的安全功能。

打破常規!英特爾至強CPU為AI時代大模型推理提供全新選擇

英特爾資深技術專家表示,從架構角度看,第五代英特爾至強可擴展處理器實現了製程技術改進、晶片布局、性能與能效、末級緩存和內存IO等方面的革新。

比如,第五代英特爾至強可擴展處理器基於Intel 7的製程,在系統的漏電流控制和動態電容方面進行了改進。通過這些調整,第五代至強在同等功耗下的頻率可以提升3%,其中有2.5%是由漏電流控制貢獻的,動態電容下降貢獻了0.5%。

算力的提升需要更多的晶片核心,以及更多的內存帶寬,更多的內存帶寬意味著更多的IO。這些都在推動晶片面積不斷增加,這會給晶片的良品率帶來挑戰。

現在主流的晶片設計都是把一顆CPU晶片切分成多個子晶片,用多晶片的方式封裝在一個晶片上面。第五代至強通過把四片晶片改成兩片晶片的設計,利用了EMIB技術實現晶片之間的高效互連,更好地對晶片的面積進行控制。

在性能和能效方面,第五代至強升級到Raptor Cove核心,核心數增加,從最多的60核升級到64核。與此同時,雖然處理器性能提升了,但是待機功耗下降。英特爾處理器全集成供電模塊(FIVR)可實現更高的片上電源轉換效率,增強主動空閒模式可以提高數據中心的供電有效性,幫助客戶真正達到節電的目標。

此外,第五代至強支持高達5600MT/s傳輸的DDR5,並通過英特爾UPI 2.0增加帶寬,提供高達20GT/s傳輸,並支持CXL Type 3工作流。值得一提的是,該處理器還能通過英特爾SGX/TDX為使用中的雲端數據提供端到端硬體級防護能力。

藉助這些功能更新,在工作負載性能表現方面,相較於第三代產品,第五代至強可擴展處理器在AI推理訓練上最高提升了14倍,基礎架構的存儲能夠達到2.8倍,網路邊緣可以達到3.2倍,高性能計算能達到3倍,數據分析可以達到3.7倍。

強大AI能力加速客戶AI應用落地

在過去的10年,英特爾致力於構建一個完備的生態,通過軟、硬體結合幫助生態合作夥伴們充分挖掘和利用底層CPU能力。

英特爾在框架層、函數庫層面上挖掘硬體能力,通過API接口調用把底層硬體能力完全應用起來。同時,在系統層、伺服器層面上,將CPU、內存,以及網路整合成一個統一的有機整體。

打破常規!英特爾至強CPU為AI時代大模型推理提供全新選擇

英特爾資深技術專家表示,英特爾始終致力於在CPU上部署AI,對於通用的AI工作負載,英特爾採用AMX和AVX-512兩個指令集,並基於OpenVINO對整個模型進行優化、量化。

面向AI時代,英特爾也在逐步優化CPU的架構。除了傳統的CPU普通核計算之外,第五代至強可擴展處理器具備AMX加速功能,能夠將許多矩陣運算從普通的CPU中卸載到AMX上面,通過專用加速器處理專用的業務邏輯,性能便會大幅提升。

藉助分布式架構,CPU在推理方面的性能表現並不弱。基於硬體和軟體的優化,第五代至強和第四代至強相比,在AI訓練、實時推理、批量推理上,基於不同的算法,都可以看到不同性能的提升,最高可提升40%。

新一代至強的AI加速功能已經得到了合作夥伴的驗證。例如百度雲基於第五代至強的伺服器,提供了可以在CPU上運行的大型計算模型的服務。在京東基於第五代至強的應用中,和前一代的處理器相比,亦在Llama2 13B的模型上,實現了50%的性能提升。

企業引入基於至強處理器的生成式AI服務,如聊天機器人或是知識庫問答這種大模型應用,初期成本可以降低50%。

結語

目前,英特爾已經加速了產品疊代速度,並確保產品路線圖能夠有效執行。2024年,英特爾的下一代至強可擴展處理器也將迎來更新。

打破常規!英特爾至強CPU為AI時代大模型推理提供全新選擇

具備多達288個核心的能效核(E-core)處理器——Sierra Forest將於2024年上半年推出,性能核(P-core)處理器Granite Rapids也將緊隨其後發布。

能效核(E-core)處理器主要是面向新興雲原生應用的高密度超高能效的運算進行能效的優化,以實現極致的每瓦性能。

步入AI時代,算力驅動晶片架構的持續創新,而英特爾的CPU也在持續進化,旨在全方位響應時代和客戶的需求,讓CPU的價值得以體現。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新