英特爾宣布,美國丹佛Super Computing年度展會(SC23)展示AI加速的高性能計算(HPC),產品組合橫跨Intel Data Center GPU Max系列、Intel Gaudi2 AI加速器、Intel Xeon處理器,皆展現HPC和AI負載的領先性能。
英特爾也分享與美國阿貢國家實驗室(Argonne National Laboratory,ANL)合作Aurora生成式AI計劃的相關進展,內容有Aurora超級電腦參數量高達1兆的GPT-3大型語言模型(LLM)最新發展,這些進展獲益於Max系列GPU獨特架構和Aurora超級電腦的系統能力。英特爾和阿貢國家實驗室合作,通過Aurora早期科學計劃(Aurora Early Science Program)和Exascale運算項目(Exascale Computing Project,ECP)的各項應用,加速科學發展,並同步揭示Intel Gaudi3 AI加速器和Falcon Shores的發展藍圖。
英特爾企業副總裁暨數據中心AI解決方案總經理Deepak Patil表示,英特爾持續致力於提供創新技術解決方案,以滿足HPC和AI社交媒體的需求。Xeon CPU、Max GPU和CPU卓越的性能表現都有助於推進相關研究和科學發展,搭配Gaudi加速器更能全面展現出英特爾的領先技術能夠為客戶帶來更值得信賴的選擇,以滿足多樣的工作執行需求。
英特爾表示,針對科學研究的生成式AI及最新性能和基準測試結果,突顯出英特爾提供的定製化解決方案足以滿足HPC和AI客戶的特定需求。英特爾通過軟體定義的方式,採用oneAPI規範與HPC和AI增強工具組件,協助開發人員跨越架構框架,無縫轉移程序代碼,加速科學研究。此外,Max系列GPU和CPU也將部署在多組即將上線的超級電腦。
阿貢國家實驗室分享了以Aurora超級電腦推動科學研究生成式AI計劃的進展。通過Aurora生成式AI計劃,阿貢國家實驗室、英特爾及合作夥伴將攜手創建最先進的AI模型,奠定科學發展基礎。這些模型將使用超過1兆參數規模的科學文本、程序代碼和科學數據集進行訓練,涵蓋多門科學領域。生成式AI計劃將利用Megatron和DeepSpeed的基礎技術,服務生物、癌症研究、氣候科學、宇宙科學和材料科學等多門科學領域。
Intel Max系列GPU架構和Aurora超級電腦系統擁有優秀的性能,只需64節點即可高效率處理1兆個參數的模型,遠低於一般所需。阿貢國家實驗室以256個節點處理四個實例,展現出Aurora平行處理多實例的能力;也能夠加速訓練擴展未來超過1萬節點上數兆token的參數模型。
英特爾2024年推出Intel Gaudi3 AI加速器。Gaudi3 AI加速器將基於與Gaudi2相同的高性能架構,預計提供4倍運算能力(BF16)、雙倍的網路帶寬,以實現更高的橫向擴展性能,以及1.5倍內置HBM內存,輕鬆滿足對LLM高性能、高效率運算不斷增長的需求,且同時兼顧性能。
英特爾公布2024年軟體開發工具組件的功能,推動oneAPI多架構程序支持的開放式軟體開發。新工具可協助開發人員在英特爾CPU和GPU擴展新的AI和HPC功能,涵蓋範圍更廣,包括使用標準Python實現數字負載更快的性能和部署,以及編譯器增強功能,交付近乎完整的SYCL 2020,提高生產力和程序代碼卸載。在德州先進運算中心(TACC)宣布oneAPI卓越中心將專注於開發及優化地震成像基準程序代碼的計劃。全球共32座英特爾oneAPI卓越中心共同推動此軟體及硬體創新與研究的產業發展。
英特爾投資AI和HPC,突顯市場強勁動能。採用英特爾Max系列GPU和CPU的新超級電腦部署包括Aurora、Dawn Phase 1、SuperMUC-NG Phase 2、Clementina XX1等系統,以及一台以Stability AI為主要客戶,採用英特爾Gaudi2加速器新系統的大型AI超級電腦。而這些動能將奠定英特爾對於AI和HPC的次世代GPU Falcon Shores研發基礎。Falcon Shores將採用oneAPI開放標準構建的單一GPU程序設計接口,應用在Intel Gaudi和Intel Xe的IP。讓目前構建在Intel Gaudi AI加速器及Intel Max系列GPU的應用程序,未來也能輕鬆轉移到Falcon Shores。
(首圖來源:Flickr/Kazuhisa OTSUBOCC BY 2.0)