共有34種設計方案可供選擇,如何開啟機器學習之旅任君考量。
為了引導技術人員和工程師們積極嘗試自家AI加速硬體,英特爾公司已經整合出一系列軟體參考套件,宣稱能減少在其晶片之上部署機器學習系統所需要的時間和資源。
如大家所想,這34種開源參考套件能夠解決各種常見的AI/機器學習工作負載,包括支持聊天機器人和他生成式AI大語言模型,以及處理對象檢測、語音生成和財務風險預測等更為普遍的任務類型。
英特爾指出,他們與埃森哲合作開發的這些參考套件均包含必要的模型代碼、訓練數據、庫、oneAPI組件以及面向英特爾硬體的具體實現指令。根據英特爾方面的介紹,這些參考套件還將根據社區的反饋意見定期保持更新。
但這裡需要澄清一點:這些套件似乎均為純軟體。需要由客戶提供(內置英特爾晶片的)硬體,再配合給定的套件在其上構建AI/機器學習應用程序。
英特爾當然也做好了戰鬥準備,手中掌握著大量可運行此類AI應用程序的加速器和GPU,包括Habana Gaudi 2訓練處理器、Ponte Vecchio GPU以及內置在英特爾Sapphire Rapids至強Scalable處理器當中的高級矩陣擴展加速器。
儘管一直在圍繞生成式AI開展大規模宣傳,但英特爾的加速器似乎始終沒能像英偉達的GPU那樣受到公眾的廣泛關注和使用。而好消息是,英偉達家的GPU被大量用於訓練那些規模恐怖、知名度極高、瘋狂吞噬GPU資源的大語言模型(各大主要雲服務商也在主動爭奪英偉達資源,採購數以萬計的GPU和加速器),因此一定會有很多客戶無法以合理的價格和供應量獲取英偉達產品,這樣英特爾也就有了占領市場份額的機會空間。
根據技術外媒體The Next Platform的報道,英偉達的H100 PCIe卡(這甚至還不是英偉達家最頂級的GPU版本)在eBay上的競價已經高達4萬美元。
因此,只要英特爾能夠降低在其加速器上部署AI工作負載的障礙,那這位x86技術巨頭應該有能力說服客戶接受他們的部件,特別是那些更昂貴的旗艦產品。
當然,採取這種曲線對抗策略的不只有英特爾一家。英偉達在GPU加速的軟體開發與商業化方面已經取得了巨大成功。去年,英偉達CFO Colette Kress就明確強調了此類訂閱軟體收入,將對推動GPU晶片巨頭實現萬億級別收入的重要意義。
AMD也在積極推出自己的AI GPU和加速器產品。今年6月,AMD方面詳細介紹了Instinct MI300 APU與GPU,這些產品將在HPC和AI/機器學習領域同英偉達展開正面競爭。除了新款晶片之外,這家晶片製造商還宣布與Hugging Face建立戰略合作夥伴關係,由後者負責開發用於構建機器學習應用程序的工具,並針對AMD的Instinct GPU、Alveo FPGA、以及Epyc與Ryzen CPU對目前幾種主流AI模型做出優化。