微軟希望通過推出用於AI和其他工作負載的新型專用晶片來推動其客戶的AI和雲計算雄心。
近日舉行的Ignite 2023大會上,微軟宣布的新晶片包括微軟在Azure上推出的首款定製型AI加速器Azure Maia,旨在支持大型語言模型和GitHub Copilot等工作負載,以及微軟首個定製的自主開發型CPU——Azure Cobalt,該晶片是基於Arm架構構建的,可為常見工作負載提供最佳性能和能源效率。
微軟Azure基礎設施營銷總經理Omar Khan在一篇貼文中表示,AI轉型是今年Ignite大會的核心主題之一。他表示,今年人工智慧發展迅速,正在推動著一波創新浪潮,迅速改變應用格局以及應用構建和交付的方式。然而,企業在努力發展這一創新的同時,還要應對成本上升和可持續發展挑戰等優先事項。
Khan表示:「如今客戶正在尋找能夠滿足他們所有需求的AI解決方案,在AI新時代,我們正在重新定義從晶片到系統的雲基礎設施,為每個企業、每個應用和每個人的AI做好準備。」
Azure Maia定製AI加速器
Khan解釋說,Azure Maia加速器晶片是為大型語言模型、Bing和ChatGPT等AI工作負載定製的,是計劃中的第一代加速器系列,它擁有1050億個電晶體,是有史以來基於5納米工藝製造的最強大的晶片之一。該晶片是微軟與OpenAI合作設計的,OpenAI深入了解了其大型語言模型如何運行在Azure雲基礎設施上,以確保其提供最佳性能。
OpenAI首席執行官Sam Altman表示,OpenAI的專家和微軟在Azure AI基礎設施層的各個方面進行了合作。他說:「我們共同努力,用我們的模型來完善和測試,Azure端到端的AI架構現在已經通過Maia優化至晶片,為訓練功能更強大的模型、為客戶降低這些模型的成本鋪平了道路。」
微軟技術研究員Brian Harry表示,Maia 100 AI加速器也是專門為適應Azure硬體堆棧的其餘部分而構建的。他承諾,該晶片的設計與Azure更大的AI基礎設施的結合,將帶來性能和效率上的巨大提升。
Azure Cobalt CPU
Cobalt CPU是一款64位的128核晶片,據稱比當前一代Azure Arm晶片性能提高了40%,旨在為Teams和Azure SQL等微軟服務提供支持。Arm晶片以其節能設計而聞名,可以幫助客戶實現可持續發展的目標,同時確保雲原生應用按預期運行,其重點是優化晶片的每瓦性能,以便在消耗的每單位能量中榨取最大功率。
Harry表示:「架構和實施的設計考慮了功效,我們正在以最有效的方式利用矽上的電晶體,將我們所有數據中心伺服器的效率提升相乘,加起來就是一個相當大的數字。」
Azure硬體系統和基礎設施公司副總裁Rani Borkar表示,微軟選擇自主設計自己的晶片,以確保晶片完美適合其雲基礎設施及其運行的AI工作負載。這些晶片將與定製的伺服器主板集成,並放置在定製的伺服器機架內,以便輕鬆安裝在微軟的數據中心內,然後將配合微軟專門設計的數據中心軟體使用。Borkar表示,其結果就是讓硬體系統提供最大的靈活性,可以針對功耗、性能、可持續性或成本進行優化。
Borkar表示:「在微軟,我們正在共同設計和優化硬體和軟體,以便實現一加一大於二的效果。我們可以看到整個堆棧,而矽只是其中的成分之一。」
Khan表示,新的晶片代表了微軟下一代雲基礎設施的最後一塊版圖,將於明年初開始向客戶推出,最初將支持包括Microsoft Copilot和Azure OpenAI Service在內的服務,然後擴展到其他類型的工作負載。
Constellation Research分析師Holger Mueller表示,微軟針對AI開發自己的定製硬體是有意義的,因為微軟已經提供了一系列用於開發和運行這些工作負載的最全面的軟體。他說:「性能和功能的結合,再加上Azure的網路功能,使這些定製晶片成為企業非常感興趣的產品,企業將非常高興看到Azure Maia和Azure Cobalt能夠提供什麼。」
除了新硬體之外,微軟還做出了巨大努力來改善連接硬體的網路基礎設施。微軟表示,憑藉其中空芯光纖技術和現已全面推出的Azure Boost服務,將能夠大幅加速網路和存儲,兩者的結合將使客戶能夠實現高達每秒12.5 GB的吞吐量、每秒650000 IPOS的遠程存儲性能、以及高達每秒200 GB的網路帶寬,以支持數據最密集的工作負載。
除了微軟的定製晶片之外,客戶還將擁有新的硬體選擇。微軟在另一份聲明中表示,正在與Nvidia公司合作,提供對其最新基於H100 Tensor Core GPU的虛擬機的訪問了路徑,主要針對中型到大型的AI工作負載例如Azure Confidential虛擬機,還將於明年提供對Nvidia H200 Tensor Core GPU的訪問,以儘可能低的延遲支持對更大型AI模型的推理。
第三個AI工作負載選擇是由AMD構建的新型MI300加速器。MI300於今年早些時候發布,並將於明年初在Azure上提供。微軟表示,這款高性能晶片的加入為客戶提供了運行AI應用的更多選擇。
Borkar表示:「以客戶為中心意味著我們為客戶提供最好的東西,意味著我們要利用生態系統中可用的東西以及我們開發的東西,我們將繼續與所有合作夥伴合作,為客戶提供他們想要的東西。」
Azure基礎架構更新
微軟在Azure基礎設施方面還有更多內容可以分享,例如微軟宣布Oracle Database@Azure服務將在微軟美國東部Azure區域全面上線。該服務將於12月推出,該地區的Azure客戶可以直接訪問Oracle自己數據中心的Oracle雲基礎設施上的資料庫服務。微軟承諾,將與Oracle Exadata Database Service on OCI的性能、規模和工作負載可用性相匹配,同時添加Azure的所有優勢包括安全性、靈活性和服務。
與此同時,VMware的客戶很快將能夠訪問VMware vSphere on Azure Arc。該服務現已全面推出,融合了Azure和VMware的基礎設施,為開發者提供支持讓他們可以使用Azure 的服務構建更複雜的應用。此外,由Azure Arc支持的Azure IoT Operations現在也已經推出預覽版,這樣客戶就可以構建複雜性較低的物聯網應用和服務,使遠程設備能夠在AI洞察的驅動下做出實時決策。
最後,微軟分享了Microsoft Copilot for Azure的一些簡要細節,該產品今天推出了預覽版。Microsoft Copilot for Azure基於生成式AI技術,使客戶能夠更輕鬆地在Azure中執行多種任務,將簡化用戶在任何環境中設計、操作應用和基礎設施以及對其進行故障排除的方式。客戶可以在該服務正式推出之前申請訪問。