今天 ,AWS在AWS re:Invent大會推出兩款新一代自研晶片,用於通用雲計算和高效AI訓練,分別是Graviton4 和 Trainium2。
AWS使用基於Arm的Graviton系列處理器為客戶提供高性能並降低成本,以處理Amazon Elastic Compute Cloud(EC2)中的各種雲計算工作負載。據Amazon稱,與當前的Graviton3這一代處理器相比,Graviton4的計算能力提高了30%,核心數量增加了50%,內存帶寬增加了75%。
AWS計算和網路副總裁David Brown表示:「Graviton4標誌著我們在短短五年內推出的第四代晶片,是我們為各種工作負載打造的最強大的、最節能的晶片。晶片支撐著每個客戶工作負載,這是AWS創新的一個關鍵領域。」
Amazon自2018年以來一直在使用Graviton1構建自己的定製晶片,為A1 EC2實例提供動力。每一代Graviton都帶來了更高的性能、效率和更低的成本。2021年,Brown曾表示,Graviton的上市為AWS生態系統帶來了重大增長,因為客戶看到工作負載立即就得到了改善。
截至目前,AWS在全球提供超過150種不同的、支持Graviton的Amazon EC2實例,並且已經部署了超過200萬個Graviton處理器。
AWS最新的內存優化型Amazon EC2 R8g實例將支持Graviton4處理器,讓客戶能夠大規模改進高性能資料庫、內存緩存和大數據分析工作負載的運行。R8g實例將提供比當前R7g實例多3倍的大容量虛擬CPU和3倍的內存。Amazon表示,新的R8g實例目前已推出預覽版,計劃在未來幾個月內全面上市。
Trainium2:專為雲端AI訓練設計的下一代晶片
隨著當今生成式AI應用背後的AI基礎模型和大型語言模型變得越來越大,它們需要處理大量數據集,意味著訓練模型的時間和成本也在不斷增加。那些最大的、最先進的模型可以擴展到數千億到數萬億個數據點,可以生成文本、圖像、音頻、影片和軟體代碼。
今天,AWS發布了Trainium2,一款專門用於訓練FM和LLM的高性能晶片,具有多達數萬億個參數,訓練性能是第一代晶片的4倍,內存容量是其3倍。AWS還表示,該晶片的能效比第一代提高了2倍。
Brown表示:「隨著人們對生成式AI興趣日益高漲,Trainium2將幫助客戶以更低的成本和更高的能源效率更快速地訓練他們的機器學習模型。」
Trainium晶片充當了高性能人工智慧和機器學習工作負載的深度學習算法AI加速器,還針對訓練AI應用中使用的自然語言處理、電腦視覺和推薦模型進行了優化,例如文本摘要、代碼生成、問答、圖像和影片生成。
Trainium2將在新的Amazon EC2 Trn2實例中提供,其中單個實例包含16個Trainium2晶片。客戶將能夠在下一代EC2 UltraCluster中將這些實例擴展到多達10000個Trianum2晶片,並與AWS Elastic Fabric Adapter的Pb級網路互連,能夠提供高達65 exaflops的計算能力。Amazon表示,按照這樣的規模,客戶將能夠在一周內而不是幾個月培訓多達3000億個參數的大型語言模型。