Meta去年公開首款自研晶片MTIA(Meta Training and Inference Accelerator)成果,第一代MTIA(MTIA v1)即采台積電7納米製程,下一代MTIA同樣委由台積電生產。
在英特爾、Google發布最新AI晶片之後,Meta 10日也公開自研晶片開發成果。MTIA v1後繼產品官方稱為下一代MTIA(Next Gen MTIA),它執行的模型用於處理與AI推薦系統相關的工作。與台積電7納米製程構建的MTIA v1相比,下一代MTIA採用5納米製程。
下一代MTIA配備更多處理核心,擁有更多on-chip memory(256MB對比MTIA v1 128MB)和off-chip LPDDR5(128GB對比MTIA v1 64GB),並以更高的平均時脈速度運行,從800MHz上升到1.35GHz,同時功耗增加(90W對比MTIA v1 25W)。
Meta指出,下一代MTIA目前已投入16個數據中心區域使用。Meta評估的四個關鍵模型中,下一代MTIA性能比MTIA v1提升3倍,「由於我們控制整個堆棧,所以與商用GPU相比,可以完成更高的運算效率」,Meta博客文章寫道。
Meta也透露,目前還沒有使用下一代MTIA訓練生成式AI,儘管該公司聲稱有多項項目正在進行。此外,Meta承認下一代MTIA不會取代目前用於訓練模型的GPU,而是補充計算資源。
英特爾最新發布Gaudi 3,聲稱能源效率比NVIDIA H100晶片高40%,推論速度快50%。Google正向Google Cloud客戶推出用於訓練AI模型的TPU v5p,並發布首款為數據中心設計的Arm架構AxionCPU。亞馬遜擁有多款自研AI晶片,微軟去年也已AI晶片Azure Maia 100和雲計算處理器Azure Cobalt 100參戰。
Meta近年不遺餘力加強AI技術開發,自行研發定製化晶片以滿足運算需求。該公司一直是NVIDIA H100 GPU的大客戶,今年底前Meta運算基礎設施預計採購達到35萬顆H100。同時MTIA系列晶片開發也將加速進行,希望在AI軍備競賽趕上競爭對手。
(圖片來源:Meta)