Google發布全新Gemini模型,同步推出該公司功能最強大的AI加速器Cloud TPU v5p以及新的AI超級電腦。
TPU v5p是目前Google功能最強大且最具成本效益的TPU(Tensor Processing Unit),每個TPU v5p pod由多達8,960個晶片組成,使用最高帶寬的ICI(inter-chip interconnect,高達4,800 Gbps/chip)進行互聯,確保快速傳輸速度和最佳性能。與TPU v4相比,TPU v5p具有兩倍的每秒浮點運算次數(FLOPS)和三倍的高帶寬內存(HBM)。
在訓練AI模型方面,TPU v5p在大型語言模型訓練速度較TPU v4高出2.8倍。對TPU v5p每個pod的可用FLOPS而言,可擴展性比TPU v4高4倍,Google為新款TPU擠出更多算力。
TPU v4、v5e、v5p性能比較。(Source:Google Cloud Blog)
不只如此,Google推出Google Cloud的AI超級電腦,有著突破性的超級電腦架構,採用性能優化的硬體、開放軟體、領先業界的機器學習框架和靈活的AI模型集成成一整套系統。隨著Gemini模型發布,Google也展示數據中心內搭載TPU v5p的AI超級電腦,包括Salesforce和Lightricks等公司已經使用TPU v5p的AI超級電腦訓練模型。
Google展示數據中心內搭載TPU v5p的AI超級電腦。
ChatGPT的推出推動AI高速發展,為了持續開發並提供算力,大型科技公司自行研發解決方案,比方說最新的微軟Azure Maia 100、亞馬遜AWS Trainium2,加上TPU v5p,以優化硬體提升處理AI工作負載的性能。
TPU是經過Google優化調整的AI加速器,運用在Google搜索、YouTube、Gmail、Google地圖、Google Play、Android等採用AI技術的產品,新的Gemini模型使用TPU進行訓練和服務。TPU v5p將能加速Gemini發展,幫助開發者和企業客戶更快訓練大規模的生成式AI模型,進而更早推出全新產品和功能給用戶。
(首圖來源:Google Blog)