Google打造新一代TPU v5p和AI超級電腦，加速Gemini模型發展

Google發布全新Gemini模型，同步推出該公司功能最強大的AI加速器Cloud TPU v5p以及新的AI超級電腦。

贊助商廣告

TPU v5p是目前Google功能最強大且最具成本效益的TPU（Tensor Processing Unit），每個TPU v5p pod由多達8,960個晶片組成，使用最高頻寬的ICI（inter-chip interconnect，高達4,800 Gbps/chip）進行互聯，確保快速傳輸速度和最佳性能。與TPU v4相比，TPU v5p具有兩倍的每秒浮點運算次數（FLOPS）和三倍的高頻寬記憶體（HBM）。

在訓練AI模型方面，TPU v5p在大型語言模型訓練速度較TPU v4高出2.8倍。對TPU v5p每個pod的可用FLOPS而言，可擴展性比TPU v4高4倍，Google為新款TPU擠出更多算力。

TPU v4、v5e、v5p性能比較。（Source：Google Cloud Blog）

不只如此，Google推出Google Cloud的AI超級電腦，有著突破性的超級電腦架構，採用性能優化的硬體、開放軟體、領先業界的機器學習框架和靈活的AI模型集成成一整套系統。隨著Gemini模型發布，Google也展示數據中心內搭載TPU v5p的AI超級電腦，包括Salesforce和Lightricks等公司已經使用TPU v5p的AI超級電腦訓練模型。

Google展示數據中心內搭載TPU v5p的AI超級電腦。

ChatGPT的推出推動AI高速發展，為了持續開發並提供算力，大型科技公司自行研發解決方案，比方說最新的微軟Azure Maia 100、亞馬遜AWS Trainium2，加上TPU v5p，以優化硬體提升處理AI工作負載的性能。

TPU是經過Google優化調整的AI加速器，運用在Google搜索、YouTube、Gmail、Google地圖、Google Play、Android等採用AI技術的產品，新的Gemini模型使用TPU進行訓練和服務。TPU v5p將能加速Gemini發展，幫助開發者和企業客戶更快訓練大規模的生成式AI模型，進而更早推出全新產品和功能給用戶。

（首圖來源：Google Blog）