宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

台積電4納米打造英偉達Blackwell架構GPU,構建迄今最強GB200

2024年03月19日 首頁 » 熱門科技

Blackwell架構GPU的體積龐大,其採用台積電的4納米(4NP) 製程技術打造而成,並集成兩個獨立製造的裸晶 (Die),共有2,080億個電晶體,然後通過NVLink 5.0界面像拉鏈一樣捆綁住晶片。英偉達使用10 TB/sec NVLink 5.0連接兩塊裸晶,官方稱該界面為NV-HBI。而Blackwell complex的NVLink 5.0界面可提供1.8 TB/秒的帶寬,是前一代Hopper架構GPU上NVLink 4.0界面速度的兩倍。黃仁勛進一步指出,英偉達最新推出的GB200 AI晶片,其中包含了兩個Blackwell GPU和一個採用Arm架構的Grace CPU。推理模型性能比H100提升30倍,成本和能耗降至25分之一。

台積電4納米打造英偉達Blackwell架構GPU,構建迄今最強GB200


GPU大廠英偉達在19日清晨在美國加州聖荷西召開的GTC 2024中,正式發布了號稱迄今最強AI晶片GB200,並計劃於2024年晚些正式出貨。由於GB200採用新一代Blackwell架構GPU,英偉達創辦人暨首席執行官黃仁勛對此表示,兩年前推出的Hopper架構GPU雖然已經非常出色了,但我們需要更強大的GPU。

黃仁勛表示,英偉達目前按照每隔2年的更新頻率,升級一次GPU架構,進一步大幅提升AI晶片的性能。英偉達於2022年發布了採用Hopper架構的H100 AI晶片之後,開始引領了全球AI市場的風潮。而如今再推出採用Blackwell架構的AI晶片性能將更加強大,更擅長處理AI相關的任務。而Blackwell架構則是以數學家David Harold Blackwell的名字命名。

台積電4納米打造英偉達Blackwell架構GPU,構建迄今最強GB200


黃仁勛表示,Blackwell架構GPU的AI運算性能在FP8及NEW FP6上都可達20 petaflops,是前一代Hopper架構運算性能8 petaflops的2.5倍。在NEW FP4上更可達到40 petaflops,是前一代Hopper架構GPU運算性能8 petaflops的5倍。而取決於各種Blackwell架構GPU設備的內存容量和帶寬配置,工作運算執行力的實際性能可能會更高。黃仁勛強調,而有了這些額外的處理能力,將使人工智慧企業能夠訓練更大、更複雜的模型。

台積電4納米打造英偉達Blackwell架構GPU,構建迄今最強GB200


台積電4納米打造英偉達Blackwell架構GPU,構建迄今最強GB200


英偉達還針對有大型需求的企業提供伺服器成品,提供完整的伺服器出貨,例如GB200 NVL72伺服器,提供了36個CPU和72個Blackwell架構GPU,並完善提供一體水冷散熱方案,可實現總計720 petaflops的AI訓練性能或1,440 petaflops的推理性能。它內部使用電纜長度累積接近2英里,共有5,000條獨立電纜。

台積電4納米打造英偉達Blackwell架構GPU,構建迄今最強GB200


而目前,亞馬遜的AWS已計劃採購由2萬片GB200晶片組建的伺服器集群,可以部署27兆個參數的模型。另外,除了亞馬遜的AWS之外,DELL、 Alphabet、Meta、微軟、OpenAI、Oracle和TESLA成為Blackwell系列的採用者之一。

(首圖來源:影片截屏)

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新