宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

NVIDIA GTC 2023讓AI晶片市場捲起來

2023年03月22日 首頁 » 熱門科技

一大早被NVIDIA GTC的新聞刷屏了,印象深刻的是黃教主說「我們正處於AI的iPhone時刻」。就像二戰時候的諾曼底登陸,iPhone成為傳統手機與智慧型手機的分水嶺。

NVIDIA GTC 2023讓AI晶片市場捲起來

近期ChatGPT的持續火爆無疑為點燃了人們對於AI的樂觀清晰,而作為為AI提供「燃料」的NVIDIA也成為關注的焦點。

不妨我們盤點一下這次GTC大會上的重點發布:

1、NVIDIA DGX Cloud人工智慧雲服務,它可以讓企業快速訪問為生成式人工智慧和其他開創性應用訓練高級模型所需的基礎設施和軟體。

2、NVIDIA cuLitho,這是一套可以集成在NVIDIA Hopper架構中的光刻庫。使用NVIDIA cuLitho軟體庫加上NVIDIA Hopper GPU替代目前光刻機上使用的CPU,整體的效率可以提升40倍左右,減少目前每年消耗數百億CPU小時的大量計算工作負載。

3、用於普及生成式AI的推理平台。NVIDIA推出了用於AI推理的DGX H100計算平台,以及H100 NVL、L4 GPU。

4、BlueField-3 DPU,通過從CPU卸載數據中心基礎設施任務來大幅提升性能和效率。因此它可以將工作負載的運行速度提高8倍。

5、二合一超級晶片,去年在GTC 2022上,英偉達發布了首款用於數據中心的CPU架構「Grace」,以及已經上市的高性能計算GPU架構「Hopper」。而基於這兩種架構,打造了超級晶片——Grace CPU+Hopper GPU。

6、NVIDIA聯合Quantum Machines推出量子級運算系統「DGX Quantum」,這是首個結合GPU與量子運算的系統。該加速運算的系統將NVIDIA的Grace Hopper超級晶片與CUDA Quantum開源平台,以及Quantum Machines的量子處理器OPX+結合,使其兼具量子運算與經典運算。

7、面向元宇宙領域,NVIDIA推出了第三代OVX計算系統和新一代工作站,為基於NVIDIA Omniverse Enterprise的大規模數字孿生提供動力。

……

其實GTC的發布還有很多,我這裡只是列舉出了事關半導體晶片,從這一列的發布,我們不難看出雖然半導體市場從去年開始已經呈現了趨緩狀態,但是AI算力晶片更卷了。

算力雲化趨勢不改

雲計算實現了計算的服務化,而AI對算力的需求更大,巨量的雲端算力勢在必行。

NVIDIA DGX Cloud提供NVIDIA DGX AI超級計算專用集群,每個DGX Cloud中都集成了8個NVIDIA H100或A100 80GB Tensor Core的GPU,每個節點合計有640GB的GPU,這個巨大的GPU可以滿足高級AI訓練的性能要求。

AI訓練方面,英偉達H100 GPU基於Hopper架構及其內置Transformer Engine,針對生成式AI、大型語言模型和推薦系統的開發、訓練和部署進行了優化,利用FP8精度在大型語言模型上比上一代A100提供了快9倍的AI訓練和快30倍的AI推理。

除了算力供給,NVIDIA宣布了一個全新的NVIDIA AI Foundations模型,涵蓋NVIDIA NeMo語言和NVIDIA Picasso圖像、影片和3D等服務。

面向AI推理

眾所周知,GPU更多是面向AI訓練,而是AI還需要推理。NVIDIA宣布推出3款全新推理GPU,分別擅長AI影片、圖像生成、ChatGPT等大型語言模型的推理加速。

H100 NVL的推出,是為了服務於大型語言模型的服務提供商,配備雙GPU NVLink,將兩張擁有94GB HBM3顯存的PCIe H100 GPU拼接在一起,可處理擁有1750億參數的GPT-3大模型,同時支持商用PCIe伺服器輕鬆擴展。

L4 GPU專門用於為AI生成影片提供硬體支持。NVIDIA表示,它處理AI生成影片的能力是CPU的120倍,能效提高了99%。一台8-GPU L4伺服器將取代100多台用於處理AI影片的雙插槽CPU伺服器。

半導體即AI

晶片生產離不開光刻,光刻是晶片製造過程中最複雜、最昂貴、最關鍵的環節,其成本約占整個矽片加工成本的1/3甚至更多。NVIDIA cuLitho將AI帶到了晶片生產的源頭。

NVIDIA GTC 2023讓AI晶片市場捲起來

目前半導體不斷提升nm極限,但是挑戰也越來越大。光刻計算庫cuLitho將計算光刻加速40倍以上,使得2nm及更先進晶片的生產成為可能。

NVIDIA目前已經和AMSL、台積電(TSMC)以及新思科技(Synopsys)建立了合作關係,ASML計劃將搭載了NVIDIA cuLitho軟體庫的NVIDIA Hopper GPU集成在他們所生產的光刻機設備中去。

在晶片的光刻過程中,500個NVIDIA DGX H100組成的系統能夠全面覆蓋當下40000個CPU伺服器相當的工作量。在集成了cuLitho軟體庫之後,晶圓廠每天生產掩模的速度相比當下提升了3-5倍,使用的功率比當前減少了9倍。

DPU與量子計算

目前晶片異構是趨勢,而NVIDIA 3U一體戰略就是瞄準CPU、GPU、DPU。

數據處理單元(DPU)方面,黃仁勛宣布英偉達BlueField-3 DPU已投入生產,並被百度、CoreWeave、京東、微軟Azure、Oracle OCI、騰訊遊戲等領先的雲服務提供商所採用,以加速其雲計算平台。

傳統經典計算雖然還在發揮重要作用,但是量子計算也已經在路上。面向量子計算,要從量子噪聲和退相干中恢復數據,需要對大量量子比特進行糾錯。對此,英偉達與Quantum Machines合作推出了一個量子控制鏈路,它可將英偉達GPU連接到量子電腦,以極快的速度進行糾錯。

雙方合作研發的全球首個GPU加速量子計算系統NVIDIA DGX Quantum,將強大的加速計算平台(由NVIDIA Grace Hopper超級晶片和CUDA量子開源編程模型支持)與全球最先進的量子控制平台OPX結合在一起,使研究人員能夠構建強大的應用,將量子計算與最先進的經典計算結合起來,實現校準、控制、量子糾錯和混合算法。

NVIDIA DGX Quantum的核心是NVIDIA Grace Hopper系統,通過PCIe連接到通用量子控制系統Quantum Machines OPX+,實現QPU和量子之間的亞微秒延遲處理單元(QPU)。

DGX Quantum還為開發人員配備了一款強大的混合GPU-Quantum編程模型NVIDIA CUDA Quantum,可以在一個系統中集成QPU、GPU、CPU並進行編程。多家量子硬體公司將CUDA Quantum集成到他們的平台中。

元宇宙時代的算力

雖然元宇宙的風頭被ChatGPT搶了很多,但是元宇宙的前景還是非常吸引人的。

NVIDIA GTC 2023讓AI晶片市場捲起來

針對元宇宙的算力需求,第三代OVX伺服器通過組合雙CPU平台、BlueField-3 DPU、L40 GPU、兩個ConnectX-7 SmartNIC和NVIDIA Spectrum以太網平台,提供了突破性的圖形和AI性能,可加速大規模數字孿生模擬等應用,進而提高運營效率和預測性規劃功能。

企業可以利用OVX性能在可視化、虛擬工作站和數據中心處理工作流程等方面進行協作。

此外,新一代NVIDIA RTX工作站RTX 4000 SFF Ada Generation採用英偉達Ada Lovelace GPU、ConnectX-6 Dx SmartNIC和英特爾至強處理器。最新發布的RTX 5000 Ada一代筆記本電腦GPU使專業人士能隨時隨地訪問Omniverse和工業元宇宙工作負載。

結語

21世紀什麼最貴?人才,我覺得算力才對。

特別是ChatGPT掀起的大模型浪潮,其對算力的需求是巨大的,簡直是驚人的。隨之而來的就是Money。

目前整個算力產業鏈都在積極努力,不管是NVIDIA這樣的晶片廠商,還是雲廠商,他們無一例外嘗試解決算力供給問題。

本屆GTC大會應該是一場算力盛宴,也拉開了AI晶片的激烈競爭大幕。只要AI的浪潮此起彼伏,算力市場也就不會沉默,一場場好戲也將輪番登場。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新