宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

英偉達產能一路擴大,主權AI惠及全球各國

2024年11月15日 首頁 » 熱門科技

英偉達產能一路擴大,主權AI惠及全球各國

長久以來,將大量GPU出售給超大規模計算基礎設施運營商和雲服務商,一直是擴大生成式AI模型並展示其能力的最佳方式,同時充分證明生成式AI對於全球各國的重要戰略意義。但大規模雲環境往往由美國和中國的企業控制,因此讓很多人心存疑慮。

隨著英偉達逐漸擴大「Hopper」和「Blackwell」GPU的產能,並找到新的途徑能夠滿足超大規模計算設施運營商、雲服務商乃至更多政府部門和企業的硬體資源需求,主權AI雲的概念也就此一飛沖天。相信各位也都能想到,此番浪潮之下受益最大的就是英偉達自己。

上個月,英偉達公司CEO黃仁勛在印度提出了這一「主權AI」觀點,宣布與印度各主要IT廠商及雲服務商建立合作夥伴關係,包括Reliance Industries、Infosys、Yotta Data Services、Tata Communications以及Tech Mahindra,旨在擴大AI科技在整個印度經濟體系中的應用。

黃仁勛當時指出,「印度應當構建自己的AI,而且有著充分的理由。一個國家不能總是通過出口數據的形式來換取智能資源。」

這對此類國家不啻為一個福音,意味著他們將逐漸掌控一種新興技術,進而從諸多方面在根本上改變其商業乃至全社會的運作模式。主權AI也將成為英偉達的一大勝利,因為其能夠將這個概念傳播到全世界,激起更多國家的建設意願。英偉達預計到今年年底,該公司在印度的GPU部署量將增長近10倍。

本周,這家GPU製造商在東京召開的AI峰會則將焦點集中在日本。黃仁勛與軟銀集團董事長兼首席執行官孫正義坐在一起,討論了英偉達和日本在運用AI以及英偉達軟硬體組合在實現這一目標方面的宏偉抱負。

據報道,日本官員希望通過寬鬆的監管方式讓日本成為AI友好型國家,從而吸引更多AI廠商進入該國。黃仁勛和其他英偉達公司高管則盛讚了日本的創新歷史,以及該國濃厚的技術應用氛圍和良好的AI技能儲備。

英偉達公司電信業務高級副總裁Ronnie Vasishta在影片採訪中告訴記者,「日本正身處這一轉型的前沿,採用英偉達AI基礎設施的日本雲計算領先廠商將幫助日本推動各最重要行業的轉型,使其建設主權AI的雄心真正落地。」

英偉達還指出,他們已經在AI項目上與眾多日本企業開展合作,而其中最具份量的當數同日本跨國集團軟銀的合作。軟銀將成為第一家使用英偉達Blackwell平台構建其超級電腦(也將成為日本最強大的超級電腦)的公司。

軟銀集團將使用英偉達的DGX B200系統作為其英偉達DGX SuperPOD超級電腦的基礎,這套超級電腦系統在幫助軟銀實現生成式AI目標之餘,也將向日本的其他企業、大學以及研究機構開放訪問。DGX B200系統於今年3月首次公布,搭載8張Blackwell GPU,採用英偉達公司第五代NVLink實現互聯互通,可為每張GPU提供1.8 TB/秒的雙工吞吐量。

該平台還包含一套專用的RAS(可靠性、可用性及可維護性)引擎和一套解壓縮引擎,用於加快資料庫的查詢速度。據英偉達方面介紹,該平台的AI模型訓練性能可達其前代產品的三倍,推理性能更是達到其前代產品的15倍。

軟銀這套超級電腦系統還將採用英偉達的AI Enterprise軟體以及Quantum-2 InfiniBand網路,大大降低大語言模型(LLM)的開發門檻,在主權AI概念的推動下更好地為日語用戶提供服務。

軟銀還計劃使用英偉達的Grace-Blackwell平台構建起另一套基於英偉達架構的超級電腦系統,該平台採用GB200 NVL72液冷機架級系統,其中同時搭載Blackwell GPU以及基於Arm的Grace CPU。這套系統將主要用於計算極端密集型工作負載。

介於兩者之間的另一個項目,則是由軟銀集團和英偉達共同開發的AI-RAN——這是一套可同時運行AI及5G工作負載的電信網路。

英偉達的Vasishta解釋稱,「要實現AI科技的大眾化,首先需要建議起國家級的AI基礎設施。這些AI設施的作用就是創造智能,也就是構建並訓練出能夠為日本產業服務的全新模型。與此同時,還需要一套交付網路來實現智能資源分發,使得AI推理儘可能靠近端點。AI應用程序則需要配合這些AI原生端點以使用智能資源。」

該網路將使用軟體定義的5G射頻協議棧,其中包括基於英偉達Aerial加速平台的L1軟體。兩家公司已經在選定的日本地區對AI-RAN網路進行了戶外測試,並實現了運營商級的5G性能,同時利用網路中的過剩容量運行了AI推理作業。軟銀方面估計,為了應對峰值期高企的臨時負載,傳統電信網路在大部分時間裡只使用到了三分之一的容量。

軟銀方面表示,他們納入企業環境的英偉達Aeria RAN Computer-1系統在運行時將比傳統5G網路基礎設施節約40%的電力。軟銀的孫正義在與黃仁勛同台時指出,「通過我們攜手打造的這套智能網路,日本基礎設施智能將就此迎來一顆巨大的神經大腦。」

對於電信業務來說,由於能夠在同一網路之上運行AI類工作負載,因此也將開闢出新的收入來源。英偉達和軟銀估計,電信企業在新的AI-RAN基礎設施上每投資1美元,就能從AI推理收入方面獲得約5美元的回報。軟銀還估計,他們每增加一台AI-RAN伺服器,就能獲得高達291%的回報。

英偉達還建立了其他合作夥伴關係,包括與GMO Internet Group、KDDI以及Sakura Internet等雲計算廠商合作,共同依託英偉達的硬體和軟體構建國家AI基礎設施網路,推動日本在機器人、醫療保健和藥物研究等領域中的AI創新。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新