宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

AWS發布新消費模式:為短期AI負載提供更靈活的Nvidia GPU資源

2023年11月02日 首頁 » 熱門科技

近日AWS表示,將推出一種新消費模式,主要針對那些希望為短期AI工作負載保留雲託管GPU訪問路徑的企業。

AWS發布新消費模式:為短期AI負載提供更靈活的Nvidia GPU資源

Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML目前已經全面上市,這個模式讓客戶可以保留對位於Amazon EC2 UltraCluster中的「數百個」Nvidia最先進H100 Tensor Core GPU的訪問權限,這些GPU主要面向高性能機器學習工作負載。

要訪問EC2 Capacity Blocks,客戶只需指定所需的集群大小、未來的開始日期和所需的持續時間,他們就能夠確保有可靠地、可預測且不間斷訪問關鍵AI項目的GPU資源。

AWS表示,EC2 Capacity Blocks為客戶解決了很多問題。如今,最強大的人工智慧工作負載(例如訓練大型語言模型)往往需要大量的計算能力,而Nvidia GPU被認為是用金錢可以買到的最好的硬體之一。然而,隨著今年圍繞生成式AI的熱議,Nvidia的晶片突然出現供應短缺,沒有足夠的晶片供應給有需要的公司。

AWS表示,對於那些容量需求有波動的客戶來說,GPU短缺尤其嚴重。由於他們不需要持續使用GPU,因此當他們確實需要這些資源時,可能會很難訪問這些資源。為了解決這個問題,許多客戶承諾購買較長時間的GPU容量,但在不使用時卻將其閒置。EC2 Capacity Blocks為此類客戶提供了一種更靈活的、更可預測的方式,可以在較短時間內採購GPU容量,從而為他們提供幫助。

AWS首席開發者布道師Channy Yun將EC2 Capacity Blocks預訂比作預訂酒店房間。他在一篇博客文章中解釋說:「當你在預訂酒店的時候,你可以指定想要入住房間的日期和入住時長,以及你想要的床的尺寸——例如大床或特大號床。EC2 Capacity Blocks預定也是如此,你可以選擇需要GPU實例的日期、持續時間以及預留的大小(實例數量)。在預留開始日期,你就可以訪問預留的EC2 Capacity Blocks並啟動P5實例。」

AWS解釋說,EC2 Capacity Blocks部署在EC2 UltraClusters中,並與Elastic Fabric Adapter Pt級網路互連,以確保低延遲和高吞吐量連接。正因為如此,它可以擴展到數百個GPU。客戶可以提前八周預訂1到64個實例的GPU集群,時間為1到14天。AWS表示,這種模式非常適合AI模型的訓練和微調、短期實驗運行、以及應對預期的需求激增例如推出新產品的時候。

AWS公司計算和網路副總裁David Brown表示:「藉助Amazon EC2 Capacity Blocks,我們為企業和初創公司增加了一種新的方式,讓他們能夠以可預測的方式獲取Nvidia GPU容量,用於構建、訓練和部署他們的生成式AI應用。」

AWS客戶現在可以使用AWS Management Console、Command Line Interface或者Software Development Kit來查找和預留GPU容量,從AWS美國東部(俄亥俄)區域開始,稍後將增加更多區域和本地區域。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新