更新時間:美國東部時間2024年5月30日16:43
科技行業最大的八家企業正在聯手發起UALink Promoter Group,今天讓我們來詳細介紹這項新的人工智慧硬體計劃。
該項目致力於開發一種行業標準方法,將圖形處理單元等人工智慧晶片連接在一起。該計劃的支持者表示,其目標是簡化包含大量晶片的人工智慧集群的組裝。另外一個目標是提高基礎設施的可擴展性。
UALink Promoter Group得到了晶片製造商英特爾、AMD和Broadcom的支持。雲計算三巨頭中的兩家——微軟和谷歌,以及Meta、思科和慧與也參與其中。它襯托出英偉達在GPU領域的領導地位,所有的系統都圍繞著這些晶片。
該組織計劃在第三季度成立一個正式的行業聯盟來監督開發工作。UALink Consortium(該機構的名稱)將在該季度晚些時候發布其人工智慧互聯技術的首輪疊代版本。參與該計劃的公司將可以使用該規範。
先進的人工智慧模型通常不是使用一個而是多個處理器進行訓練。每個處理器運行正在開發的神經網路的獨立副本,並用訓練數據集中的一小部分數據對其進行訓練。為了完成開發過程,這些晶片需要同步各自的神經網路副本,這就需要有一個渠道讓這些晶片可以相互交換數據。
這正是UALink Consortium計劃中的互聯所要滿足的要求。據該組織稱,這項技術將使在單個集群中連接多達1024個人工智慧加速器成為可能。此外,UALink 還能將這些集群連接到網路交換機,後者可以幫助優化各個處理器之間的數據流量。
該聯盟表示,正在開發的功能之一是促進「加速器所附內存之間的直接加載和存儲」。促進對人工智慧晶片內存的直接訪問是加速機器學習應用的一種方式。英偉達在其數據中心顯卡上採用的GPUDirect也是此類技術。
通常情況下,從一個GPU傳輸到另一個GPU的數據在到達目的地之前要經過幾個中轉站。特別是,資訊必須經過顯卡所在伺服器的中央處理器。英偉達的GPUDirect技術可以繞過中央處理器,讓數據更快地到達目的地,從而加快處理速度。
UALink Consortium至少是過去五年中成立的第三個專注於人工智慧晶片的行業組織。
人工智慧集群不僅包括機器學習加速器,還包括執行各種支持任務的CPU。2019年,英特爾發布了一種名為CXL的互連技術,可以將人工智慧加速器與CPU連接起來。它還成立了一個行業聯盟,促進該標準的開發和採用。
CXL是PCIe互連的定製版本,後者廣泛用於伺服器組件的連接。英特爾對後者的技術進行了修改,針對人工智慧進行了多項優化。其中一項優化允許人工智慧集群中相互連接的CPU和GPU互相共享內存,從而能夠更高效地交換數據。
去年,英特爾與Arm以及其他幾家晶片製造商合作,成立了一個名為UXL基金會(UXL Foundation)的人工智慧軟體聯盟。該組織的目標是簡化可在多種類型機器學習加速器上運行的人工智慧應用的開發。為此,UXL基金會正在基於oneAPI進行開發,oneAPI是一個用於構建多處理器軟體的工具包,最初由英特爾開發。