AI軍備競賽持續,全球最大的科技公司都儘可能擴大業務規模,而AMD最近在採訪中提到一個相當雄心勃勃的目標,即擁有約120萬GPU的AI集群(AI cluster),這相當於當今最強大超級電腦中GPU數量的20多倍,也代表下一代AI訓練系統在規模、功率和成本都有相當大轉變。
AMD數據中心業務副總裁兼宏觀經濟理Forrest Norrod接受媒體The Next Platform訪談時透露這個數字。在被問到客戶考慮的最大AI集群數字,Norrod直接說出120萬GPU這個數字範圍內,並補充指的是單台電腦。
這個理論數字過於龐大,能否實現仍有待商榷,不過Norrod表示,各家公司都在考慮未來AI相關項目上投入數百億甚至上千億美元。AMD以Epyc驅動的橡樹嶺國家實驗室Frontier超級電腦,在最新公布的Top500全球超級電腦排行榜中再度穩坐全球最快超級電腦,成本為6億美元。不過,這台超級電腦也只有37,888個MI250X GPU,因此擁有120萬個GPU的電腦實際更困難。
至於在GPU與NVIDIA的競爭問題,Norrod指出,AMD已經占數據中心CPU市場30%,GPU領域能否有如此多占比仍持懷疑態度。他表示,NVIDIA是市場主導者,考慮該公司在硬體、CUDA軟體都占據主導地位,這是個艱巨的任務。
(首圖來源:AMD)