英偉達企業計算副總裁Manuvir Das在採訪中表示,「 如果提供一段新文本,將其轉換成嵌入形式、之後再進行存儲,那麼嵌入的大小將遠超原始文本的大小。其體量有可能擴大10倍,這代表著一種巨大且尚未被把握住的數據與存儲機遇。 」
戴爾科技副總裁董事長兼首席運營官Jeff Clarke在2024年戴爾科技世界大會上表示,如果說GPU是AI系統的大腦、網路是其心臟,那麼存儲就是AI的呼吸與脈搏。
Clarke在上月召開的展會上表示,「在我看來,存儲就是負責數據吐故納新的肺。」
戴爾Titanium級合作夥伴Advizex公司CEO CR Howdyshell表示,如今上線的計算堆棧比以往任何產品消耗的數據都多,這也對整體性能提出了新的要求。他最近剛剛與客戶達成交易,這些客戶將使用戴爾伺服器構建大規模AI計算體系。但要想使其切實生效,高質量存儲將不可或缺。
他在採訪中表示,「我們已經在關注不同規模的計算和AI需求,也意識到必須在存儲方面搶先一步。構建這些系統的客戶擁有深厚的技術積累,如果不能在存儲方面搶先一步,客戶根本就不會信任我們、自然也談不到選擇戴爾存儲。我們需要保證自身有能力討論並明確計算規模,再就配套存儲開展磋商。但在這背後,也蘊藏著巨大的新機遇。」
去年8月,戴爾宣布將調整其存儲市場營銷思路,新計劃強調「存儲合作夥伴優先」原則。戴爾的核心賣家在通過渠道合作夥伴簽下存儲訂單時,能夠獲得更高的收益激勵。
這也為Advizex等Titanium級合作夥伴,以及來自紐約州納紐埃特的VirtulT等Platinum級合作夥伴帶來了新客戶。戴爾專注於在中端存儲領域開疆拓土,並認為這部分潛在市場的總額高達130億美元。
VirtulT的John Lee表示,如今中小企業的機會在於數據和資產諮詢。只要生成式AI得到廣泛普及,他們就能快速做好業務應用的準備。
擔任VirtulT公司首席技術官的Lee認為,「更新舊有基礎設施的機會多多。我們希望幫更多客戶做好準備,這樣在實際應用生成式AI時,客戶才能擁有必要的存儲基礎設施、保證其隨時匹配計算資源。」
在上個月的戴爾科技世界大會上,戴爾基礎設施解決方案部門總裁Arthur Lewis表示,存儲業務中蘊藏的機遇「非常巨大」。
「為了更好地理解「非常巨大」的含義,我想強調的是AI工作負載帶來的數據吞吐量是傳統計算的300倍——數據吞吐量高達300倍。」他在重複了這個數字後又提到,「隨著AI的普及,市場對存儲的需求只會持續增長。」
Clarke預計到這個十年末,對存儲性能要求更高的AI系統將擁有27京次算力——相當於每秒可執行27,000,000,000,000,000,000,000,000,000,000次浮點運算。
英偉達企業計算副總裁Manuvir Das也參與到未來計算體系的構建當中,並著力將其推廣至全球各大組織機構。
他在採訪中表示,哪怕是當下,AI模型也早已不再局限於通過閱讀文本內容來實現訓練和推理,而開始處理更豐富、更複雜的多模態數據。
Das解釋道,「我們討論的是海量數據。整個生態系統即將解鎖真正強大的模型,它能與用戶提供的影片直接交互。比如說這是一段30分鐘的影片,AI模型能告訴我影片里有哪些人、誰在和誰爭吵、當時在玩什麼遊戲等等。對於影片中一切元素的提取,我們現在都擁有相應的模型。」
Das還提到,市場也不清楚AI技術具體會對存儲業務造成哪些影響。他本人於2019年離開EMC加盟英偉達,出任產品工程及非結構化數據存儲高級副總裁。
Das指出,「我認為人們還沒意識到數據中蘊藏的兩個秘密。其一是,為了讓所有檢索工作正常進行,比如說「察看PDF或文本內容」,模型實際上會創建相應嵌入、再把這些嵌入存放進向量資料庫。這代表著一種新的存儲方式。」
「如果提供一段新文本,將其轉換成嵌入形式、之後再進行存儲,那麼嵌入的大小將遠超原始文本的大小。其體量有可能擴大10倍,這代表著一種巨大且尚未被把握住的數據與存儲機遇。」
而戴爾堅信其經銷商合作夥伴會很快意識到這部分高端存儲需求,並承認儘早、儘快在該領域內拓展業務的重要意義。
Lewis則提到,「我們的軟體定義PowerScale完全是為AI所構建。通過GPU直連技術以及靈活性、可擴展性與安全性的完美結合,可以將GPU速度提升至我們AI數據平台的最高水平,實現令人難以置信的性能表現。此外,PowerScale也是首個獲得英偉達SuperPod認證的以太網存儲方案。」
在硬體方面,戴爾還推出了PowerScale F910,這是一套面向非結構化數據的高密度、高性能文件解決方案。它在2U機架平台中引入了重大硬體升級,包括搭載DDR5、PCIe Gen 5以及24塊NVMe SSD。
Lewis在戴爾科技世界大會上宣布,更強大的存儲理念也即將與全世界見面,這就是計劃於明年推出的Lightning項目。
「Lightning項目是一套將要改變遊戲規則的並行文件系統,專為AI的非結構化存儲而構建。所謂改變遊戲規則,是指與跟我們最接近的閃存橫向擴展競爭對手相比,其性能可提高20倍、吞吐量提高18.5倍,這是全新數量級下的顛覆性成果。」
隨著技術的進步以及AI模型在組織機構中的實踐應用,這些模型所需要的參數規模以及運行算力需求也將逐漸下降。但在Lewis看來,模型快速引用數據所帶來的附加存儲需求則會保持增長。
「如果大家相信算法創新能夠催生出更多體量較小的領域特定模型,那麼AI的工作方式就將轉化為在本地GPU上直接運行模型,意味著查詢操作將入駐GPU並接入模型。如果模型能夠響應則做出響應,如果不能則需要從附加存儲中提取數據。隨著模型變得越來越小,需要從附加存儲中獲取的資訊規模也將急劇增長。」
對於希望在較小模型上訓練自有數據的客戶來說,附加存儲的質量將決定整個系統的性能。
Lewis解釋稱,「在擁有4000億參數的模型當中,附加存儲性能意義不大。但隨著我們開始深入研究80億、40億乃至20億參數模型,附加存儲的重要性也將同步提升。」
Howdyshell認為,在本屆戴爾科技世界大會上展出的各類產品中,最令他眼前一亮的就是擁有5:1壓縮率的全新PowerScale。
他總結道,「這是一項非常重要的技術。結合我們以往的交易以及察覺到的未來機遇,客戶往往首先希望能夠加快計算速度,其實就是提升存儲性能。這代表著巨大的機遇,因為數據、處理數據的算力以及承載數據的存儲是一條完整的業務鏈條。到了這一步,存儲的重要性必將得到凸顯,並成為支撐性能的關鍵一環。」