HPE近日表示,正在擴展HPE GreenLake for File Storage的功能,推出了新的高密度全閃存存儲系統以支持數據湖和管理人工智慧工作負載。
HPE對於此次更新產品的性能改進做出了一些重大聲明,稱每個機架單元的容量提高了4倍,性能提高了2倍。HPE表示,通過這些改進,企業將能夠把AI吞吐量提高2倍,同時顯著降低功耗,在某些用例中能效提升高達50%。同時HPE補充說,這將使組織能夠加速他們的AI工作負載,降低功耗和整體數據中心占地面積。
HPE GreenLake for File Storage屬於HPE GreenLake即服務產品組合,讓客戶可以租用本地數據中心設備並像雲服務一樣對其進行管理。該產品由標準化的、可組合的構建塊組成,這些構建塊由計算節點、商品存儲和網路交換機組成,可以根據不同的需求進行配置。
HPE Storage產品營銷高級經理David Yu在一篇博文中表示,新產品解決了阻礙組織實現AI潛力並實現更大規模以釋放數據價值的三個關鍵挑戰。
性能提升
Yu表示,HPE GreenLake for File Storage有一些關鍵的創新,使其非常適合加速和擴展AI工作負載,包括訓練、微調和推理。他說,這些很重要,因為大規模的性能限制可能會成為AI存儲的一個巨大障礙,AI存儲可以在容量方面進行擴展,但在性能方面卻無法跟上。
他說:「HPE GreenLake for File Storage可以通過AI規模的企業性能加速數據密集型應用,能夠涵蓋了AI的所有階段——從數據聚合、數據準備、訓練和調整一直到推理。對於小的數據集來說,在某個時間點達到峰值的不僅僅是性能。相反,它是快速的、持續的性能,涵蓋整個數據規模,適用於那些最苛刻的、數據密集型的AI應用,包括生成式AI和大型語言模型。」
Yu表示,HPE GreenLake for File Storage之所以能實現這一目標,得益於它具有分解的、共享一切的以及高度彈性的模塊化架構,這種架構允許容量和性能相互獨立地進行擴展。該產品是專門針對EB級工作負載設計的,可實現快速數據傳輸,從而確保快速且可預測的性能,無需前端緩存。這種架構意味著媒介之間沒有數據移動,也沒有分層數據管道,這使其成為增強數據密集型AI應用的一個理想選擇。
簡化管理
GreenLake for File Storage還解決了傳統文件存儲的一些問題,這些問題導致AI工作負載效率極低。傳統上說,管理文件存儲需要專門的領域專業知識,並且是一個繁瑣的手動過程。然而,對於那些希望擴大AI規模的組織來說,這些管理任務是不可避免的。
憑藉類似雲的體驗,GreenLake for File Storage簡化了文件數據管理任務,減輕了IT團隊的負擔。Yu列舉了其中一系列好處,包括簡化部署、簡單設置、輕鬆創建文件共享、快速完成作業、通過可在任何位置的任何設備上訪問的單一雲控制台進行存儲管理統一化。
Yu表示,這些功能在現實世界中提供了一些優勢:「您的數據科學家和業務線應用所有者將不再承受繁瑣的、遺留的文件系統帶來的負擔,這些系統需要技術專業知識和複雜的設置流程才能運行起來。」
提高可擴展性
傳統文件存儲的第三個挑戰是和AI對存儲容量、機架空間和功耗永不滿足的需求有關的。對於傳統存儲系統來說,如果不構建全新的數據中心,將AI工作負載擴展到某個點上是不切實際的。Yu解釋說:「採用無共享架構的傳統NAS解決方案無法有效地橫向擴展,以滿足AI工作負載對容量密度、每TB成本和能效的需求。」
HPE GreenLake for File Storage採用了各種創新技術來解決這一挑戰,使組織能夠將存儲成本降低4倍,功耗降低2倍,將無開銷快照和本機數據複製等先進技術與閃存存儲的卓越效率以及HPE專有的Similarity數據壓縮算法相結合,以實現更有效的數據縮減。
此外他表示,GreenLake for File Storage現在支持通過Nvidia InfiniBand、GPUDirect和RDMA網路技術優化GPU的利用率,從而實現更快的檢查點,以加速模型訓練和調整等AI工作負載。
他說:「為了支持您的AI計劃並在當今市場中展開競爭,您需要一個支持AI的文件存儲解決方案,這個解決方案可以提供企業級的性能、簡單性和更高的效率,真正加速的AI工作負載需要AI可擴展性的所有三項指標,而且每一項對於在AI方面取得成功來說都是至關重要的。」