宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

西部數據與夥伴的故事五:ChatGPT橫空出世,數據基礎設施如何破局?

2023年04月27日 首頁 » 熱門科技

ChatGPT大模型應用的火爆,讓業界把目光再次聚焦到了人工智慧應用上,人工智慧好不好用,由包括數據、算力和算法三大要素決定。而支撐著三大要素的底座就是包括伺服器、存儲和網路等組成的數據基礎設施。

西部數據與夥伴的故事五:ChatGPT橫空出世,數據基礎設施如何破局?

至頂科技推出的系列訪談節目《論存儲新技術 道數據新價值》,繼續邀請西部數據和他的夥伴一起聊聊數據背後的故事。本期節目,寶德電腦系統股份有限公司總經理馬竹茂、西部數據中國區技術支持高級總監宋磊和至頂科技總經理高飛針對目前火熱的ChatGPT為切入點,一起暢談人工智慧技術和應用的發展帶來的數據機遇以及背後需要怎樣的數據基礎設施。

AI帶來的數據新機遇

要實現數據價值,必須發揮好人工智慧三個核心要素算力、算法和數據。「我們如果把人工智慧的應用想像成一個強大的機器,它的算法就是機器的引擎,算力是推動這個引擎的加速器,關鍵的數據其實就是讓這個引擎能夠正常運轉必不可缺的燃料。」 西部數據中國區技術支持高級總監宋磊這樣解釋AI三要素之間的關係。

而圍繞數據、算力和算法的IT基礎設施這些年也在不斷創新發展。我們從寶德伺服器二十多年的發展就可以看出相關變化,從早期的PC為中心的局域網對於伺服器的單點需求,到2007年,賈伯斯推出了智慧型手機以後,開啟了移動網際網路時代,一方面催生了雲計算和數據中心的發展,另一方面產生了大量的非結構化數據,對數據中心的存儲需求越來越大。單個伺服器的硬盤數量也從早期的兩塊硬盤增加到了現在的24塊、48塊大容量硬盤。

西部數據與夥伴的故事五:ChatGPT橫空出世,數據基礎設施如何破局?

於此同時,Gartner預測到2025年,基於 AI的內容生成的數據將占到整個數據量10%。 「AI的發展利好伺服器和存儲市場,包括像ChatGPT的應用,會對算力要求越來越高,背後需要海量的AI伺服器。隨著國內相關大模型應用的推出,對伺服器需求會越來越大,所以對寶德科技而言,是非常大的利好。」 寶德電腦系統股份有限公司總經理馬竹茂表示。

面向AI,數據基礎設施新挑戰

如今在「3060」雙碳目標的背景下,明確規定了數據中心能耗效率值(PUE),比如「東數西算」工程對數據中心PUE值提出了明確要求:西部要低於1.2,其他地區要低於1.25,而示範項目要低於1.15。於此同時,現在一年產生的數據比人類過去幾千年產生數據總和還要多。結合當下的AI應用的爆發,對伺服器的設計和創新產生新的挑戰。

「簡單來說,AI應用給伺服器帶來兩大挑戰:一個費電、一個費錢。」 馬竹茂講到。費錢指的是生產過程中的成本挑戰,通用伺服器以CPU為核心,人工智慧伺服器包括GPU、TCU、NPU、XPU、FPGA等加速卡,過去一台伺服器幾萬,現在添加一塊加速卡有時候就幾萬。

西部數據與夥伴的故事五:ChatGPT橫空出世,數據基礎設施如何破局?

費電指的是使用過程中的功耗挑戰,人工智慧伺服器裡面除了CPU、幾十塊硬盤之外,還包括GPU等加速卡,每台伺服器如果都進化到AI伺服器,那麼從CPU到GPU會增加上幾百億個電晶體,增加幾百瓦的發熱功耗,那麼對上萬台甚至數十萬台伺服器的數據中心的能耗就形成了很大挑戰。」 馬竹茂解釋到。

而AI時代,不僅數據量爆炸式增長,而且對數據質量要求也越來越高。以ChatGPT 4.0來舉例,它在訓練時候使用到了45TB的數據,有近一萬億個數據量,數十億行的源代碼。大家都驚嘆於ChatGPT流暢互動的界面,其背後是海量的知識量以及需要處理海量數據的算力。 「本質上講數據的數量和質量決定了人工智慧整體的落地水平。」 宋磊分享到。

要實現海量數據的存儲和數據高質量的提取,不僅考驗算力,也對硬盤的性能、容量、延遲等方面都提出更高的要求。「結合人工智慧應用從數據角度來說,它的訓練需要海量數據尤其是PB級的數據,需要更大的存儲容量,同時在訓練過程中這些數據寫得少,讀得多,還需要更高的吞吐量,以及對延遲、性能都有更高的要求。」 宋磊講到。

面對AI新挑戰,雙方攜手破局之道

一方面AI伺服器面臨的能耗挑戰、成本挑戰,另一方面在數據層面還面臨對於大容量、高性能的存儲需求,因此如何構建綠色高效、高速共享的AI伺服器架構成為雙方的應對之道。

「要打造智能化的計算平台,寶德發揮CPU GPU異構設計優勢,完成了人工智慧訓練和推理、高密度系列和大容量存儲系列相關產品的擴展和升級,並且加大在自主研發、方案優化、專業服務和智能生產等方面的投入。」馬竹茂表示。

針對功耗和成本,寶德AI加速伺服器採用第四代英特爾至強可擴展處理器,來提供強大的計算能力,支持DDR5、PCIe 5.0和HBM,性能提升高達50%;同時可以支持24個2.5」SATA/SAS/NVMe和2個後置2.5 」SATA/SAS熱插拔硬盤,支持內置1個M.2(NVMe/SATA),保障了整機性能的強勁可靠;面向CPU GPU異構設計,還具有智能散熱系統,可以根據熱關鍵器件的溫度綜合調節風扇轉速;並支持液冷散熱方案,可以有效減少數據中心客戶的整體碳排放,顯著降低客戶TCO(總體擁有成本)。

面向AI應用,西部數據也用創新的思維重新審視存儲的架構,根據數據的使用頻率和場景,通過對數據進行分層存儲,來實現成本、性能、能耗和擴展之間的平衡。

西部數據與夥伴的故事五:ChatGPT橫空出世,數據基礎設施如何破局?

具體而言將數據分為極熱數據、熱數據、溫數據、冷數據和極冷數據。極熱存儲適用於內存DRAM;熱存儲方面,用戶希望快速訪問高價值數據,進行業務的預測或決策等,適用於高性能SSD;溫存儲則代表了讀取較頻繁,有較高性能IOPS和帶寬要求,主要以主流SSD或HDD為主;冷存儲則是少量寫入,多次讀取,適用於高密度大容量的企業級硬盤,目前西部數據已推出22TB CMR HDD;極冷存儲則用於大塊寫入,寫入次數較少的數據保存,可以用SMR HDD來滿足需求, 其最高容量能達到26TB。

以西部數據推出的HelioSeal氦氣密封技術為例,西部數據Ultrastar系列企業級硬盤HDD 採用的第7代充氦氣密封技術,實能夠實現了更低功耗帶來(W/TB) 更高功效。不僅如此,氦氣填充硬盤還因為內部填充氦氣,外部密封的獨特優勢,甚至能夠在全浸沒式液冷環境中穩定運行。實現了超大規模、雲和企業級存儲環境下,在提供高容量的同時,減少熱排放,支持雙碳減排;同時降低系統散熱設計複雜性來實現運營成本的降低。

「通過數據分層存儲,可以更好的和寶德這樣的行業領先的解決方案提供商一起重新審視存儲架構,一起為客戶提供按需分配的創新的存儲解決方案。」 宋磊講道。

訪談最後,雙方表示將繼續在產品、技術、市場等方面進行持續合作。在產品上,西部數據會第一時間把最新的產品應用到寶德的伺服器上;在技術上,雙方聯合實驗室持續優化解決客戶面臨的存儲問題。「硬盤很小,但是很複雜和精密,伺服器上的風扇選的不對,風力都會影響到機械硬盤的穩定性、讀寫速度。」 馬竹茂講到。在市場上,雙方將聯合推進包括巡展、客戶交流等市場活動。實現通過全面合作,來持續為用戶提供領先的解決方案,加速企業數字化轉型。

歡迎觀看完整版影片,了解更全面的內容:

https://www.zhiding.cn/special/westerndigital_2022_PowerLeader

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新