如今,人工智慧/機器學習、金融應用和邊緣計算架構等萬億級應用無處不在,而且不僅僅存在於大型組織中。這些應用將數據量推向前所未有的水平,因此需要大量存儲,以及一個如何在不消耗整體IT預算情況下持續確保性能的計劃。
許多IT領導者認為,對他們來說最具成本效益的存儲選擇是固態盤(SSD),而不是硬盤驅動器(HDD)。
但這真的如此嗎?正如數據中心運營商所知,電力、冷卻/加熱、房產和其他總體擁有成本(TCO)方面的考慮因素超出了那些必須考慮到的前期軟體和存儲介質等成本。
來自各種驅動器和存儲設備廠商和、分析師和顧問的分析表明,即使受到QLC閃存技術和存儲密度改進等創新成果的推動,SSD並不總是具有優勢的。
讓我們看看以下這三類應用以及針對每一類型應用使用硬盤驅動器和固態盤的注意事項。
應用#1:延遲敏感分析
閃存最適合以下情況:
閃存固態盤通常特別適合於那些需要隨機訪問小數據負載的應用。例如,在執行鏈中的下一步之前,對產品訂購系統進行任意查詢並使用密鑰(例如客戶姓名或電話號碼)查找客戶記錄的事務系統來說,SSD較低的延遲可以使其從中受益,邊緣應用也是如此,在這種應用中,小型物聯網或設備傳感器事件流的每條事件數據記錄承載了千字節,尤其是在工作負載規模較大時。
在這些情況下,閃存SSD要比HDD更具優勢,因為閃存SSD具有更低的延遲和更高的每秒操作數(IoP)。在這些情況下,QLC閃存的密度是現有TLC閃存的兩倍,可以提供更高的性能。
當HDD可能是更好的選擇時:
IT領導者不能假設每個延遲敏感型應用都需要SSD。企業經常會發現,通過在基於HDD的系統上運行高IoP、延遲敏感型工作負載,特別是那些針對伺服器和數據中心工作負載優化了企業級HDD的系統,可以獲得足夠的性能。數據歸檔就是其中一個很好的例子。
在歸檔、備份和媒體資產管理等應用中,毫秒級和微秒級延遲之間的差異通常不會影響最終用戶的性能。在這些情況下,HDD可能是更好的選擇,因為HDD可以滿足IT對於在符合性能預期或者超出預期的同時、仍然處於預算範圍內這二者之間的平衡要求。
應用#2:擁有PB級非結構化數據情況下對TCO的考量
最近,業界就高密度閃存SSD或者HDD是否更適用於非結構化數據應用(例如富媒體文件或傳感器數據)存儲展開了爭論。SSD支持者認為,最新版本的閃存在容量成本方面實際上能夠與HDD「持平」,甚至有人預測高密度閃存SSD將很快取代HDD,因為前者可以更好地完成所有任務。
然而,如今高密度SSD在性價比方面還無法完全取代HDD,特別是在作為整個應用工作負載的PB級非結構化數據存儲的時候。通過結合閃存和HDD來實現各自優勢,我們通常可以實現性能、長期耐用性、容量和經濟性的理想組合,這實際上是要針對特定情況利用每種存儲介質的優勢,並選擇最適合每種工作負載的恰當的存儲介質。
在提供大規模可靠性方面,HDD可能是理想的選擇,當前雲數據中心有90%的存儲容量仍然基於HDD的,這一事實就證明了這一點。
應用#3:輔助存儲或備份
一般來說,備份應用要讀取更大的文件有效負載並將其寫入存儲。就存儲系統的性能要求而言,這些工作負載幾乎與隨機IO、延遲敏感型工作負載是完全相反的。
當備份應用能夠快速順序訪問巨大的備份數據文件時,備份應用的性能最佳,吞吐量為每秒千兆字節(或每小時兆兆字節)。此外,由於當前大多數企業組織都有數百個關鍵任務應用,因此資源必須同時並行處理多個備份和恢復任務。使用共享存儲系統來防止傳統存儲孤島的蔓延,從經濟角度來說是有意義的。
對於這種類型的順序IO工作負載來說,QLC閃存解決方案和基於HDD的解決方案,二者之間的區別可以忽略不計。基於HDD的對象存儲解決方案能夠實現數十GB/秒,吞吐量足以使網路飽和。這一點至關重要,因為這裡的性能限制因素不是存儲系統,而是網路。
此外,隨著應用處理、重複數據刪除/壓縮和數據重組時間成為備份和恢復的關鍵時間考慮因素,應用本身可能成為整體解決方案性能的限制因素。因此,HDD和閃存SSD之間的吞吐量增量差異通常可以被認為是微不足道的,特別是在分析中考慮成本的時候。
小結:選擇使用HDD還是SSD取決於性能與成本之間的平衡
優化千萬億級應用的性能,這可能取決於在為應用需求匹配恰當的存儲時一個微妙但很重要的考慮因素。QLC閃存並不是一種萬能的選擇。對於延遲敏感型、讀取密集型工作負載來說,較高的成本可以為最終用戶帶來有意義的好處。然而,這並不總是適合其他類型的工作負載,其中就包括了備份——現代數據和勒索軟體安全策略的核心。
通過將性能模式與介質的優勢和成本相匹配,數據中心團隊就可以在性能和成本之間取得完美的平衡。