宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

數據中心正常運行時間的最大威脅及其應對方法

2024年08月16日 首頁 » 熱門科技

如果想提高數據中心的正常運行時間的話,就需要識別並減少最常見的故障源。這可能具有一定的挑戰性,因為導致數據中心宕機的原因有很多,通常都不可能一下子解決所有的問題。數據中心運營商需要決定優先處理哪些正常運行時間的威脅。

數據中心正常運行時間的最大威脅及其應對方法

美國正常運行時間研究所(Uptime Institute)的一份新報告在這方面提供了寶貴的指導。該報告詳細介紹了截至 2024 年最常見的數據中心正常運行時間挑戰,並對於一些會觸發數據中心中斷的事件揭示了一些令人驚訝的發現。

數據中心正常運行時間的最大威脅

有些人可能會認為,造成數據中心宕機的最常見原因是網路攻擊或極端天氣之類的風險,每當這一類風險發生時往往會受到媒體的大量關注。

但實際上,從數據中心正常運行時間的角度來看,這些風險幾乎可以忽略不計。導致大多數數據中心故障的核心問題可以分為以下幾類。

1、物理系統故障

電源問題是數據中心最常見故障的原因。根據 Uptime Institute 的報告,電源問題占所有數據中心故障的 52%。

另有 19% 的故障源於數據中心的冷卻問題,Uptime Institute 將其與電力系統問題分開歸類。

這意味著數據中心最大的正常運行時間風險明顯是物理系統故障。數據中心運營商希望提高正常運行時間的話,就應該在冗餘能源供應或暖通冷氣系統等解決方案方面進行投資。

2、第三方提供商的挑戰

數據中心正常運行時間面臨的第二個最常見威脅是 Uptime Institute 稱之為有關第三方提供商的問題。這個問題指的是,企業通過外包協議或類似安排與服務提供商簽訂合同管理數據中心,而服務提供商導致了故障的發生。

至於轉為數據中心內部運營能否能緩解這一問題是很難說的。按理說,數據中心外包公司專門從事數據中心的日常運營,其正常運行率可能比那些不以數據中心管理為重點的企業要高。但每個人在這方面的體驗可能會有所不同,這取決於企業內部的員工是否擅長管理數據中心。

無論如何,這個數據點提醒我們,如果選擇第三方提供商來管理數據中心的運營,那麼就應該詢問第三方提供商的正常運行時間記錄,以確保提供商不會成為數據中心可用性戰略中最薄弱的環節。

3、IT 設備故障

IT 系統硬體和軟體故障是造成數據中心停機的第三大常見原因,這並不奇怪,因為自從數字時代開始以來,企業就一直在為伺服器的崩潰而苦惱。

沒有靈丹妙藥可以降低這種風險,但還是有一些屢試不爽的策略,例如更多地在更好的監控和可觀察性解決方案上投資,創建備份 IT 環境並配備自動故障轉移控制,以便在伺服器崩潰時,其工作負載可以立即轉移到另一台伺服器上。

 4、網路故障

網路故障與 IT 設備故障類似:二者導致數據中心宕機的比率幾乎完全相同,也是企業長期以來一直面臨的一類挑戰。

與增加 IT 設備正常運行時間一樣,提升數據中心網路可靠性的策略包括更好地監控網路和在網路中構建冗餘,使得數據包可以在網路部分出現故障時選擇替代路徑。

更廣泛地使用軟體定義網路也可以提高網路可靠性,使用軟體控制而不是物理網路設備可以更容易識別和緩解故障。

其他數據中心正常運行時間挑戰

火災和資訊安全事件也出現在Uptime Institute的數據中心停機原因排行榜上,但也只是勉強上榜,分別僅占所有停機事件的 3% 和 1%。

當然,這並不是說不應該投資防火措施和網路安全保護措施。但在考慮要優先哪些類型的數據中心正常運行時間風險時,數據顯示這兩項不應該是清單上的唯一行動。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新