5個9可用性:真正含義是什麼

2021.07.09

5個9的的可用性(即99.999%)是指使用者在給定時間段(通常定義為一年)內可以存取網路元件或服務的時間百分比。 從專有網路遷移到雲服務使得企業要求服務提供者提供5個9的可用性。 現在企業正不斷添加更多關鍵任務應用程式和服務,這些服務必須是高度可用,並且將停機時間保持在最低限度,這一點至關重要。 當資源無法訪問時,員工、客戶和供應鏈合作夥伴就無法再訪問他們需要的資訊或服務。
  

5個9和其他百分比的可用性  

儘管目標是100%的可用性,但期望全年每天每分鐘都可以使用服務是不合理的。 維護、升級和無法控制的事件(或不可抗力)使供應商無法保證100%的正常運行時間。 5個9可用性服務級別協定 (SLA) 要求很高; 它要求給定服務每年不可用的時間不超過5分15秒。 SLA所涵蓋的服務可用性為4個9(即99.99%),每年可能有52分36秒不可用。 三個9的可用性(99.9%)允許每年8小時46分鐘的停機時間。

保持5個9的服務可用性百分比需要大量投資和維護,通過使用已建立的網路配置、監控和排除網路問題,並遵循最佳做法以確保系統元件保持正常運行。 每小時某個服務不可用可能使公司損失數百萬美元。

實現5個9可用性  

如何得到更多的9?考慮以下步驟:
購買最容易維修的最好設備。 然後,添加負載平衡、故障轉移和冗餘。 高度可用的系統通常包括電源和處理器、備用電池、柴油或天然氣發電機(用於比電池可處理的停電時間更長的停電時間)、多條不同的通信線路以及可能出現故障的任何其他設備。  
在可能的情況下,自動監控網路性能並標記潛在故障。 自動化工具、網路分析軟體(持續跟蹤網路元件健康情況),以及人工智慧和機器學習等技術,可以幫助運營商減少人為錯誤的機會,並確保他們的網路保持正常運行。 此外,人工智慧和機器學習平臺可以在出現網路問題或安全漏洞時,主動提醒網路運營商,並在必要時自動將操作從故障元件轉移到備份。
* 注意軟體。 過時或未打補丁的軟體可能會導致5個9的可用性變得不可能。 如果某個特定元件由於操作系統故障而出現故障,並且需要很長時間才能恢復連線,那麼可用性將受到影響。  
測試備份和災難恢復計劃以確保它們足夠應對災難事故。