網絡可觀察性的3個優秀做法

2021.06.28
網絡可觀察性是開發網絡智能的重要方法,但很多網絡團隊沒有使用這種方法。

觀察網絡可能會顯著提高企業網絡運營 (NetOps) 的成功率。企業團隊可以採取幾個步驟來實現網絡可觀察性,這樣做將使網絡管理員能夠更好地了解他們的網絡,並保證為其最終用戶提供足夠的服務。





什麼是網絡可觀察性?
當團隊監控網絡時,他們會關注網絡的性能。如果網絡中出現問題,通過監控,網絡管理員能夠檢測到問題。雖然團隊能夠通過管理和監控解決網絡問題,但網絡可觀察性可以提供對網絡更徹底的評估。當團隊觀察網絡時,他們的目標是了解問題如何發生、如何糾正問題以及如何改進網絡,以防止未來發生錯誤。

軟件工程諮詢公司Data Ductus的首席技術官Göran Edin在最近的網絡研討會上說,網絡可觀察性也可以定義為“在盡可能短的時間內,解決重建最終用戶體驗狀態變量的問題-對比測量到的狀態變量”。

Edin的定義是對Rudolf Kalman對控制系統可觀察性定義的修正,他列出以下原則,企業可用於使其網絡服務具有可觀察性:

衡量最終用戶體驗;
使用遙測方法來收集數據;
提供服務保證,確保為客戶提供優質服務。
1. 關注最終用戶體驗
研究表明,衡量最終用戶體驗具有積極影響。根據Enterprise Management Associates對2020年網絡管理大趨勢進行的研究表明,三分之一的IT問題由最終用戶報告,然後NetOps團隊才檢測到這些問題。在受訪者中,那些衡量和監控最終用戶體驗的企業,運營更為成功。

雖然這些統計數據強調網絡監控的重要性,但觀察最終用戶體驗可以提供有關如何改進網絡的更有價值的信息。 Edin說,監控網絡只能讓團隊收集有關網絡的信息,這“還不夠”。

網絡專家應該觀察網絡,以獲得洞察力,並創建數據驅動系統來做出最適合網絡發展的決策。隨著越來越多的應用程序遷移到雲端,或演變成複雜的分佈式系統,企業投資於基於最終用戶體驗的可觀察性系統可以簡化NetOps管理。 Edin說,理想情況下,該系統應該能夠預測潛在問題、模擬場景,並推薦網絡改進。
2. 使用遙測方法用於NetOps
網絡專業人員需要收集足夠的數據來創建系統,以使他們的網絡服務可被觀察。他們必須使用最相關的遙測方法來收集數據,以監控和觀察網絡服務。現在有多種遙測方法,但與網絡監控最相關的類型是數據配置、合成數據和設備遙測。

數據配置是網絡管理員選擇數據來代表操作意圖。發現操作意圖是邁向基於意圖的網絡的一步,它可以讓網絡專業人員了解他們的網絡行為。 Edin說,根據他的經驗,網絡專業人員很難在不知道操作意圖的情況下監控最終用戶服務。
合成數據使團隊能夠使用合成流量進行測試以模擬最終用戶體驗,Edin稱,這是他們最接近模擬最終用戶體驗的方法。模仿用戶交互讓管理員可以評估用戶如何與網絡互動。
設備遙測是管理員使用指標來檢查網絡狀態。根據Edin的說法,對於團隊來說,當與合成數據結合使用時,這種遙測形式是有​​價值的數據收集工具,因為這可以確定問題的根本原因。
雖然這些方法對於收集數據很有用,但它們主要用於監控網絡。當團隊想要提供服務保證時,它們變得更加相關,因為這些數據可用於確定網絡是否正常運行以及其服務是否正常工作。

為了收集高質量數據,以用於網絡可觀察性,網絡團隊必須確保他們收集的數據具有相關性、連貫性、可訪問性、一致性且定義明確。通過高質量數據,他們可以識別哪些服務在他們的網絡中有效,哪些內容需要改進以及如何部署任何修改。

3. 確保服務保證
Edin說,網絡可觀察性是服務保證過程的一部分。他補充說,當使用監控網絡的遙測方法構建可觀察性平台或系統,團隊還應該準備好“數據預處理層”,可以“清理”從遙測方法收集的數據。此清理過程可確保數據的高質量,以用於可觀察性平台。

具有軟件能力的網絡團隊可以創建自己的數據預處理層或其他服務保障系統。他們還有機會使用5G來虛擬化基礎設施並,運行測試代理,以確認網絡的高性能服務是否正在運行。
如此,可觀察性平台最終必須為團隊生成相關數據,以了解他們的網絡,並為客戶提供服務保證。

Edin 說,服務保證也應該是整個服務生命週期的一部分。

他指出:“這樣做不僅可以消除通過人工處理引入錯誤的風險,還可以將交付速度從數週或數月縮短到至少數天”,並補充說加快流程也將降低勞動力成本。

整合可觀察性與DevOps
網絡團隊還可以按照Edin概述的相同步驟將服務保證納入DevOps流程。首先,他們應該衡量最終用戶體驗。然後,他們可以確定有關他們網絡的問題,並需要相應的答案。回答這些問題的簡單程度也有助於確定網絡的可觀察性。

網絡專業人員應該使用最好的遙測方法來深入了解他們的網絡服務,並創建他們的系統。 Edin說他建議團隊從數據配置開始,以確定操作意圖。
他指出:“確保你有真實的來源,展示並告訴你有哪些服務。”

他接下來建議團隊使用設備和合成遙測,以連貫地解釋最終用戶體驗,並檢查系統資源是否成功。如果需要,團隊可以添加其他遙測方法。

最後,服務保證應集成到網絡自動化中。應根據需要,多次執行、審查和重複整個過程。

隨著NetOps變得更加自動化,以及開發新服務,團隊可能會改變其網絡的行為,從而改變最終用戶的體驗。 Edin說,確保服務保證,以及服務生命週期的其他步驟,通過網絡可觀察性可以降低這種風險。

鴻蒙官方戰略合作共建——HarmonyOS技術社區

【責任編輯:趙寧寧 TEL:(010)68476606】