你的網絡AI有你想像得那麼智能嗎?

2021.08.18

網絡運營人員告訴我,未來,人工智能將管理他們的網絡。他們還告訴我,供應商也向他們傳達了同樣的訊息。好消息是,“有些方面”是真的。壞消息也是如此。


網絡運營人員告訴我,未來,人工智能將管理他們的網絡。他們還告訴我,供應商也向他們傳達了同樣的訊息。好消息是,“有些方面”是真的。壞消息也是如此。這裡的重點在“有些方面”。為了從人工智能網絡管理中獲得最大收益,你必須弄清楚那個模糊的“有些方面”,對於這一點,你可以通過想像“螞蟻和農民”來實現。

 

螞蟻可以建造極其複雜的蟻丘,裡面有各種相互連接的隧道和關卡。這些工蟻是否有一些強大的螞蟻工程師來指導完成這一過程?答案是否定的!它們每個都一心一意地執行自己的簡單任務,並且本能地完成任務。事實上確實存在一個“螞蟻工程師”,但正是它們自己的DNA組織了它們的工作以實現目標。這就有點像大多數網絡AI的工作方式。

網絡由一堆技術“集合”組成,每個都有點像蟻丘。有基於供應商、設備類型、物理位置和連接關係的集合。如果你仔細觀察如今的網絡AI就會發現,它主要在“集合”上運行。也許它管理著Wi-Fi或可能管理著SD-WANSASE等邊緣元素。用於管理一個“集合”的AI應用程序會將管理目標融入到它們的DNA(也就是它們的設計中)。簡單地說,如果我們是Wi-Fi供應商,我們就知道Wi-Fi的工作原理,並將這些知識融入我們的AI管理中。


 

當我們不再將集合視為獨立元素,並開始將網絡視為“集合的集合”時,挑戰就來了。網絡不是蟻丘,而是蟻丘所在的整個生態系統,包括樹木、奶牛和許多其他東西。樹知道如何成為樹,牛了解牛的習性,但誰了解整個生態系統呢?農場就是農場,而不是樹木、奶牛和蟻丘的任意組合。了解農場應該是什麼樣的人是農場主,而不是農場的元素或這些元素的供應商,在你的網絡中,親愛的網絡運營人員,農場主就是你!

早期階段,人工智能的開發者就明確承認,構建AI框架的知識工程師與主題專家(其知識塑造了框架)是分開的。在軟件中,尤其是 DevOps,管理工具旨在實現目標狀態,即在我們的農場類比中,它描述了奶牛、樹木和螞蟻所處的位置。如果當前狀態並非目標狀態,它們會做一些事或移動一些東西以向目標狀態靠攏。這是一個很棒的概念,但要讓它發揮作用,我們必須知道目標是什麼。在企業網絡層面,我們需要我們的Wi-Fi專家下意識地將知識引入Wi-Fi AI管理工具。如果AI供應商不知道這些知識是如何獲得的,他們的AI將毫無用處。

 

如果您對AI的希望就此破滅,還言之尚早!許多網絡運營人員對管理構成其網絡的技術集合的AI還是非常滿意的。畢竟,當一個集合發生任何事情都無法通過調整另一個來補救時,為什麼還要擔心協調Wi-FiSD-WAN管理的問題呢?如果這個集合-AI模型能夠滿足您的需求,您就大功告成了。

想要了解成為一隻“螞蟻”(至少在網絡AI方面)是否可行,最好的方法就是詢問你的技術集合是否真的具有“原子性”——即完全獨立、自我包含。這歸結為您AI的可見性和控制範圍。基本上,集合特定型AI都是獨立的。理想狀態下,你需要你的AI集合螞蟻做自己的事情,而不是介入彼此的活動。你不希望一個地方的AI在沒有協調的情況下查看另一個集合,並對條件做出反應,或者兩個AI集合過程同時處理同一個問題。

 

如果一個集合中問題的補救措施可能涉及對另一個集合做一些事情,那麼你需要你的AI能夠覆蓋組合。因此,如果你覺得用於管理生態系統的網絡運營中心過於昂貴且超負荷,希望部署AI讓每個人能夠緩口氣,那麼你就需要更深入地了解供應商的AI主張。

 

這對企業來說並不容易,因為今年在我訪問的人中,有超過四分之三的人表示,他們內部沒有太多(如果說有的話)的人工智能專業知識。許多人覺得自己受了供應商的擺佈,因為他們承諾提供很棒的東西,但似乎並沒有完全達到預期。對於這種現象,企業就沒有什麼可以做的嗎?

掌握在整个网络生态系统中使用AI的最简单方法,是寻找一种类似于“管理人的管理人基金”(manager of managersMoM,是指该基金的基金经理不直接管理基金投资,而是将基金资产委托给其他的一些基金经理来进行管理)方法。用现代术语来说,您可以将此称为“意图建模”(intent modeling)。如果您的每个技术集合都可以被视为一个“黑匣子”,根据其自己的SLA对其行为进行建模,并且其AI流程可以执行该SLA,那么您所需要的只是让这些集合AI工具中的每一个生成故障报告到更高级别的包。然后,如果存在超出单个技术集合的问题,或者如果一个集合失败并且必须考虑更高级别的修复,那么该包可以决定该怎么做。

这里出现的挑战是找到目标状态以及在出现问题时如何恢复。还记得上面提到的“主题专家”和“知识工程师”吗?我们很难为网络构建AI解决方案,因为所有网络都略有不同,而且只有用户自己知道他们认为什么是“好”或“坏”。一些AI工具可能会提供机器学习 (ML) 功能,让您的网络运营中心(NOC)人员了解情况并知道该做什么;还有一些可能会使用网络供应商知道的通常代表正常选项和常见补救措施的基线。

不過,這兩種方法都存在一些問題。機器學習可能需要時間,而且當您的AI系統正在執行其使命時,它會進一步消耗您的NOC資源。當您的網絡主要由來自一個供應商的設備組成時,供應商基線最有效。兩者都可以調整,但都可能與自適應網絡行為發生衝突。

 

IP 網絡本質上使用拓撲發現並做自己的事情。即使對於NOC來說,影響路由也很困難;它們通常需要規劃新的MPLS 路線來進行流量工程,而AI不太可能做到這一點。一些公司(包括谷歌)已經轉向軟件定義網絡(SDN)來提供路由的中央控制,然後AI可以通過控制SDN控制器來控製網絡。

 

網絡運營中的AI可以追溯到事件的組合以發出異常信號,也可以作為一種實施有效響應的方式。在任何級別,您的潛在AI供應商都應該能夠與您討論他們的產品如何收集信息以及如何實現其洞察力。深入研究這兩件事的細節,因為無論AI聲稱有多神奇,如果沒有這兩種成分,它就不會起作用。最後,請記住:做一個農民,而不是一隻螞蟻,你的位置永遠不會因為AI的出現和發展而喪失。