網路故障不再困擾:一文​​讀懂乙太網路介面實體DOWN故障及解決方案!

2023.11.18

網路故障不再困擾:一文​​讀懂乙太網路介面實體DOWN故障及解決方案!

為了更精確的分析介面物理DOWN的故障原因,本文主要依照故障可能的引進點為線索,具體依照人->機->料->法->環五步驟為排查順序,逐步找到問題根因並排除故障.

一、接口物理Down概念

乙太網路介面是提供給使用者操作或配置的真實存在、有裝置支援的實體接口,主要用於接收和發送資料。介面保持正常UP狀態是設備正常運作的最基本條件。

當介面處於DOWN狀態時,其指示燈狀態為常滅,介面無法正常收収報文,設備上產生類似以下格式的日誌:

IFPDT/4/IF_STATE(l)[3]:Interface GigabitEthernet0/0/12 has turned into DOWN state.  
  • 1.

您可以透過執行display interface指令查看介面目前物理狀態(回顯中current state欄位資訊)。

在上圖的範例中,介面GE0/0/12的目前物理狀態為Administratively DOWN ,也就是裝置介面下存在指令shutdown,可以斷定設定錯誤引發介面DOWN,您需要在對應介面規則下執行undo shutdown指令。

二、介面物理DOWN原因及處理方法

造成介面物理DOWN的原因主要包括硬體和軟體兩類故障:

  • 硬體故障:本端或對端設備硬體故障包括單板、介面、光模組、光纖、網路線等故障
  • 軟體故障:主要包括連結兩端配置不一致,主要包括連接埠協商模式、速率、雙工等配置。

如下圖所示,為了更精確的分析介面物理DOWN的故障原因,本文主要依照故障可能的引進點為線索,具體依照人->機->料->法->環五步驟為排查順序,逐步找出問題根因並排除故障.

接口物理DOWN

1.人--人為因素導致介面物理DOWN

(1) 故障原因描述

當接門由正常UP狀態變為物理DOWN時,需要先排查近期是查有人為操作當,包括錯誤拔插網線,誤碰設備導致連線鬆動以及在設備上進行了命令行誤操作等行為。

(2) 故障診斷操作步驟

在對接的兩個裝置上的任意視圖下,均執行指令displayinterface interface-type interface-number,查看介面目前運作狀態和介面統計資料。如圖3所示,重點查看如下回顯中紅色字段

  • 若current state欄位為“Administratively down”,表示介面被人為Shutdown,請在介面下執行undo shutdown指令。
  • 若current state欄位為“DOWN”,則需要查看速率、雙工、自協商模式是否連結兩端保持一致。
  • 若Negotiation欄位為“ENABLE”,則介面處在自協商模式,速率雙工皆是雙方協商的結果,如果連結兩端速率雙工協商不一致,可以執行指令restart,重啟接口,使之重新協商。如果仍然協商不成功,可執行指令undonegotiation auto,使之工作在非自協商模式。速率雙工配置可參考下一情況。
  • 若Negotiation欄位為DISABLE,則介面處在非自協商模式,速率雙率可在介面視圖下執行speed[10|100|1000]以及duplex{fulll half},使連結兩端參數保持一致。
  • 若current state欄位為ERROR DOWN(down-cause),表示介面因錯誤事件而被Shutdown您需要根據down-cause具體欄位資訊來排查故障常見down-cause欄位值如下圖所示

(3) ”故障恢復方法

批量介面物理DOWN:

  • 如果多個介面實體DOWN,且這些介面都屬於同一塊單板,並連接到多個無異常的對端設備,則可能是單板異常,嘗試執行命令reset slot slot-id,重設單板。如果故障仍未解決,需要更換單板
  • 如果多個介面實體DOWN,並且這些介面都是屬於本端設備和對端同一設備連接的接口,則可能原因是對端設備異常,您需要登入對端設備查看設備單板是否有故障,並及時進行重設或更換操作,如果對端設備處於主備倒換、休眠、重啟等狀態,則可以認為屬於正常現象,待對端設備狀態穩定後,一股本端設備狀接口狀態即可自動恢復到UP狀傑。該場號下,介面會出現頻UP/DOWN,產生如下所示的大量UP/DOWN日誌。

單一介面物理DOWN:只有單一介面實體DOWN,則需要排查鏈路兩端介面是否有金屬彈片凹陷等硬體故障,如果介面故障可嘗試使用其他閒置介面。

2.料--連接介質故障

(1) 故障原因描述

交換器實體介面有電口和光口,涉及的傳輸介質主要是RJ45-網路線,光模組、光纖。當傳輸媒體出現老化、破損或光模組收發光異常等故障時,將會導致介面物理DOWN。

(2) 故障診斷操作步驟

電口連接介質故障:

  • 檢查連線是否正確:確保對接兩端介面使用相同網路線,如果經過跳線架請檢查跳線是否正確,檢查介面是否連接正確,同時檢查是否有接觸不好及網線外部損壞的狀況
  • 檢查網路線規格及長度是否符合標準:依據乙太網路相關標準,網路線長度不能超過100m。對於GE電口,如果使用低於五類線的網線將無法使GE電口以1000M速率UP,所有電口對接,均建議使用五類線以上規格的網線對接
  • 檢查網路線內部線對狀態是否正常:網路線中4對線序中有部分出現損壞,將無法保證電口正常UP。偵測網路線質量,可使用測線儀或在介面視圖下執行virtual-cable-test 指令,偵測線序對連線是否正常

如上圖所示,如果回顯中Pair state為OK表示正常;如果為其他狀態(例如Open或short),建議您更換其他網路線測試。」

光口連接介質故障:

  • 光模組是否屬於華為認證光模組:華為公司在交換機產品發貨的光模組標籤上增加華為logo和相應標識,如圖7所示,在產品電子標籤、光模組資訊裡面都更新為“HUAWVEI” 廠商資訊對於非華為認證出貨的光模組插入交換器設備中,會出現警告訊息。告警格式如下:
ENTITYTRAP/3/OPTICALINVALID:OID oid] Optical Module is invalid.(Index=INTEGER),
EntityPhysicalIndex=INTEGER), PhysicalName= "OCTET", EntityTrapFaultID=[INTEGERJ)
  • 1.
  • 2.
  • 檢查光模組狀態是否正常:執行指令display transceiverinterface,檢查兩端設備上的光模組工作狀態是否正常,主要查看收光功率、發光功率、電流值等,確定各項指標是否都在正常範圍內。

(3) 故障恢復方法

電口連接介質故障:如果電口網路線故障,建議直接更換網路線

光口連接介質故障:

  • 如果使用的光模組為非華為認證光模組,請更換使用華為認證光模組。非認證光模組可靠性無法保證,可能導致業務不穩定。由非華為認證光模組導致的問題,華為將不承擔責任,並在原則上不予以解決。
  • 如果執行display transceiverinterface指令查看光模組工作狀態參數,依照表1所示標準結論判斷參數否超出正常範圍。

  • 如果發送光功率過低或過高:請更換光模組
  • 如果收光功率過低或過高:使用光功率計測試鏈路各部分的光功率亮減情況,對異常的部位進行修復。
  • 若仍無法解決問題請更換光模組或光纖,確保光模組傳輸距離和光纖類型符合網路需求.

3.法--連接媒體操作方法錯誤

(1) 故障診斷操作步驟

進行設備間連接介質操作時,需考慮光模組與光口是否匹配,光模組是否與光纖型號是否死配,光模組與光纖連線操作是否正確等、當介面出現實體DOWN時,可從上述幾個原因進行排查.

(2) 故障診斷操作步驟

  • 任意視圖執行命今display device,查看設備型號及部件信息,其中框式設備主要可查看對應單板名稱;

  • 登入硬體查詢工縣,查詢目前使用的光模組類型是否和對應設備介面匹配以及光模組是否和光纖型號匹配;
  • 兩端設備上均在任意視圖下執行指令display transceiver interface,檢查連結兩端光模組參數是否一致;

  • 檢查光纖連線方式是否正確,光模組一般包含發送端(TX)和接收端(RX)。光介面對接時需要兩根光纖將一端光模組TX端與另一端RX連接,一端光模組RX端與另一端TX連接;

  • 判斷接口是否為Combo接口,如果是Combo接口,檢查接口使用方法是否正確,即接口目前工作模式是否與您目前接口連線是否一致。

如下圖所示,Combo介面GE1/0/1在設備面板上對應兩個介面: Combo光口和Combo電口。Combo光口和Combo電口不能同時運作。當使用者需要對Combo光口或Combo電口進行屬性配置時,都只需要進入相同介面視圖GE1/0/1進行設定即可

任意視圖下執行指令display interface,查看接口是否為Combo接口,以及目前工作模式是否正常.

圖片圖片

(3) 故障恢復方法

根據硬體查詢工具,確保目前使用的光模組與光口匹配,光模組與光纖匹配,如果不一致,請更換相應零件。

如果目前介面為Combo接口,則Combo介面工作模式選定原則如下:

  • Combo電口沒有連接網路線,當Combo光口插上光模組時,則Combo介面選擇光口模式
  • Combo電口已連接網路線,且Combo介面處於UP狀態,此時即使Combo光口插上光模組Combo介面仍選擇為電口模式。但是設備重新啟動後,Combo介面工作模式將變成光口模式
  • Combo電口已經連接網路線,目Combo介面處於DOWN狀態,此時Combo光口插上光模組Combo介面將選擇光口模式。
  • 當指定Combo介面工作模式為自動選擇模式時(介面視圖下執行comboport auto,預設設備Combo介面工作模式為auto ),系統將偵測Combo光口是否有光模組插入,進行模式選擇:

綜上所述,Combo介面工作模式為自動選擇模式時,只要Combo光口已插上光模組,則設備重新啟動後,Combo介面都會選擇光口模式。

當Combo介面的工作模式設定為強制模式時,需依本端與對端設備連接的介面類型進行設定:

  • 若本端Combo電口與對端電口相連,則需強制指定Combo介面的工作模式為copper,即接視圖下執行combo-port copper.
  • 若本端Combo光口與對端光口相連,則需制指定Combo介面的工作模式為fber,即接視圖下執行combo-port fiber.

綜上所述,當確定正確的傳輸介質後(光纖或網路線)後,就可以確定Combo口正確的工作模式您可以直接使用指令combo-port{copper|fiber],強製配置介面工作模式和連接介質保持致即可。

4.環--環境因素導致的故障

(1) 原因描述

交換器使用場景複雜多樣,設備可以處於網路中任一個層級。當交換器及其連接介質因環境因素導致異常時介面狀態也可能物理DOWN

(2) 故障診斷操作步驟

  • 檢查機房溫度及濕度狀況:S交換器工作環境溫度:0C~45C,對濕度應在5%RH~95%RH之間,不結露
  • 檢查線纜布放狀況:電源線與業務線分開布放。不能出現強弱電線纜並行的情況,防止幹擾。檢查是否有高溫或機架磨損導致網線破損老化的問題

(3) 恢復方法

  • 若機房的環境溫度長期無法滿足要求,應考慮檢修或更換機房的空調系統。若機房的相對濕度過高,應考慮為機房安裝除濕設備;
  • 若機房的相對濕度過小,應考慮為機房安裝加濕設備,若出現強弱電線纜並行現象,請重新部署線纜走向,強弱電線纜分離。如因環境因素導致網線損傷老化,請更換網路線。