問題背景
客戶是專做弱電項目的整合商,近期承接了某園區網路的改造項目,主要目的在於提升網路可靠性,保證業務不間斷,路由交換設備為某W。改進具體措施是:
原來單台出口路由改成雙機熱備並部署BFD;
核心採用堆疊交換器取代原有的匯聚交換機,作為VLAN閘道和DHCP伺服器;
核心和匯聚交換器之間做連接埠聚合eth-trunk介面。
基本拓樸如下:
問題描述
但某樓宇改造變更後,上班高峰期總有用戶不到自動取得IP位址或很艱難才拿到IP,在某取得失敗的電腦上抓包和查看網卡資訊如下:
下面我們一起看下該問題如何排查~
排查分析
第一步:確認核心交換器DHCP收發包是否正常
首先查看核心交換器對應的介面是否正常收到了客戶端的DHCP請求並做offer響應,透過封包分析來看:每個上來交給核心交換器的DHCP請求(DHCP discovery)核心都會回,但是診斷發現獲取不到IP的電腦的請求並沒有交給核心交換機,也就是說,可能在下聯設備上丟包了。
第二步:確認總吞吐量無法跑滿2Gbps問題
檢查匯聚交換器的端口,發現有大量丟棄報文,報文頭分析發現丟棄的都是discovery、offer這種廣播報文。
第三步:配置檢查
檢查該連接埠配置,發現有廣播抑制的配置:
表示每秒可轉送的廣播包最大100個,刪除此配置或將數值改大,問題解決。
解決方案
(1) 根本原因
由於DHCP協定工作流程,如下圖所示:
第一階段DHCP DISCOVER封包是用戶端透過廣播來發現可用的DHCP伺服器,因此用戶端較多情況下,連接埠配置的廣播抑制可能會影響使用者自動取得IP位址。
(2) 建議與總結
取得DHCP位址困難的故障可能與連接埠配置的廣播抑制有關。
部署業務時,應合理設定連接埠廣播抑制值,具體取值應根據業務實際情況觀察並調整,以不影響業務的下限為好。