實戰應對三種因素引起的交換故障
一般來說,新投入使用的交換機設備工作性能往往比較穩定,很少會發生交換故障;可是,隨著工作時間的延長,以及網絡應用的不斷變化,交換機出現故障的機率也在逐漸增大。
為了提高交換故障的解決效率,保證局域網網絡能夠始終高效運行,本文現在就從實戰角度出發,來對常見的三種交換故障進行還原解讀,希望大家能夠從中得到一些啟發!
1.應對緩存溢出故障
某單位局域網共有兩臺普通交換機,每臺交換機都通過百兆雙絞線連接到單位的CISCO路由器 target=_blank>路由器設備上,并通過該設備訪問Internet網絡。平時每臺交換機都連接有大約10臺計算機,每臺計算機都能通過交換機順利地上網訪問;最近不知道怎么回事,單位局域網中有的計算機可以正常上網,有的計算機卻不能上網。
起初的時候,網絡管理員還以為是計算機自身的因素,可是,在對計算機系統的上網設置以及網絡病毒進行檢查后,發現都沒有問題,使用ping命令測試本地IP地址也是正常的,但是在ping局域網的網關地址時,發現不正常,看來故障計算機到交換機之間的這段線路存在問題。
會不會是物理線路的連通性存在問題呢?
想到這一點,網絡管理員立即使用網絡測試儀 target=_blank>測試儀,對連接計算機與交換機的雙絞線連通性進行測試,結果發現它們的連通狀態很正常。
在排除了網絡線路以及計算機自身因素后,網絡管理員準備檢查一下交換機的工作狀態是否正常;當他來到交換機設備現場時,他發現其中一臺交換機的所有端口信號燈狀態都處于點亮但不閃爍狀態;按理來說,交換機如果能夠正常處理數據信息的話,那么對應交換端口的數據信號燈也應該處于閃爍狀態,很明顯現在交換端口點亮但不閃爍,這說明了該交換機的工作狀態不正常。而反觀另外一臺交換機設備,網絡管理員發現它們的交換端口只要被點亮,基本上都能處于閃爍狀態,這說明這臺交換機能夠正常交換數據。經過進一步檢查,網絡管理員看到那些不能上網的計算機,基本上都是連接到那臺工作狀態不正常的交換機上的,看來局域網中部分計算機不能上網的故障現象是由交換機引起的。
那么究竟是什么因素造成故障交換機的端口信號燈顯示不正常呢?
一般來說,造成這種端口信號燈狀態顯示不正常現象的原因主要有兩方面,一方面就是交換機系統存在問題,例如受到網絡病毒的攻擊,或者工作時間長了之后出現了系統緩存溢出錯誤等,另外一方面就是交換機設備存在硬件問題,例如交換機服役時間比較長之后,它內部的性能元件容易發生老化現象,這些老化的元件也容易造成交換機工作狀態不正常。
通常,交換機的設置不發生變化,出現的一些“軟”故障往往都能通過重新啟動的方法來解決,依照這樣的思路,網絡管理員立即重新啟動了一下故障交換機系統,沒有多長時間,網絡管理員觀察到該故障的交換機端口工作狀態已經恢復了正常;再次從故障計算機系統中嘗試進行上網訪問時,以前不能上網的故障現象立即消失了,這說明故障交換機的確存在類似緩存溢出這樣的“軟”故障,這樣的故障造成了交換機的工作狀態無法正常。
如果每重新啟動一段時間后,交換機又出現相同的故障現象時,那問題很可能是由局域網中的網絡病毒引起的,因為有的網絡病毒可能在一定時間內,會對交換機系統的內存或其他系統資源進行不停占用,最終導致交換機系統的資源全部被消耗殆盡,從而會引發局域網中的計算機不能上網的故障現象;為了避免網絡病毒對交換機系統的沖擊,我們應該在組建網絡之前,認真選用質量可靠、性能穩定、緩存較大的設備,同時注意對局域網網絡定期執行病毒清除操作。 #p#
2.應對ARP病毒故障
某一天,筆者接到一個故障申請電話,說618房間的計算機突然不能上網,并且系統托盤區域處的網絡連接圖標上有紅色叉號標記出現;起初筆者以為肯定是網絡線纜出現了松動,要求該用戶自行將網線拔下來重新插一下,確保網絡線纜與墻上的上網插口以及網卡接口之間連接牢靠,可是該用戶按照筆者要求重新插拔了網絡線纜后,還是出現相同的故障現象。
筆者不放心,立即登錄到618房間所使用的交換機系統上,查看了對應交換端口的工作狀態,發現目標端口處于“up”狀態,這說明交換端口的工作狀態也是正常的。后來,筆者懷疑618房間的計算機使用的IP地址可能與其他計算機的IP地址發生了沖突,于是建議那位上網用戶換一個IP地址試試,果然在重新更換IP地址后,618房間的計算機又能正常上網了。
然后,沒有多長時間,618隔壁房間的計算機又打來電話向筆者求援說,他們的計算機也不能正常上網了;筆者經過查閱檔案資料,發現出現故障的計算機基本都處于相同的虛擬工作子網中,看來這種故障現象并不簡單是由人工修改IP地址造成沖突引起的,很可能是對應虛擬工作子網中出現了ARP病毒。
我們知道,現在ARP病毒非常瘋狂,局域網中的計算機很容易感染該病毒,而該病毒往往會欺騙局域網中所有計算機以及網絡設備,并強制目標計算機通過特定的病毒主機進行上網訪問。很多計算機被感染了ARP病毒后,之所以不能上網或者訪問網絡的速度會下降,主要是由于在正常狀態下目標計算機的網卡IP地址與物理地址是一一對應的,當目標計算機的網卡設備從DHCP服務器 target=_blank>服務器那里申請得到IP地址后,該地址就會被臨時與網卡設備的物理地址“捆綁”在一起,并且還會被自動記憶存儲 target=_blank>存儲到本地系統的ARP映射表中;當局域網中有計算機被意外感染了ARP病毒后,ARP病毒就會強行把病毒計算機的網卡物理地址映射到局域網的交換機或路由器設備上,并且還會自動向網絡中發送大量的ARP廣播信息,局域網中的其他計算機收到廣播信息后,往往會錯誤地認為病毒計算機就是局域網的網關地址,這樣一來其他計算機就會自動把上網請求轉發到病毒計算機上,而病毒計算機實際上并不是真正的網關地址,所以其他計算機自然也就不能正常上網,即使能夠上網速度也不會很快了。
為了查清楚究竟是哪臺計算機感染了ARP病毒,筆者立即以系統管理員身份登錄進入到目標交換機系統,進入該系統的全局配置狀態,利用“display dia”命令,查看目標交換機各個交換端口的工作狀態,結果發現網卡物理地址為0016-173d-43eb的計算機與對應虛擬工作子網的網關地址存在沖突現象;為了追查出網卡物理地址為0016-173d-43eb的計算機究竟位于哪個房間,筆者立即在交換機的全局配置命令行狀態下,執行字符串命令“display mac”,從其后出現的結果界面中,筆者看到網卡物理地址為0016-173d-43eb的計算機使用了43交換端口。
為了防止ARP病毒繼續影響局域網的工作狀態,筆者在交換機的后臺管理界面中,執行字符串命令“interface e0/43”,進入43交換端口的視圖配置狀態,并且在該狀態下繼續執行字符串命令“shutdown”,將43交換端口暫時關閉掉,這樣一來病毒計算機就不能通過該交換端口向局域網網絡發送ARP病毒信息了,此時與病毒計算機同處一個虛擬工作子網的其他計算機立即都能正常上網了。
臨時關閉43交換端口的工作狀態后,筆者立即又查看了組網時完善起來的檔案記錄,發現43交換端口被分配給了563房間使用上網了;于是,筆者立即電話聯系563房間的上網用戶,告訴他的計算機已經感染了ARP病毒,目前已經被強行從網絡中斷開,并且要求該用戶必須使用最新版本的殺毒軟件對其使用的計算機進行病毒查殺操作;在查殺完病毒之后,筆者在對應交換端口的視圖配置狀態下,又執行了“undo shutdown”字符串命令,重新將43交換端口的工作狀態激活,之后再次執行“display dia”命令,發現局域網中已經不存在地址沖突現象了,這說明局域網中的ARP病毒故障已經被成功解決了。 #p#
3.應對網絡環路故障
某大樓網絡共包含12個虛擬工作子網,每一樓層的所有計算機都通過1000M六類雙絞線連接到華為系列的可管理交換機設備上,各個樓層中的二層交換機全部通過1000M級別的光纖線路連接到大樓網絡的華為S8500核心路由交換機上,核心路由交換機再使用千兆光纖線路連接到單位的天融信硬件防火墻上,最后通過本地的電信線路訪問Internet網絡,平時大樓內各個樓層的計算機都能正常上網,遇到一些極個不能上網的現象時,網絡管理員經過控制交換機系統,都能快速找到故障原因,并能快速恢復網絡故障。
然而好景不長,某天上午,網絡管理員先是接到來自10樓上網用戶的故障保修電話,說是該樓層中的所有計算機瞬間都不能上網了;剛開始的時候,網絡管理員估計夏天到了,肯定是樓層交換機工作時間長了,內部無法及時散發出來的熱量造成了交換機的工作狀態不正常了,對于這樣的現象,往往只要讓交換機稍微休息一會,再重新啟動一下就能解決問題了。剛準備按照這樣的思路進行操作,誰曾想到,在短短的幾分鐘了,其他樓層的上網用戶也不停向網絡管理員進行電話“求援”,并且申請解決的故障現象幾乎都是相同的,顯然這樣的現象肯定不是由于交換機自身散熱不良引起的,畢竟在相同的時間段內不可能有這么多樓層交換機同時出現散熱不好的現象,看來問題很可能是大樓網絡的核心交換機或硬件防火墻遇到了意外。
網絡管理員立即以特權賬號登錄進入核心交換機后臺管理系統,在該系統的命令行狀態,使用ping命令測試了硬件防火墻的IP地址,測試結果發現ping命令可以測試成功,不過響應時間明顯有點偏長;既然硬件防火墻能夠被正常ping通,那就意味著該設備的工作狀態是正常的,于是筆者決定還是先來查看一下核心交換機的工作狀態是否正常。想到做到,網絡管理員在核心交換機的后臺管理界面,執行“system”字符串命令,將交換機系統切換到系統全局配置狀態,在該狀態下輸入字符串命令“display cpu”,單擊回車鍵后,筆者發現核心交換機每一塊插卡上的CPU消耗率都達到了50%以上,而在正常工作狀態下,每塊交換插卡的CPU消耗率都應該在20%左右,顯然大樓網絡內的上網流量出現了異常,正是這些大容量的數據交換信息在不停沖擊核心交換機的插卡,才導致了核心交換機的系統CPU資源被大量消耗,最終造成了核心交換機工作狀態不正常。
那么究竟是什么因素造成了大樓網絡內的上網流量出現了明顯異常呢?是惡意使用BT下載?是網絡病毒?還是網絡環路呢?
筆者立即在核心交換機的后臺系統使用“display dia”命令,對核心交換機的各個光纖端口狀態進行了掃描診斷,結果發現與硬件防火墻保持連接的那個光纖端口數據流量竟然達到了19000M/s左右,而這樣大的數據流量BT下載應用是不可能達到的,而網絡病毒也沒有這樣的能力,很顯然這么大的數據流量只有網絡環路才能做得到。為了驗證自己的猜測,網絡管理員立即使用“display interface”字符串命令,來查看核心交換機每一個光纖端口的輸入、輸出流量,對于那些輸入、輸出流量同時達到1000M/s以上級別時,繼續不停執行“display interface”字符串命令,看看輸出廣播包數量每秒鐘增加的幅度有沒有超過500M/s左右大小,如果超過這個大小,那就說明對應交換端口下的虛擬工作子網中存在網絡風暴現象。經過對每一個交換端口的輸入、輸出流量進行詳細檢查,網絡管理員終于找到“g0/1/6”這個光纖端口數據流量不正常,輸入流量竟然也達到了5000M/s左右,經過反復執行“display interface g0/1/6”字符串命令,網絡管理員最終確認連接到“g0/1/6”這個光纖端口下的虛擬工作子網中存在網絡風暴現象。
為了弄清楚究竟是硬件設備損壞還是網絡環路引起了網絡風暴現象,網絡管理員立即來到與“g0/1/6”這個光纖端口保持連接的樓層交換,以系統管理員權限登錄進入該樓層交換機的后臺管理系統,并使用ping命令測試核心交換機的IP地址時,發現ping命令根本無法測試成功,很顯然該樓層交換機工作狀態不正常。不得已,網絡管理員只好使用“display interface”字符串命令,對該交換機的每一個以太交換端口進行檢查,結果看到“e0/35”這個交換端口的輸入、輸出流量竟然達到了10000M/s級別,立即進入“e0/35”這個交換端口的視圖配置狀態,執行字符串命令“shutdown”,將“e0/35”交換端口的工作狀態臨時關閉;之后,網絡管理員重新ping了一下核心交換機的IP地址,這一次測試竟然成功了,這說明該樓層交換機的工作狀態已經恢復正常。
完成上面的檢查工作后,網絡管理員隨即又聯系了剛才報修故障的幾位上網用戶,請他們配合進行一下上網測試,沒有多長時間,所有上網用戶的回復都說網絡訪問已經正常,這說明大樓各個樓層不能上網的故障已經被成功解決了。
后來,網絡管理員又查閱了相關的檔案資料,發現使用“e0/35”交換端口的上網用戶是1613房間,網絡管理員立即火速趕到該房間現場,對他們的上網線路進行了檢查,結果發現該房間下掛了一臺普通的集線器,而恰好該房間當天有人在維修窗戶,在維修期間工作人員將所有網絡線纜全部拔了下來,在窗戶修好之后,工作人員由于不熟悉網絡連接操作,就隨意地進行了網絡連接操作,最終引起了網絡環路現象,從而造成了整個大樓網絡上網出現了故障。
【編輯推薦】




















