業務不可訪問?用這些命令,一步步搞定!
今天分享一下業務無法訪問的排查方法。
對于運維來說,業務故障是無法避免的,所以故障排查是一個運維的必備技能,有完善的排查思路可以快速定位問題,下面我整理了一些個人經驗,主要從5個方向展開講解,希望能幫助到你。

1. 先確認問題范圍
排查前別急著開命令,先問清楚:
- 影響范圍:是單個用戶?某個地區?還是全量業務?
- 業務范圍:全站都掛?還是某個模塊、某個接口?
- 時間規律:持續性還是間歇性?
- 技巧:越早圈定問題范圍,定位就越快。
2. 分層排查思路
主要排查點:網絡策略→ 系統 → 應用 → 數據庫 → 外部依賴 → 安全設備
逐層排查,才能不遺漏。
(1) 網絡層:先看“通不通”
主要使用ping,traceroute,telnet,curl等命令。
# 測試服務器是否能通,ping域名或IP
ping -c 4 10.0.0.110
ping www.ligelinux.com
# 路由追蹤,看看卡在哪一跳
traceroute 10.0.0.110
# 測試端口連通性
telnet 10.0.0.110 8089
# HTTP接口連通性
curl -I http://www.ligelinux.com常見問題:網絡策略變動,路由抖動、運營商網絡波動、防火墻規則更新。
(2) 系統層:資源夠不夠
# 查看CPU、內存、負載情況,資源是否充足
top
uptime
free -h
# 查看磁盤使用情況
df -h
du -sh /data/*
# 系統日志
journalctl -xe
tail -n 200 /var/log/messages常見問題:CPU打滿、內存不足、磁盤滿導致服務無響應。
(3) 應用層:服務是否正常
服務不正常一般會出現503錯誤

可以通過排查服務進程,端口和日志等信息
# 查看服務狀態,比如的nginx,排查時更換成你的服務就行
systemctl status nginx
ps -ef | grep 服務名字
# 檢查端口監聽
ss -tulnp | grep 端口
# 查看應用日志
tail -f /var/log/xxx.log
# 本地檢查應用是否正常
curl -v http://localhost:your-port/health常見問題:進程掛掉、端口沒監聽、依賴服務未啟動。
(4) 數據層:庫和緩存撐不住
主要檢查數據庫是否正常。連不上一般會在日志里報錯

主要排查數據庫是否正常:
# MySQL是否能連
mysql -uroot -p
# MySQL是否卡鎖
mysql -e "show full processlist;"
# Redis連通性
redis-cli -h redis-host ping
# Redis慢日志
redis-cli -h redis-host slowlog get 10常見問題:數據庫連接數爆滿、慢查詢、Redis阻塞。
(5) 外部依賴
有些系統會調用外部接口,也有可能是外部應用出問題了。
# 測試外部API健康性
curl -I https://xxx.com/health
# DNS解析
nslookup xxx.com
dig xxx.com
# CDN是否正常
curl -v https://xxx.com | grep -i "cache"常見問題:第三方接口超時、DNS劫持、CDN緩存異常。
(6) 安全設備層:別忽略“攔路虎”
很多時候,業務并不是掛了,而是被 安全設備攔截,一般是出現403字樣。

這種情況一般是觸發了安全設備攔截規則,這時就要找安全團隊看看安全設備是否有攔截記錄。
- WAF(Web應用防火墻):攔截了特定請求,比如帶有敏感參數或 SQL 關鍵字。
- 防火墻/安全組:有時候策略更新導致流量被攔截。
iptables -L -n -v
firewall-cmd --list-all- IDS/IPS(入侵檢測/防御系統):突然發現請求量大,被判定為攻擊流量。 建議與安全團隊對接,確認是否有誤攔。
常見問題:安全策略過嚴、誤攔合法流量、規則變更未通知。可以通過加白解決。
3. 排查信息收集清單
排查時必須收集以下信息:
- 用戶報錯截圖
- 相關服務日志
- 系統指標:CPU、內存、磁盤、網絡
- 應用指標:進程,端口,日志
- 外部依賴狀態
- 安全設備:WAF攔截,FW策略,IPS日志
信息齊全,排查效率提升 3 倍以上。
4. 復盤與預防
排查只是第一步,問題解決后一般會做下面的事情:
- 原因復盤:是配置、流量、資源,還是安全設備?
- 監控優化:關鍵指標全鏈路監控,異常提前預警。
- 自動化排查:腳本化常用檢測命令,一鍵定位問題。
- 知識沉淀:把排查經驗寫成 SOP,讓團隊少踩坑。
業務不可訪問時,真正考驗的不是你會多少命令,而是有沒有 完整的排查思路。
只要照著 網絡 → 系統 → 應用 → 數據 → 外部依賴 → 安全設備 這一鏈路去走,信息收集全面,就能快速找到根因。



























