业务无法访问?用这7条命令快速定位网络故障
对运维工程师而言,业务故障在所难免,熟练掌握故障排查技能是运维人员的必备能力。一套清晰的排查思路能帮助我们准确定位问题所在。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
今天分享一下业务无法访问的排查方法。
运维工作中总会遇到各种突发故障,但掌握系统的排查方法就能沉着应对。下面我结合个人经验,从5个方向展开说明,希望能为你提供参考。

1. 确认问题范围
开始排查前不要急着敲命令,先问清楚这几个关键点:
影响范围:是单个用户无法访问?某个地区的用户集体报错?还是整体业务完全不可用?业务范围:是整个服务中断?还是某个功能模块或接口异常?时间规律:问题持续存在还是间歇性出现?排查技巧:越早锁定问题范围,定位效率越高。
2. 分层排查思路
主要排查点:网络策略 → 系统资源 → 应用服务 → 数据库 → 外部依赖 → 安全设备
逐层深入排查,才能避免遗漏。
(1) 网络层:先看“通不通”
主要使用ping,traceroute,telnet,curl等命令。
# 测试服务器是否连通,ping域名或IPping -c 4 10.0.0.110ping www.ligelinux.com# 路由追踪,查看卡在哪一跳traceroute 10.0.0.110# 测试端口连通性telnet 10.0.0.110 8089# HTTP接口连通性curl -I https://www.ligelinux.com
常见问题:网络策略变动、路由抖动、运营商网络波动、防火墙规则更新。
(2) 系统层:资源够不够
# 查看CPU、内存、负载情况,资源是否充足topuptimefree -h# 查看磁盘使用情况df -hdu -sh /data/*# 系统日志journalctl -xetail -n 200 /var/log/messages
常见问题:CPU跑满、内存不足、磁盘写满导致服务无响应。
(3) 应用层:服务是否正常
服务异常一般会出现503错误。

可以通过检查服务进程、端口状态和日志信息来定位。
# 查看服务状态,比如nginx,排查时替换成你的服务就行systemctl status nginxps -ef | grep 服务名字# 检查端口监听ss -tulnp | grep 端口# 查看应用日志tail -f /var/log/xxx.log# 本地检查应用是否正常curl -v https://localhost:your-port/health
常见问题:进程挂掉、端口没监听、依赖服务未启动。
(4) 数据层:库和缓存撑不撑得住
主要检查数据库是否正常。连接不上一般会在日志里报错。

主要排查数据库是否正常:
# MySQL是否能连mysql -uroot -p# MySQL是否卡锁mysql -e "show full processlist;"# Redis连通性redis-cli -h redis-host ping# Redis慢日志redis-cli -h redis-host slowlog get 10
常见问题:数据库连接数爆满、慢查询、Redis阻塞。
(5) 外部依赖
有些系统会调用外部接口,也有可能是外部应用出问题了。
# 测试外部API健康性curl -I https://xxx.com/health# DNS解析nslookup xxx.comdig xxx.com# CDN是否正常curl -v https://xxx.com | grep -i "cache"
常见问题:第三方接口超时、DNS劫持、CDN缓存异常。
(6) 安全设备层:别忽略“拦路虎”
很多时候,业务并不是挂了,而是被安全设备拦截,一般会出现403字样。

这种情况一般是触发了安全设备拦截规则,这时就要找安全团队查看安全设备是否有拦截记录。
WAF(Web应用防火墙):拦截了特定请求,比如带有敏感参数或 SQL 关键字。防火墙/安全组:有时候策略更新导致流量被拦截。
iptables -L -n -v firewall-cmd --list-all
IDS/IPS(入侵检测/防御系统):突然发现请求量大,被判定为攻击流量。建议与安全团队对接,确认是否有误拦。
常见问题:安全策略过于严格、误拦合法流量、规则变更未通知。可以通过加白名单解决。
3. 排查信息收集清单
排查时必须收集以下信息:
用户报错截图及相关服务日志系统指标:CPU、内存、磁盘、网络应用指标:进程,端口,日志外部依赖状态安全设备:WAF拦截,FW策略,IPS日志
信息齐全,排查效率提升3倍以上。
4. 复盘与预防
排查只是第一步,问题解决后一般会做下面的事情:
原因复盘:是配置问题、流量激增、资源不足,还是安全设备触发?监控优化:关键指标全链路监控,异常提前预警。自动化排查:脚本化常用检测命令,一键定位问题。知识沉淀:把排查经验写成 SOP,让团队少踩坑。
业务无法访问时,真正考验的不是你会多少命令,而是有没有完整的排查思路。
只要照着网络 → 系统 → 应用 → 数据 → 外部依赖 → 安全设备这条链路去排查,信息收集全面,就能快速找到根因。
相关攻略
国内某医院挂号难度居高不下,曾超70%的号源被“号贩子”抢占。通过AI分析付款时间、IP地址等30多种特征,精准区分病人与“号贩子”。部署AI应用后,发现异常立即剔除,阻断操作,一天内将“号贩子”占
来源:光明日报不久前,“AI点奶茶”登上热搜——用户只需一句话,选品页面自动弹出,下单瞬间完成。它是如何工作的?这背后的逻辑又是什么呢?“不是某个App变聪明了,而是一群AI智能体(能够感知环境、自
今天聊一下生产环境 Docker 应该怎么配置,主要是如何处理日志,避免撑爆磁盘。 今天聊一下生产环境Docker应该怎么配置,主要是如何处理日志,避免撑爆磁盘。1 Docker日志好坑Docke
巴塞罗那的三月,在联接之外,所有的聚光灯都照向了AI。走进2026年的世界通信移动大会(MWC)展馆,从大模型到智能体,从具身机器人到自动化运维,几乎每一块屏幕都在谈智能。算力被反复提及,Token
让中国算力更好地跑在中国网络上。万卡集群已成AI算力标配,而决定有效算力上限的关键——网络却成掣肘。当前业界要么选供应链风险高的海外IB方案,要么选需专业团队反复调参的RoCE方案。近日,中科曙光发
热门专题
热门推荐
鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;
3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失
预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个





