游乐游手机版
首页/科技数码/文章详情

业务无法访问?用这7条命令快速定位网络故障

时间:2025-12-02 20:31
对于运维来说,业务故障是无法避免的,所以故障排查是一个运维的必备技能,有完善的排查思路可以快速定位问题。 今天分享一下业务无法访问的排查方法。对于运维来说,业务故障是无法避免的,所以故障排查是一个运

对运维工程师而言,业务故障在所难免,熟练掌握故障排查技能是运维人员的必备能力。一套清晰的排查思路能帮助我们准确定位问题所在。

今天分享一下业务无法访问的排查方法。

运维工作中总会遇到各种突发故障,但掌握系统的排查方法就能沉着应对。下面我结合个人经验,从5个方向展开说明,希望能为你提供参考。

1. 确认问题范围

开始排查前不要急着敲命令,先问清楚这几个关键点:

影响范围:是单个用户无法访问?某个地区的用户集体报错?还是整体业务完全不可用?业务范围:是整个服务中断?还是某个功能模块或接口异常?时间规律:问题持续存在还是间歇性出现?排查技巧:越早锁定问题范围,定位效率越高。

2. 分层排查思路

主要排查点:网络策略 → 系统资源 → 应用服务 → 数据库 → 外部依赖 → 安全设备

逐层深入排查,才能避免遗漏。

(1) 网络层:先看“通不通”

主要使用ping,traceroute,telnet,curl等命令。

# 测试服务器是否连通,ping域名或IPping -c 4 10.0.0.110ping www.ligelinux.com# 路由追踪,查看卡在哪一跳traceroute 10.0.0.110# 测试端口连通性telnet 10.0.0.110 8089# HTTP接口连通性curl -I https://www.ligelinux.com

常见问题:网络策略变动、路由抖动、运营商网络波动、防火墙规则更新。

(2) 系统层:资源够不够

# 查看CPU、内存、负载情况,资源是否充足topuptimefree -h# 查看磁盘使用情况df -hdu -sh /data/*# 系统日志journalctl -xetail -n 200 /var/log/messages

常见问题:CPU跑满、内存不足、磁盘写满导致服务无响应。

(3) 应用层:服务是否正常

服务异常一般会出现503错误。

可以通过检查服务进程、端口状态和日志信息来定位。

# 查看服务状态,比如nginx,排查时替换成你的服务就行systemctl status nginxps -ef | grep 服务名字# 检查端口监听ss -tulnp | grep 端口# 查看应用日志tail -f /var/log/xxx.log# 本地检查应用是否正常curl -v https://localhost:your-port/health

常见问题:进程挂掉、端口没监听、依赖服务未启动。

(4) 数据层:库和缓存撑不撑得住

主要检查数据库是否正常。连接不上一般会在日志里报错。

主要排查数据库是否正常:

# MySQL是否能连mysql -uroot -p# MySQL是否卡锁mysql -e "show full processlist;"# Redis连通性redis-cli -h redis-host ping# Redis慢日志redis-cli -h redis-host slowlog get 10

常见问题:数据库连接数爆满、慢查询、Redis阻塞。

(5) 外部依赖

有些系统会调用外部接口,也有可能是外部应用出问题了。

# 测试外部API健康性curl -I https://xxx.com/health# DNS解析nslookup xxx.comdig xxx.com# CDN是否正常curl -v https://xxx.com | grep -i "cache"

常见问题:第三方接口超时、DNS劫持、CDN缓存异常。

(6) 安全设备层:别忽略“拦路虎”

很多时候,业务并不是挂了,而是被安全设备拦截,一般会出现403字样。

这种情况一般是触发了安全设备拦截规则,这时就要找安全团队查看安全设备是否有拦截记录。

WAF(Web应用防火墙):拦截了特定请求,比如带有敏感参数或 SQL 关键字。防火墙/安全组:有时候策略更新导致流量被拦截。

iptables -L -n -v firewall-cmd --list-all

IDS/IPS(入侵检测/防御系统):突然发现请求量大,被判定为攻击流量。建议与安全团队对接,确认是否有误拦。

常见问题:安全策略过于严格、误拦合法流量、规则变更未通知。可以通过加白名单解决。

3. 排查信息收集清单

排查时必须收集以下信息:

用户报错截图及相关服务日志系统指标:CPU、内存、磁盘、网络应用指标:进程,端口,日志外部依赖状态安全设备:WAF拦截,FW策略,IPS日志

信息齐全,排查效率提升3倍以上。

4. 复盘与预防

排查只是第一步,问题解决后一般会做下面的事情:

原因复盘:是配置问题、流量激增、资源不足,还是安全设备触发?监控优化:关键指标全链路监控,异常提前预警。自动化排查:脚本化常用检测命令,一键定位问题。知识沉淀:把排查经验写成 SOP,让团队少踩坑。

业务无法访问时,真正考验的不是你会多少命令,而是有没有完整的排查思路。

只要照着网络 → 系统 → 应用 → 数据 → 外部依赖 → 安全设备这条链路去排查,信息收集全面,就能快速找到根因。

来源:https://www.51cto.com/article/826625.html
上一篇福特CEO:中国车企正加速淘汰美国传统汽车产业 下一篇月牙泉千年守望:沙海深处的诗意幻境与天地对话
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5