游乐游手机版
首页/业界动态/文章详情

Linux进程管理:用ps/top/htop/kill解决服务器CPU爆满

时间:2026-06-27 14:32
当你的服务器卡死、CPU飙到100%、内存爆满、程序毫无响应时——别慌。几乎所有这类问题的根源,都指向同一个东西:进程。 Linux 有一句经典设计哲学:一切皆文件。 而从运行的视角来看,所有正在执行的程序,最终都会以进程的形式存在。不信你看——终端是进程,Nginx 是进程,数据库是进程,甚至你背

当你的服务器卡死、CPU飙到100%、内存爆满、程序毫无响应时——别慌。几乎所有这类问题的根源,都指向同一个东西:进程。

Linux 有一句经典设计哲学:一切皆文件。

而从运行的视角来看,所有正在执行的程序,最终都会以进程的形式存在。不信你看——终端是进程,Nginx 是进程,数据库是进程,甚至你背后那个Docker也是进程。

因此,当服务器出现CPU 100%满载、内存耗尽、程序卡死等故障时,根本原因几乎都与进程管理有关。

今天,我们将深入探讨四个与进程管理密切相关的核心工具:ps、top、htop、kill。

一、什么是进程?

更准确的定义是:进程 = 程序的一次运行实例。

它可能处于运行、睡眠、等待IO、暂停等多种状态。例如,在终端输入 ls,系统就会创建一个进程、执行命令、然后退出。而像 Nginx、MySQL 这类服务,则是启动后长期运行、持续占用资源的常驻进程。

二、ps —— 查看进程静态快照

ps(process status)的作用,就是捕捉你执行命令那一瞬间,系统中所有进程的静态快照。

1. 常用命令

查看所有进程:

ps aux

字段解释:

  • USER:进程所有者
  • PID:进程ID
  • %CPU:CPU使用率
  • %MEM:内存使用率
  • VSZ/RSS:虚拟内存和常驻内存
  • STAT:进程状态
  • START:启动时间
  • TIME:累计CPU时间
  • COMMAND:执行的命令

2. 常见 STAT 状态

最需要警惕的是状态 Z,也就是僵尸进程。当子进程已结束、但父进程还未回收资源时,就会出现僵尸进程。

三、zsh 踩坑:grep [n]ginx 报错

很多教程里都会写:

ps aux | grep [n]ginx

但这个写法在 zsh 环境下会报错:

zsh: no matches found

原因是 zsh 会把 [n] 当成文件通配符(glob)。如果当前目录没有匹配的文件,就直接报错。正确的写法(zsh 环境)应该是:

ps aux | grep "[n]ginx"

或者更干脆一些:

pgrep -a nginx

说实话,现代运维更推荐用 pgrep,而不是折腾那些 grep 的花哨技巧。

四、top —— 实时监控进程

服务器异常,第一步永远是:top

1. load average

例如输出:load average: 1.20 0.85 0.60

分别代表 1 分钟、5 分钟、15 分钟的平均等待 + 运行进程数。换言之,过去1分钟里,你的Linux系统里“等待CPU运行 + 正在CPU上运行”的进程平均有1.2个。

对于单核CPU,load ≈ 1 就意味着基本满负载了。但对于多核CPU,比如4核,负载4.0才算满负载,负载2.0只相当于用了50%。但要注意:负载高于核心数,不一定就卡死,还得看它是 CPU 繁忙还是 IO 阻塞。

2. CPU 使用率

重点关注:

  • us(用户):用户态程序消耗
  • sy(系统):内核态消耗
  • id(空闲):CPU 空闲比例

id 越低,说明 CPU 越繁忙。

3. 内存

关注 usedfreebuff/cache。这几个字段能帮你判断是物理内存不够,还是缓存占用的内存可以释放。

五、htop —— 更友好的监控工具

如果觉得 top 的界面过于简陋,那就试试 htop。安装(CentOS Stream):

dnf install htop -y # 需 root 权限

非 root:sudo dnf install htop -y

运行后,彩色界面、鼠标操作、甚至直接杀进程,体验比 top 好太多。

六、kill —— 终止进程

当你确认必须干掉某个进程时,就用 kill PID。默认发送的是 SIGTERM (15),这是“优雅终止”信号。进程收到后,会尝试清理资源——比如关闭文件、释放连接——再退出。

1. 常见信号

  • SIGTERM (15):优雅终止,允许进程做清理
  • SIGKILL (9):强制终止,不可捕获、不执行清理,可能损坏数据

2. 不要随便 kill -9

许多人一遇到问题就急于使用 kill -9 PID,但这并不推荐。因为它不可捕获、不执行清理,很容易导致数据损坏。正确的顺序是:先用 kill,无效了再 kill -9。这一点必须时刻警惕。

七、标准排查流程

服务器变慢时,按步骤来:

(1) 第一步:top

(2) 第二步:记录异常 PID

(3) 第三步:ps -fp PID,确认进程来源

(4) 第四步(重要):确认是否为非核心进程。不要误杀 systemdsshd 这些关键系统服务。

(5) 第五步:优雅终止:kill PID

八、必须理解的核心

进程有 PID,存在父子关系。如果服务由 systemd 管理,且开启了自动重启策略,被 kill 后可能自动重启。另外,kill 的本质是发送信号,不是“杀”进程。

九、四个命令定位

一句话总结:ps 看全局,top 看动态,htop 更好用,kill 做决策。

十、结论

掌握进程管理,是从“会用 Linux”到“会维护 Linux”的第一步。别小看这4个命令,很多线上问题的根因,都藏在这一行行进程信息里。

来源:https://www.51cto.com/article/840298.html
上一篇油烟异味难除2026除烟除味净化器横评五大维度 下一篇年4月GEO五强榜单:技术口碑与排名全解析
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿