Linux系统如何配置内核自动重启(Panic后自动Reboot)设置

当Linux内核发生Panic时,系统默认会直接“僵”在那里,不会自动重启。想让系统在崩溃后秒级恢复,你必须显式配置 kernel.panic 这个参数。这事儿得说清楚:它和systemd或者cron这类用户空间的服务没半点关系。内核Panic的瞬间,用户空间已经“失能”了,这个自动重启机制是内核自己触发的硬件复位,属于最底层的救命稻草。
设置 /proc/sys/kernel/panic 生效时间
这个参数的值,说白了就是内核Panic后,它自己会“愣”多少秒,然后再执行自动重启。默认值是0,意思就是“愣着不动”,也就是禁用自动重启。只有把它设成一个正整数,比如 10,这个功能才算被激活。
- 临时生效(重启后失效):执行命令
echo 10 > /proc/sys/kernel/panic就行。 - 永久生效:在
/etc/sysctl.conf文件末尾加上一行kernel.panic = 10,然后运行sudo sysctl -p让配置生效。 - 验证配置:跑一下
cat /proc/sys/kernel/panic,如果输出是10,那就说明写进去了。
确保 sysrq 已启用(否则无法手动触发测试)
这里有个小麻烦:Panic自动重启本身不依赖SysRq,但你怎么验证它生效了呢?总不能天天盼着系统真崩溃吧。所以,通常我们会用“魔法键”手动触发一次Panic来测试,命令就是 echo c > /proc/sysrq-trigger。但这个操作的前提是 kernel.sysrq 得是开启状态。
- 临时启用:
echo 1 > /proc/sys/kernel/sysrq - 永久启用:同样在
/etc/sysctl.conf里加上kernel.sysrq = 1,然后执行sudo sysctl -p。 - 注意:在一些云主机或者容器环境里,SysRq可能会被硬性禁用。检查一下
cat /proc/sys/kernel/sysrq,如果返回0,那这个测试方法就不可用了。
为什么 reboot 命令或 systemd 服务重启不等于 Panic 自动重启
这是最容易搞混的地方。内核Panic后的自动重启,是内核自己直接拉硬件复位信号,整个过程完全不经过用户空间,不走init系统,更不会执行任何关机脚本。它和下面这些我们熟悉的“重启”方式,完全是两码事:
sudo reboot或sudo systemctl reboot:走的是完整的、安全的关机流程,速度慢,但步骤全。- systemd服务里的
Restart=always:这只对用户态的进程管用,内核都崩溃了,它根本使不上劲。 - 在crontab里定时执行
/sbin/reboot:这依赖cron服务正常运行,内核Panic时,cron早就不存在了。
所以,真正决定内核崩溃后能否“秒起”的关键,其实就两个文件:/proc/sys/kernel/panic 和(为了测试方便)/proc/sys/kernel/sysrq。其他所有在用户空间里打转的“重启”方案,都够不着内核Panic这个层级。这才是问题的核心所在。
