当排查系统故障时,dmesg 几乎是每位运维工程师和开发人员绕不开的经典工具。它本质上是内核环缓冲区消息的出口,能帮助你了解系统自启动以来发生的各类事件、硬件驱动是否存在异常、磁盘是否出现故障。尤其在磁盘 I/O 领域,dmesg 的输出往往能精准定位到问题的根本原因。

那么,如何利用 dmesg 高效捕获磁盘 I/O 的异常行为?以下这几种方法在日常运维中最为实用。
实时捕获磁盘 I/O 相关内核消息
最直接的方式:通过关键字过滤。将磁盘设备名(例如 sd、sda、hda)与 I/O 读写相关的词汇组合,一条命令即可完成:
dmesg | grep -i "sd|hda|ata|I/O|read|write"
其中 -i 参数忽略大小写,管道配合 grep 将匹配行筛选出来。若输出内容过多,可以只关注某个特定设备,比如 sda:
dmesg | grep -i "sda|I/O|read|write"
持续监控:让输出实时刷新
单次查询只能看到某一时刻的快照。若想持续追踪变化,可以借助 watch 命令进行封装:
watch -n 1 "dmesg | grep -i 'sd|hda|ata|I/O|read|write'"
-n 1 表示每秒刷新一次,你也可以根据实际需要调整间隔。这样终端会不断更新最新出现的磁盘相关内核消息,非常适合在压力测试或怀疑有瞬时异常时进行观察。
深入分析磁盘性能表现
不要忽视 dmesg 输出中的关键指标。例如磁盘读写速率、I/O 请求队列长度等信息,常常隐藏在某条错误日志中。一旦出现 I/O 超时、重试、总线重置等记录,通常意味着磁盘或控制器已接近极限。此时结合 iostat、iotop、vmstat 等工具进行交叉验证,能更全面地判断问题所在。
不过需要明确的是,dmesg 更适合“事后分析”——它擅长故障排查与历史线索挖掘,而无法像监控仪表盘那样持续以秒级频率展示实时吞吐量。若需要紧盯实时 I/O 指标,专用工具如 iostat 更为合适。但掌握 dmesg 这把瑞士军刀,关键时刻往往能派上大用场。
