系统运行缓慢、文件读写时频繁报错,或时不时弹出I/O错误提示?这很可能是硬盘正在发出“警报”。磁盘坏道,无论是物理损坏还是逻辑错误,都会威胁数据安全与系统稳定性。在麒麟OS环境下,排查这一问题有清晰的路径可循:从图形化工具到命令行深度检测,再到官方诊断方案,层层递进。下面,我们来逐一拆解这套流程。

一、使用麒麟管家内置健康检测功能
对绝大多数用户而言,麒麟管家是最直观的起点。该工具集成了硬件传感器访问能力,可直接调用底层SMART接口,将硬盘的“体检报告”以可视化方式呈现。像重映射扇区计数、校验错误率等关键的前兆指标,都能一目了然。
操作过程并不复杂:从开始菜单找到并打开麒麟管家,在左侧导航栏选择“设备管理”,然后点击主界面工具栏中的“健康检测”按钮。首次使用时,系统会请求硬件访问授权,确认并输入密码即可。
检测启动后,界面会实时刷新SMART状态。需要特别留意的指标包括:“重映射扇区计数”、“当前待映射扇区数”以及“UDMA CRC错误计数”。如果这几项被标红,就意味着硬盘已亮起黄灯,提示存在潜在坏道风险,需要进一步排查。
二、通过终端执行smartctl命令深度检测
如果麒麟管家的初步检查发现了疑点,或者你需要更彻底的验证,那么命令行下的专业工具smartctl是首选。这是Linux标准的SMART工具,能绕过图形界面,直接读取磁盘固件层的原始日志,信息更全面,控制也更精细。
首先,打开终端(Ctrl+Alt+T),切换到root权限。使用lsblk -d -o NAME,MODEL,ROTA,TRAN | grep -E "(sda|nvme)"等命令,先确认你要检查的磁盘设备名,例如/dev/sda或/dev/nvme0n1。
接着,运行smartctl -a /dev/sda可查看该硬盘的所有SMART属性和日志,信息量极大。如需主动测试,可启动短自检:smartctl -t short /dev/sda,大约两分钟后,再用smartctl -a命令查看“Self-test execution status”字段,确认是否显示“completed without error”。
若短自检出现异常,或你想进行全面体检,则执行长自检:smartctl -t long /dev/sda。该过程可能需要数小时,务必注意:在此期间绝不能中断电源或卸载磁盘,否则可能导致硬盘固件状态异常,得不偿失。
三、使用badblocks命令定位逻辑坏块
SMART检测侧重硬盘硬件的“健康度”,而badblocks命令则直接对数据块进行“实战演练”。它通过对指定分区逐块进行读写验证,揪出那些已无法正确存取数据的逻辑坏块。该方法特别适用于已格式化为ext4、xfs等文件系统的分区。
操作前有一个重要前提:必须先卸载待检测的分区,例如umount /dev/sda1。然后,可执行非破坏性的只读扫描:badblocks -v -s /dev/sda1 > /tmp/badblocks.log 2>&1。参数-v显示进度,-s显示当前扫描的块号。
如需测试写入稳定性(警告:此操作会清空分区数据,请务必提前备份!),可使用读写混合模式:badblocks -v -w -s /dev/sda1。
扫描完成后,查看/tmp/badblocks.log文件。如果里面出现了类似“12345678”这样的十六进制地址行,那就明确标识出了具体的逻辑坏块位置。该结果可后续交给e2fsck或xfs_repair等文件系统修复工具进行处理。
四、调用kylin-sysassist-cli执行全栈磁盘诊断
最后,如果你需要一份更全面、更“官方”的诊断报告用于归档或问题复现,麒麟自带的运维辅助工具kylin-sysassist将派上用场。它的syscheck子命令整合了SMART信息、I/O延迟、队列深度以及系统错误日志的聚合分析,能生成一份带时间戳的结构化报告。
首先,在root权限下使用rpm -q kylin-sysassist确认工具是否已安装,若未安装,通过yum install kylin-sysassist -y安装即可。
然后执行磁盘专项检查:kylin-sysassist-cli syscheck --disk。在输出的报告中,重点查看“Disk Health Summary”部分,特别是“Reallocated_Sector_Ct”(重映射扇区数)、“Current_Pending_Sector”(当前待映射扇区)和“Offline_Uncorrect”(离线无法纠正的扇区)这三个核心数值。
完整的诊断报告默认保存在/var/kylin-sysassist/collect/目录下,文件名包含“diskcheck”。这里有一个关键判断点:当“Offline_Uncorrect”的值大于0时,通常意味着磁盘已出现无法通过在线重映射修复的物理坏道,数据风险较高,需要严肃考虑更换硬盘。
总的来说,从图形化初筛到命令行深度检测,再到逻辑块验证和官方全栈报告,这四步构成了在麒麟OS上排查磁盘问题的完整闭环。根据问题的紧急程度和你的技术偏好,可以选择合适的步骤组合来应对。
