iostat是sysstat套件组件,需安装启用服务后使用;默认输出含CPU与I/O平均值;-x选项提供扩展指标;可指定设备、间隔、时间戳监控;支持日志持久化;配合iotop和vmstat实现进程级定位与跨子系统验证。

一、安装并启用sysstat工具包
iostat并非独立可执行程序,而是sysstat性能监控套件的组成部分。多数Linux发行版默认未预装该工具,必须显式安装才能使用。安装后还需确保系统级数据采集服务已启用,以支持历史统计与实时输出的一致性。
1、在Debian/Ubuntu系统中,执行以下命令更新索引并安装:sudo apt update && sudo apt install sysstat
2、在RHEL/CentOS/Fedora或Alibaba Cloud Linux中,运行:sudo yum install -y sysstat 或 sudo dnf install -y sysstat
3、验证安装成功:输入 iostat --version,应返回类似 sysstat version 12.7.2 的输出。
4、确认sysstat服务已启用并运行:sudo systemctl enable sysstat && sudo systemctl start sysstat
二、获取基础I/O与CPU综合视图
不带参数运行iostat可快速呈现系统自启动以来的平均负载状态,包含CPU利用率和所有块设备的聚合I/O指标,适用于初步判断是否存在整体资源争用。
1、执行命令:iostat
2、观察输出中 avg-cpu 段的 %iowait 值:若持续高于 30%,表明CPU大量时间处于等待磁盘响应状态。
3、在 Device 表格中查找 %util 列:该值反映设备忙时占比,≥80% 即提示存在I/O饱和风险。
三、启用扩展统计进行深度诊断
-x选项激活扩展模式,提供更精细的I/O行为指标,如请求合并数、队列长度、平均等待时间等,是识别延迟来源与瓶颈类型的关键手段。
1、运行命令:iostat -x 1,每秒刷新一次扩展数据。
2、重点关注字段:await(毫秒) —— 若持续超过 20ms,说明I/O响应明显变慢;avgqu-sz —— 若大于 2,表示请求持续排队。
3、对比 rrqm/s 与 wrqm/s:数值过低(接近0)可能意味着上层应用未有效聚合小IO,导致额外开销增大。
四、按指定设备与时间间隔持续监控
当系统挂载多个物理或逻辑存储设备时,限定目标设备可避免信息冗余,提升定位效率;设置合理采样间隔有助于捕捉瞬态高峰而不淹没终端。
1、仅监控NVMe主盘:执行 iostat -x /dev/nvme0n1 2
2、仅监控SATA主盘及其全部分区:使用 iostat -x -p /dev/sda 3
3、添加时间戳便于事后比对:运行 iostat -xt 5,每次输出顶部将显示精确到秒的采集时刻。
五、将监控结果持久化至日志文件
将周期性iostat输出写入文件,可为性能回溯、趋势比对及故障复现提供原始依据,尤其适用于无人值守场景或需长期跟踪的业务系统。
1、追加写入日志(推荐):iostat -xmt 10 >> /var/log/disk_io_$(date +%Y%m%d).log
2、覆盖写入单次完整报告:iostat -xmt 1 1 > /tmp/iostat_snapshot.log
3、配合cron每日归档:编辑crontab,添加行 0 2 * * * iostat -xmt 60 1 >> /var/log/iostat_daily.log
六、结合iotop定位高I/O消耗进程
iostat仅揭示设备级负载,无法指出具体是哪个进程引发压力。iotop作为补充工具,可实时展示各进程的读写速率与IO等待占比,实现从设备到进程的下钻分析。
1、安装iotop:sudo apt install iotop(Debian/Ubuntu)或 sudo yum install iotop(RHEL/CentOS)
2、以root权限运行并仅显示活跃I/O进程:sudo iotop -o
3、观察 IO> 列:该值代表进程等待I/O的时间百分比,数值越高越可能为瓶颈源头;同时关注 DISK READ/WRITE 列的实时带宽。
七、使用vmstat交叉验证I/O等待与内存压力
vmstat提供跨子系统的概览视图,其r(运行队列)、b(阻塞进程)、wa(I/O等待)字段可与iostat的%iowait和%util形成互证,排除因内存不足触发频繁swap导致的伪I/O瓶颈。
1、执行命令:vmstat 2 5,每2秒输出一次,共5次。
2、检查 wa 列:若与iostat中 %iowait 高度一致,支持I/O真实瓶颈判断;若wa显著低于%iowait,需排查是否存在其他阻塞因素。
3、观察 b 列:非零值表示有进程因资源不可用而被阻塞,结合 free -h 可进一步验证是否由内存压力引发。











