Linux性能分析核心命令为top、vmstat和iostat:top监控进程级CPU/内存占用及负载;vmstat提供系统级采样统计,关注r、si/so、bi/bo和id;iostat专注磁盘I/O,重点看%util、await和avgqu-sz;三者联动可定位CPU高、内存不足、磁盘瓶颈等典型问题。

Linux服务性能分析离不开几个核心命令:top、vmstat 和 iostat。它们分别聚焦于进程级资源、系统级统计和I/O子系统,合起来能快速定位CPU高、内存吃紧、磁盘卡顿等常见问题。
top:看“谁在抢CPU和内存”
top 是最直观的实时进程监控工具。启动后第一眼先看三块:
-
第一行负载(load average):三个数如 1.2, 0.8, 0.5 分别代表过去1/5/15分钟的平均活跃进程数。若该值持续 > CPU逻辑核数(可用
grep -c 'model name' /proc/cpuinfo查),说明系统过载。 - 第三行 %Cpu(s):重点关注 us(用户态) 和 wa(I/O等待)。us 高说明应用本身忙;wa 高则暗示磁盘或网络响应慢,需配合 iostat 进一步查。
- 进程列表:默认按 %CPU 排序。按 M 可切到 %MEM 排序,快速识别内存大户;按 P 回到 CPU 排序;按 k 输入 PID 可直接 kill 异常进程。
vmstat:查“系统整体运转是否健康”
vmstat 提供采样式快照,适合观察趋势。常用命令:vmstat 2 5(每2秒一次,共5次)。
- r 列:就绪队列长度。长期 > CPU核数,说明任务排队严重。
- si/so 列:swap 入/出(KB/s)。非零值频繁出现,表明物理内存不足,内核正在换页,性能会明显下降。
- bi/bo 列:块设备读/写(KB/s)。数值大但 wa 不高?可能是顺序大IO;若 bi/bo 中等但 wa 很高,更可能是随机小IO或磁盘响应延迟大。
- cpu 列中的 id:空闲率。长期低于10%需警惕,但要结合 us/sy/wa 看具体原因。
iostat:盯“磁盘到底卡不卡”
iostat(需安装 sysstat 包)专攻存储性能。关键命令:iostat -x 2(-x 显示扩展指标,每2秒刷新)。
- %util:设备忙碌时间百分比。接近100% 并非绝对异常,但若同时伴随高 await(平均IO等待毫秒)和低 r/s 或 w/s,大概率是磁盘瓶颈或队列堆积。
- await vs svctm:svctm 已弃用,关注 await 即可。await > 10ms 对普通 SATA 盘算偏高;SSD 应控制在 1ms 内。持续高于阈值,说明 IO 请求在队列中等待太久。
- avgqu-sz:平均队列长度。值越大,说明并发IO请求越多。结合 %util 和 await,可判断是“真忙”还是“调度不均”。
三者联动排查典型场景
遇到服务变慢,按顺序检查:
- CPU飙升:top 看哪个进程 %CPU 高 → vmstat 确认 r 是否堆积、id 是否极低 → 若 us 高而 wa 低,重点查该进程逻辑;若 wa 高,跳到 iostat 看磁盘响应。
- 内存告急:top 看 %MEM 和可用内存 → vmstat 查 si/so 是否非零、free 是否持续走低 → 若 so 明显,考虑调大内存或优化应用缓存策略。
- 响应延迟大:top 中 wa 高 → iostat 中 await 和 avgqu-sz 同时升高 → 检查是单盘瓶颈(如 /dev/sda),还是上层应用产生大量随机写(如数据库日志刷盘)。











