Linux高负载如何排查_操作步骤详解提升实战能力【教学】-linux运维-PHP中文网

Linux高负载如何排查_操作步骤详解提升实战能力【教学】

舞姬之光

发布： 2025-12-21 22:40:03

原创

821人浏览过

Linux高负载需结合CPU核心数、IO等待、内存压力等多维度判断：先用uptime和nproc计算负载比值，再通过top看%Cpu(s)、r列和Mem行定位瓶颈，接着用ps、iostat、iotop等命令找异常进程，最后用strace、lsof、perf深入追踪。

linux高负载如何排查_操作步骤详解提升实战能力【教学】

Linux高负载不是单看一个数字就能下结论的事，关键得结合CPU核心数、进程状态、IO等待、内存压力这些维度交叉判断。下面分四步带你实操排查，每一步都带命令和解读，照着做就能定位问题根源。

先别急着杀进程，先看负载值和CPU核数的关系：

运行 uptime 或 cat /proc/loadavg，拿到三个值（1/5/15分钟平均负载）
运行 nproc 或 grep -c processor /proc/cpuinfo 查清逻辑CPU总数
计算比值：比如负载是 6.2, 4.8, 2.1，CPU是4核，那1分钟负载6.2 ÷ 4 = 1.55 → 已过载；若负载是 0.8, 0.9, 1.0，哪怕看起来“有1”，其实完全正常

打开 top，重点盯三块：

%Cpu(s) 行：看 us（用户态）高？sy（内核态）高？还是 wa（IO等待）高？　　→ us高：业务进程在狂算；　　→ sy高：系统调用频繁（如大量fork、socket操作）；　　→ wa高：磁盘或网络卡住了，进程在等IO
load average 值持续高于CPU核数，且 r 列（运行队列长度）长期 > CPU核数，说明有任务在排队
Mem 行：如果 free 极低、buff/cache 占比高但 available 也低，可能内存吃紧；再查 free -h 看 available 是否告急

根据上一步线索选择对应命令：

AI Word

一款强大的 AI 智能内容创作平台，致力于帮助用户高效生成高质量、原创且符合 SEO 规范的各类文章。

226

如果是 us/sy 高：　　→ ps aux --sort=-%cpu | head -10 找CPU大户　　→ top -Hp [PID] 进入线程视图，看哪个线程占CPU多（Java服务可配合 jstack [PID] 查堆栈）
如果是 wa 高：　　→ iostat -x 1 3 看 %util 和 await，%util > 90% 或 await > 10ms 说明磁盘慢　　→ iotop -o 直接看哪些进程在刷盘（需root）
怀疑内存压力大：　　→ ps aux --sort=-%mem | head -10 找内存大户　　→ dmesg | grep -i "killed process" 看有没有OOM Killer干掉过进程

当常规命令看不出明显问题时，可以追加深度诊断：

对某个可疑进程做系统调用追踪：strace -tt -T -p [PID] -o /tmp/trace.log（观察是否卡在 open/read/write/futex 等系统调用）
检查该进程打开的文件句柄：lsof -p [PID] | wc -l，超限可能引发阻塞
查网络连接状况：ss -s 看总连接数、TIME-WAIT 数量；ss -tnp | grep [PID] 看它建了哪些连接
查内核级资源争用：perf top -p [PID]（需安装 perf），看热点函数在哪