Linux日志分析实战教程_GrepAwkSed日志处理技巧

冰川箭仙

发布时间：2026-01-05 13:40:03

178人浏览过

来源于php中文网

原创

Linux日志分析靠grep、awk、sed三剑客：grep快速定位关键行，awk精准提取统计字段，sed批量清洗标准化格式，三者串联可高效完成筛查、分析到归纳的全流程。

linux日志分析实战教程_grepawksed日志处理技巧

Linux日志分析不靠猜，靠三把“快刀”：grep 快速定位、awk 精准切片、sed 批量修整。它们配合使用，能把杂乱的日志变成清晰的线索。

用 grep 锁定关键日志行

日志文件动辄上万行，第一件事是缩小范围。grep 是最直接的入口：

查 ERROR 或 warning（忽略大小写）：grep -i "error\|warning" /var/log/syslog
只看最近 10 分钟的错误（需日志含标准时间戳）：grep "$(date -d '10 minutes ago' '+%b %d %H:%M')" /var/log/syslog | grep -i error
排除无关信息（如健康检查）：grep "500" access.log | grep -v "healthz"

用 awk 提取和统计核心字段

定位到目标行后，真正有价值的信息往往藏在某几列里——比如 IP、状态码、响应时间。awk 擅长按列处理：

提取访问日志中的客户端 IP 和状态码：awk '{print $1, $9}' access.log（默认空格分隔，$1 是 IP，$9 是状态码）
统计出现最多的 5 个错误状态：awk '$9 ~ /^5/ {count[$9]++} END {for (c in count) print c, count[c] | "sort -k2nr | head -5"}' access.log
算平均响应时间（假设第 10 列是毫秒）：awk '{sum += $10; n++} END {if(n>0) print "avg:", sum/n}' access.log

用 sed 清洗和标准化日志格式

原始日志常含干扰内容（如多余空格、调试标记、临时注释），sed 可批量清理或转换格式：

FILM

利用两张现有的图像，创建一个动画。

下载

删除所有空行和仅含空白符的行：sed '/^[[:space:]]*$/d' app.log
把 ISO 时间戳 2025-12-30T06:15:22+08:00 替换为易读格式：sed -E 's/([0-9]{4})-([0-9]{2})-([0-9]{2})T([0-9]{2}:[0-9]{2}:[0-9]{2}).*/\1\/\2\/\3 \4/' app.log
给每行加序号（调试时定位方便）：sed '=' app.log | sed 'N;s/\n/ /'

三剑客串联：一个真实分析流程

比如排查某次接口超时突增：先筛出超时请求，再提取路径与耗时，最后排序找热点：

grep "timeout" app.log | awk '$NF > 3000 {print $7, $NF}' | sort -k2nr | head -10
说明：$7 是请求路径，$NF 是最后一列（假设为耗时毫秒），筛选 >3000ms 的记录，按耗时倒序取前 10
进一步去重统计高频慢路径：grep "timeout" app.log | awk '$NF > 3000 {print $7}' | sort | uniq -c | sort -nr | head -5

不需要写脚本，一条命令链就能完成从筛查到归纳的全过程。熟练之后，5 分钟内定位问题根源很常见。

Linux蓝绿发布实践教程_无感知部署方案解析

Linux服务器容量规划教程_CPU内存磁盘评估方法

Linux容器安全加固教程_Docker加固与镜像管理实战

Linux进程管理实战经验_复杂场景处理总结【技巧】

Linux网络安全教程_TCP封包过滤与防护策略实践

相关标签:

linux go app access 热点状态码 2025 print if count sort for date Error 接口 var 切片 linux Access

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：LinuxCPU瓶颈分析_top与mpstat实战解析【教程】下一篇：LinuxKubernetes安全机制教程_RBAC权限控制实践

作者最新文章

REDMI Note 15 Series 港版 1 月 15 开卖！传具标準版 / Pro / Pro+ 三机、规格配置率先睇

2026-01-06 16:10

PythonAI大模型微调入门教程_定制你的专属模型

2026-01-06 16:24

PythonAI开发环境教程_模型开发必备工具配置

2026-01-06 16:33

苹果传推平价新MacBook 12.9吋机身、iPhone晶片上阵今年春季可望亮相

2026-01-06 16:34

Linux云原生流量治理教程_限流熔断与降级设计

2026-01-06 16:39

Python生成器与迭代器教程_节省内存的遍历方式

2026-01-06 16:42

Python代码调试思路教程_问题定位通用方法

2026-01-06 16:47

SQL数据库数值溢出处理_隐式转换风险

2026-01-06 16:49

Linux网络连接优化实践_高并发场景说明【教程】

2026-01-06 16:59

Python字符串格式化教程_fstring全面解析

2026-01-06 17:14

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

184

2023.09.27

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

718

2023.08.22

counta和count的区别

Count函数用于计算指定范围内数字的个数，而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

195

2023.11.20

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

381

2023.09.04

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

184

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

271

2023.10.25

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1004

2023.10.19