0

0

c++如何用perf工具分析性能 c++ Linux性能剖析【教程】

穿越時空

穿越時空

发布时间:2025-12-26 05:13:34

|

554人浏览过

|

来源于php中文网

原创

Linux下用perf分析C++性能需编译时加-g和-O2保留调试信息与清晰调用栈,采集时选准事件如cycles和cache-misses,再通过perf report、annotate及火焰图定位到函数与源码行级瓶颈。

c++如何用perf工具分析性能 c++ linux性能剖析【教程】

在 Linux 下用 perf 分析 C++ 程序性能,核心是采集运行时的硬件事件(如 CPU 周期、缓存未命中、分支预测失败等),再结合符号信息定位热点函数和指令。关键前提是编译时保留调试信息、禁用过度优化干扰调用,并确保 perf 能正确解析二进制符号。

编译:带调试信息 + 合理优化

使用 -g 生成 DWARF 调试信息,方便 perf 关联源码行;用 -O2(而非 -O3-flto)保持函数边界清晰、内联可控,避免栈帧丢失:

  • g++ -g -O2 -o myapp main.cpp utils.cpp
  • 若用 CMake,添加:set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -g -O2")
  • 避免 strip 二进制,否则 perf 无法解析函数名和行号

采集:选对事件,关注用户态

默认 perf record 只采样用户态,适合分析应用逻辑。常用命令:

  • perf record -e cycles,instructions,cache-misses ./myapp arg1 arg2 —— 同时采集多个事件
  • perf record -g ./myapp —— 启用调用图(需 kernel 支持 frame pointers,推荐加 -fno-omit-frame-pointer 编译)
  • perf record -e cycles:u -p $(pidof myapp) —— 对已运行进程按 PID 采样

分析:从火焰图到源码行

perf report 查看汇总,perf script 导出原始调用流,配合 FlameGraph 工具生成直观火焰图:

Dreamlike.art
Dreamlike.art

内置5种模型的AI图像生成器

下载

立即学习C++免费学习笔记(深入)”;

  • perf report -n --sort comm,dso,symbol —— 按进程、共享库、函数排序,显示采样次数
  • perf report -g --no-children —— 展开调用栈,查看各层耗时占比
  • 生成火焰图:perf script | ~/FlameGraph/stackcollapse-perf.pl | ~/FlameGraph/flamegraph.pl > flame.svg
  • 若看到大量 `[unknown]`,说明缺少符号:检查是否 strip、是否用了动态链接且无 debuginfo 包(如 debuginfo-install glibc

进阶:结合源码与汇编定位瓶颈

perf 支持反汇编热点函数并标注采样热点行:

  • perf report -F overhead,symbol,dso --no-children 找出 top 函数
  • perf annotate —— 显示该函数的汇编+源码混合视图,每行标注采样数
  • 关注高采样指令:如 mov 后跟 cache-miss 高,可能为内存带宽瓶颈;cmp/jne 高可能有分支预测失败
  • perf mem record ./myapp 单独采集内存访问模式(需 Intel PEBS 支持)

perf 不依赖代码插桩,开销低、精度高,是 C++ 性能调优的第一工具。重点在于编译选项扎实、采集目标明确、分析时善用调用图和 annotate 定位到行级细节。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

378

2023.09.04

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

359

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

558

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1343

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

698

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

293

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

772

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

571

2023.07.06

笔记本电脑卡反应很慢处理方法汇总
笔记本电脑卡反应很慢处理方法汇总

本专题整合了笔记本电脑卡反应慢解决方法,阅读专题下面的文章了解更多详细内容。

1

2025.12.25

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6万人学习

Git 教程
Git 教程

共21课时 | 2.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号