0

0

c++如何进行性能分析profiling_c++ gprof工具使用与热点函数定位【实战】

穿越時空

穿越時空

发布时间:2026-01-03 11:47:02

|

402人浏览过

|

来源于php中文网

原创

gprof 编译必须加 -pg 且避免 -O2 以上优化,否则因函数内联导致统计失真;需 -O0 -pg 编译、链接也带 -pg,运行后生成 gmon.out 并与可执行文件同目录使用。

c++如何进行性能分析profiling_c++ gprof工具使用与热点函数定位【实战】

gprof 编译时必须加 -pg 且不能用 -O2 以上优化

gprof 依赖编译器在函数入口/出口插入计数桩(instrumentation),而高阶优化(如 -O2-O3)会内联函数、删除看似无用的调用,导致 gprof 统计失真甚至完全漏掉热点。实测中,-O1 通常可接受,但最稳妥的是 -O0 -pg

  • g++ -O0 -pg -o myapp main.cpp utils.cpp —— 正确:关闭优化,启用桩点
  • g++ -O2 -pg -o myapp main.cpp —— 危险:gprof 报告中大量函数调用次数为 0,% time 分布异常
  • 链接阶段也需带 -pg,否则动态链接库中的函数不会被采样

运行程序后自动生成 gmon.out,必须在同一目录下执行 gprof

程序退出(非 crash 或 exit(0) 之外的强制终止)后,会在**当前工作目录**生成 gmon.out。这个文件是二进制格式,不可编辑,且与可执行文件强绑定——换路径、重命名或重新编译都会让 gprof 解析失败。

  • 正确流程:
    ./myapp
    gprof myapp gmon.out > profile.txt
  • 错误操作:gprof ./build/myapp gmon.out —— 若 myapp 不在当前目录,gprof 找不到符号表,报错 not in a.out format
  • 若程序 fork 多进程,只有主进程生成 gmon.out;子进程需单独处理(gprof 默认不支持多进程聚合)

看懂 flat profilecall graph 的关键字段

flat profile 告诉你「哪个函数耗时最多」,call graph 揭示「谁调用了谁、调用频次和传播开销」。二者结合才能准确定位瓶颈。

Motiff
Motiff

Motiff是由猿辅导旗下的一款界面设计工具,定位为“AI时代设计工具”

下载
  • % time:该函数自身执行时间占总采样时间的百分比(不含子调用)
  • self seconds:函数纯开销,可用于横向对比不同函数
  • calls(在 call graph 中):实际调用次数,注意区分 self(本函数直接调用)和 children(子函数调用)
  • 警惕 main 占比过高却无明细:说明热点在 main 内联循环或未分离逻辑,应拆出独立函数再分析

常见失效场景:静态库、模板函数、std::function 和信号处理

gprof 对现代 C++ 构建方式支持有限,不是所有函数都能被准确追踪。

立即学习C++免费学习笔记(深入)”;

  • 静态库(.a)若未用 -pg 编译,其内部函数不会出现在 flat profile 中,只显示为“未知调用者”
  • 模板实例化函数(如 std::vector::push_back)可能被折叠或符号名过长,gprof 显示为 ??? 或截断名,需配合 c++filt 解码:echo "_ZSt4copyIPiS0_EET0_T_S2_S1_" | c++filt
  • std::function 回调、lambda 捕获、信号处理函数(signal() 注册的 handler)因跳转非标准,通常无法被 gprof 捕获
  • 高频短函数(如每微秒调用一次的 getter)可能因采样粒度(默认 10ms)被漏掉,此时需考虑 perfvalgrind --tool=callgrind
gprof 是轻量级入门工具,但它对构建一致性、运行环境和代码结构非常敏感。真正卡在“为什么没看到我想查的函数”时,先检查 gmon.out 是否存在、是否和可执行文件匹配、是否所有 .o 都用 -pg 编译——这些细节比调参更关键。

相关文章

数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

427

2024.06.27

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

313

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

522

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

49

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

190

2025.08.29

lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

202

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

189

2025.11.08

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

177

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Java 教程
Java 教程

共578课时 | 41.1万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号