linux 程序性能分析工具 gprof

  • linux 程序性能分析工具 gprof
    • gprof基本原理
    • 使用方式
    • 数据分析

linux 程序性能分析工具 gprof

参见 linux下的程序分析工具gprof

  • grof可以获取C程序运行期间的统计数据,如每个函数的耗时,调用次数及各个函数的调用关系,(gprof统计的是CPU占用时间,I/O时间不计算在内)

通常gprof的采样周期是0.01s,统计项越接近这个值误差可能越大。若函数的运行时间低于0.01S,统计值会显示为0。

gprof基本原理

类似于gdb,gprof需要对待分析的程序做一些改动,因此在程序编译的时候需要加上"-pg"选项,如果程序的某个模块在编译的时候没有加上"-pg",则该模块的函数会被排除在统计范围之外。比如想要查看库函数的profiling,则需在链接库函数的时候用“-lc_p"代替”-lc"(gprof是各个类UNIX的标准工具,系统自带的链接库通常有两个版本,它们的区别在于编译的时候是否加上了"-pg"。用-lc_p等于告诉编译器选择加上了"-pg"的那个版本)。
加上"-pg"选项后,程序的入口会于main()之前调用monstartup(),主要是申请内存存储接下来获取的统计信息。

在每个函数中会调用_mcount(),主要是在函数的堆栈中查询父函数和子函数的地址并保存下来。最后会在程序退出前调用_mcleanup(),将统计结果保存到gmon.out中,并完成清除工作。

gprof统计各个函数的运行时间是采用的抽样的方法,周期性的查看Programcounter指向哪一个函数的地址段,并把结果以直方图的形式保存下来。

使用方式

  • 编译时加-pg选项,程序正常退出时,生成gmon.out,通过gprof可以查看gmon.out中的统计结果。
  • gprof -b exe_file 生成分析日志,-b减少冗余的说明信息
#define MAX 10000000
void f() {
    long long sum = 0;
    for (long long i=0;i

数据分析

Flat profile:

Each sample counts as 0.01 seconds.
  %   cumulative   self              self     total           
 time   seconds   seconds    calls  ms/call  ms/call  name    
 36.12      0.05     0.05        2    25.28    25.28  f()
 36.12      0.10     0.05                             main
 28.89      0.14     0.04        1    40.45    65.73  g()
///////////////////////////////////////////////////////////////// 
%time              : 各个函数占用的时间比例,加和应该为 100% 
cumulative seconds : 累计时间,当前行函数耗时为当前行累计时间减去上一行
self seconds       : 当前函数耗时不包含子函数
calls              : 调用次数
self ms/call       : 调用一次平均时间(不包含子函数)
total ms/call      : 调用一次平均耗时(包括子函数)
name               : 函数名
////////////////////////////////////////////////////////////////
            Call graph
///////////////////////////////////////////////////////////////// 
1, 每个函数对应1个 index, 每个函数对应一个 entry
2, 不同 entry 之间虚线分割
3,每个 entry 中以 index 开始的行成为 primary line
4,primary 上面的为 caller line, 下面的为 subroutine line
////////////////////////////////////////////////////////////////

granularity: each sample hit covers 2 byte(s) for 7.06% of 0.14 seconds

index % time    self  children    called     name
                                                 
[1]    100.0    0.05    0.09                 main [1]
                0.04    0.03       1/1           g() [2]
                0.03    0.00       1/2           f() [3]
-----------------------------------------------
                0.04    0.03       1/1           main [1]
[2]     46.4    0.04    0.03       1         g() [2]
///////////////////////////////////////////////////////////////// 
1, primary line
2, index - 2
3, time 耗时占比为 46.4
4, self 当前函数耗时 0.04 不包含子函数
5, children 子函数耗时 0.03
6, called 调用次数
////////////////////////////////////////////////////////////////
                0.03    0.00       1/2           f() [3]
///////////////////////////////////////////////////////////////// 
1, subroutine line
2, self 当前函数耗时 0.03 不包含子函数
3, children 子函数耗时 0.00
4, called 1/2 f()共被调用两次,g调用1次
////////////////////////////////////////////////////////////////
-----------------------------------------------
                0.03    0.00       1/2           g() [2]
                0.03    0.00       1/2           main [1]
[3]     35.7    0.05    0.00       2         f() [3]
-----------------------------------------------

Index by function name

   [3] f()                     [2] g()                     [1] main

你可能感兴趣的:(linux 程序性能分析工具 gprof)