一年前针对监控系统一核心组件做优化时总结的,不局限于性能优化,权且做个记录吧。
欲对某个程序做优化,首先要弄清楚需要优化的原因,常见的原因包括:
此次优化的主要原因为:
分析程序的手段很多,通常情况下我们可以借助工具分析程序的call graph帮助理清程序逻辑,使用profile工具找出性能瓶颈。当然,终结做法还得rtfc。
call graph 以图的方式很直观地反应出函数的调用关系,帮助我们理清程序逻辑。
常用工具:doxygen egypt gprof 等
参考:http://en.wikipedia.org/wiki/Call_graph
Egypt:
Egypt is a devilishly simple tool for creating call graphs of C programs.
http://www.gson.org/egypt/
http://www.gson.org/egypt/egypt.html
勘误:make CFLAGS=-dr 应为make CFLAGS=-dx -fdump-rtl-expand
Doxygen:
Doxygen is a tool for writing software reference documentation.
快速指南:http://www-scf.usc.edu/~peterchd/doxygen/
Profiling, a form of dynamic program analysis (as opposed to static code analysis), is the investigation of a program’s behavior using information gathered as the program executes.
http://en.wikipedia.org/wiki/Software_performance_analysis#Instrumentation
gprof:
GNU 工具之一,在编译的时候在每个函数的出入口加入profiling 的代码,运行时统计程序在用户态的执行信息。
可以得到每个函数的调用次数,执行时间,调用关系等信息,适合查找用户级程序的性能瓶颈,不适合分析很多时间都在内核态执行的程序。
http://sourceware.org/binutils/docs/gprof/
使用方式:
make CFLAGS = pg LDFLAGS = pg
运行程序./program_name
分析结果:gprof program_name gmon.out
注意事项:
必须在编译和链接的时候都使用-pg 选项
如果想跟踪到使用的库,连接的时候必须使用-lc p 库
程序不能是守护进程
程序必需正常退出,返回操作系统
oprof:
使用硬件调试寄存器来统计信息,进行profiling 的开销比较小,而且可以对内核进行profiling。
可以得到gprof 得不到的cache 的缺失率,memory 的访存信息,分支预测错误率等等,但得不到函数调用次数。
http://oprofile.sourceforge.net/about/
使用:
opcontrol –reset
opcontrol –init
opcontrol –setup –separate=lib,kernel,thread –no-vmlinux
opcontrol –start-daemon
opcontrol –start
opcontrol –dump
opcontrol –stop
opreport –demangle=smart –symbols –long-filenames –merge
tgid /usr/local/wsms al/bin/al
注意事项:
待分析程序必须带有符号信息,可以用nm 命令判断。
安装debuginfo 包可以使oprofile 获得程序的符号信息。
工具提供一种帮助,真正找出问题的解决方案还得rtfc,rtfc是一种精神,呵呵。