高效获得Linux函数调用栈/backtrace的方法

有四种方法可以获得Linux的函数调用堆栈,参见CALL STACK TRACE GENERATION。

在这里简单罗列一下文中提到的四个方案:

  • 方法1 GCC内置函数__builtin_return_address
  • 方法2 Glibc中的backtrace函数
  • 方法3 Jeff Muizelaar实现的增强backtrace,除了函数名,还能获得代码行号
  • 方法4 libunwind

这里面的方法2和方法4都尝试过,方法2的backtrace函数是通过读取操作系统的一个全局信息区,在多线程并发调用时,会造成严重的锁冲突。

方法4的libunwind也存在开销较大的问题。

最终采用了下面的方案:

#define STACKCALL __attribute__((regparm(1),noinline))
void ** STACKCALL getEBP(void){
		void **ebp=NULL;
		__asm__ __volatile__("mov %%rbp, %0;\n\t"
					:"=m"(ebp)      /* 输出 */
					:      /* 输入 */
					:"memory");     /* 不受影响的寄存器 */
		return (void **)(*ebp);
}
int my_backtrace(void **buffer,int size){
	
	int frame=0;
	void ** ebp;
	void **ret=NULL;
	unsigned long long func_frame_distance=0;
	if(buffer!=NULL && size >0)
	{
		ebp=getEBP();
		func_frame_distance=(unsigned long long)(*ebp) - (unsigned long long)ebp;
		while(ebp&& frame0))
		{
			ret=ebp+1;
			buffer[frame++]=*ret;
			ebp=(void**)(*ebp);
			func_frame_distance=(unsigned long long)(*ebp) - (unsigned long long)ebp;
		}
	}
	return frame;
}


my_backtrace返回的内容和glibc的backtrace相同,可以用《使用backtrace获得动态链接库的调用地址》中的方法获得可读的调用栈。

局限性:

如果源代码编译时使用了-O1或-O2优化选项,可执行代码会把ebp/rbp/rsp寄存器当作普通寄存器使用,导致backtrace失败。为了防止这种情况发生,可以在编译时使用-O2  -fno-omit-frame-pointer  或-Og 来避免优化中使用上述寄存器。

文中的关于my_backtrace的实现主要归功于WangPeng同学。

参考文献

http://blog.chinaunix.net/uid-24774106-id-3457205.html

http://www.linuxidc.com/Linux/2011-08/41641.htm

你可能感兴趣的:(一些思考)