程序运行崩溃(segfault)的排查方法

这篇博文记录的非常详细:https://blog.csdn.net/zhaohaijie600/article/details/45246569

我的笔记:

写的C++程序老是运行两三天就挂了,关键是挂的时候连“segment fault”都不显示。动用了gdb、valgrind还是没办法,最后还是根据系统的日志定位到了问题。

首先,最好是在编译时加上debug选项(-g)。

程序挂掉后,在终端通过指令

dmesg
#或者
dmesg | grep 你的程序名

在系统日志中查找到相关的信息。


随便写个例子:

a.out[2374]: segfault at 7f0ed0bfbf70 ip 00007f0edd646fe7 sp 00007f0ed3603978 error 4 a.out[7f0edd514000+1b6000]

at(位置),ip(instruction pointer 指令指针),sp(stack pointer 堆指针),后面跟的都是地址。

对这三个地址分别执行

addr2line -e a.out xxxxxxxx
这里的“xxxxxxxx”就是上面的“7f0ed……”,前面的0可以省略,三个地址都试一下。如果成功了,终端会打印出来这个地址对应的代码行(前面提到编译时要加-g)。


这里的“error 4”是什么意思?把它更换成二进制表示,就是:100。说明是用户态内存访问越界了

bit2:值为1表示是用户态程序内存访问越界,值为0表示是内核态程序内存访问越界
bit1:
值为1表示是写操作导致内存访问越界,值为0表示是读操作导致内存访问越界
bit0:
值为1表示没有足够的权限访问非法地址的内容,值为0表示访问的非法地址根本没有对应的页面,也就是无效地址

然后就去找问题啦。如果是自己代码的问题,上面执行“addr2line”的时候就直接把出错的代码行号都给出来了;如果是动态库的问题,可以借鉴上面链接博客里的经验。

你可能感兴趣的:(Linux,C/C++)