从dmesg里分析core原因

阅读更多

服务器上由于怕软件bug以及磁盘的限制,一般会将core文件关掉.

ulimit -a查看当前core file size设置.

这样程序有bug崩溃以后,只能通过dmesg查看有限信息.典型信息如下:

collector[1847]: segfault at 000000000000000c rip 000000000040308a rsp 0000007fbffff820 error 4

at后面地址:访问越界的地址,rip:指令地址,rsp:栈地址,error:错误类型.

error number是由三个字位组成的,从高到底分别为bit2 bit1和bit0,所以它的取值范围是0~7.
bit2: 值为1表示是用户态程序内存访问越界,值为0表示是内核态程序内存访问越界
bit1: 值为1表示是写操作导致内存访问越界,值为0表示是读操作导致内存访问越界
bit0: 值为1表示没有足够的权限访问非法地址的内容,值为0表示访问的非法地址根本没有对应的页面,也就是无效地址

一般的程序带-g编译的话用addr2line -e ./collector 000000000040308a就大概能定位到函数

想具体一点定位可能是哪行语句的话,用objdump -d ./collector查看40308a对应的程序汇编代码即可.

当然core文件能更好的帮助解决问题,最好还是在程序里用setrlimit来设置core文件,然后根据命令行参数及是否已经生成了core文件等逻辑来判断是否生成core文件.

你可能感兴趣的:(从dmesg里分析core原因)