连接地址:http://pppboy.blog.163.com/blog/static/30203796201231011715932
任何人写程序都会出错,正如《C++编程规范》所说,真正可怕的错误不是编译时的错误,而是运行时错误。
有的程序可以通过编译, 但在运行时会出现Segment fault(段错误)
这通常都是指针错误(一般就是空指针)引起的,或者访问了不能访问的内存(数组越界,系统保护)
我们不可能用GDB一句一句的去找,真正的英雄都善于使用手中的武器。这就是core file
所谓core,就是当程序down掉的时候,操作系统把程序的内存内容dump下来,这个动作就是core dump,动作的结果就是core文件
产生:
1.程序挂了,操作系统产生
2.通过gcore $pid命令直接导出相应进程的core文件,此命令运行后, 会恢复程序的执行, 不影响程序的运行
3.通过另一个进程发送SIGABRT信号给当前进程, 虽然也能产生core文件,但是程序随着一起终止掉
1.终端级别
怎么样才能让程序down掉的时候,自动core dump呢?可以通过 ulimit查看和设置
#查看core文件的信息 ulimit -a
ju@musicoder:~$ ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 20
file size (blocks, -f) unlimited
pending signals (-i) 16382
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) unlimited
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
ju@musicoder:~$
可以看到,core file size 是0,那就是说程序down了的时候,不会生成core文件,这个功能是关闭的。
可以使用 ulimit -c unlimited 设置允许当前生成没有大小限制的core file
ju@musicoder:~$ ulimit -c unlimited
只能对当前终端有效,退出就无效。
这样做,是因为只想临时生成core file,不需要每次crash时都自动生成。
2.用户级别
用户在自己的~/.bash_profile中加入
ulimit -S -c unlimited > /dev/null 2>&1
这样设置后允许当前用户生成没有大小限制的core dump文件
3.系统级别
(1)对所有用户
修改/etc/profile,加入或者修改
ulimit -S -c unlimited > /dev/null 2>&1
这样设置后允许所有用户生成没有大小限制的core dump文件。
优点:不需要重起系统
缺点:无法控制只让某些用户生成core dump文件
(2)上面这种方法也是有缺点的,那就是Tom用会产生core,Jerry也会产生,实行上我们只要Tom产生
修改/etc/security/limits.conf 可做到
ps.很多系统上限都可以通过修改这个文件改变,如最大子进程个数,最大打开文件数等等。这个文件开头有详细的注释,对如何修改这个文件做了说明。
ju@musicoder:/etc/security$ cat limits.conf
# /etc/security/limits.conf
#
#* soft core 0
#root hard core 100000
# End of file
ju@musicoder:/etc/security$
我们看到了 * soft core 0 这一行,他表示对所有用户生产dump,但默认是注释了的
如果只想对某些用户或用户组打开core dump,可以加入
Tom soft core 0
@TomGroup soft core 0
#0是大小
优点:可以针对特定用户或特定组打开core dump文件
缺点:需要重起系统
1.pid信息
在/proc/sys/kernel/core_uses_pid中配置是否core带pid的扩展
文件内容为1,表示添加pid作为扩展名,生成的core文件格式为core.xxxxx;(xxxxx如12345为pid)
为0则表示生成的core文件统一命名为core
ju@musicoder:~$ cat /proc/sys/kernel/core_uses_pid
0
可通过以下命令修改此文件(root)
root@musicoder:/home/ju# echo "1" > /proc/sys/kernel/core_uses_pid
2.保存位置和文件名格式
/proc/sys/kernel/core_pattern 中配置生成文件的文件名和保存位置
ju@musicoder:~$ cat /proc/sys/kernel/core_pattern
core
#可通过以下命令修改此文件:
root@musicoder:/home/ju# echo "/tmp/core-%e-%p-%t" > /proc/sys/kernel/core_pattern
#当然也可以是 sysctl -w kernel.core_pattern=/tmp/core-%e-%p-%t
可以将core文件统一生成到/tmp目录下,产生的文件名为 core-命令名-pid-时间戳
以下是参数列表:
%p - insert pid into filename 添加pid
%u - insert current uid into filename 添加当前uid
%g - insert current gid into filename 添加当前gid
%s - insert signal that caused the coredump into the filename 添加导致产生core的信号
%t - insert UNIX time that the coredump occurred into filename 添加core文件生成时的unix时间
%h - insert hostname where the coredump happened into filename 添加主机名
%e - insert coredumping executable name into filename 添加命令名
#我是生成到自己的当前目录下方便使用
echo "core-%e-%p-%t" > /proc/sys/kernel/core_pattern
用gdb进行查看core文件的内容
gdb [exec file] [core file]
之后基本上只用bt就可以找到信息了,当然还有where, frame, up, down, print等活用。
实践出真知
1.代码
1: //a test file
2:
3: #include
4: using namespace std;
5:
6: void test_fun()
7: {
8: char* szTmp = 0x00;
9:
10: //null ptr
11: *szTmp = 0x11;
12: }
13:
14: int main()
15: {
16: test_fun();
17: return 0;
18: }
19:
2.编译
#编译时加 -g 参数得到符号
ju@musicoder:~/study/dump$ g++ -g -o dump dump.cpp
ju@musicoder:~/study/dump$ ls -l
总用量 40
-rwxr-xr-x 1 ju ju 34437 2012-04-10 00:06 dump
-rw-r--r-- 1 ju ju 154 2012-04-10 00:05 dump.cpp
ju@musicoder:~/study/dump$
3.运行
运行出错,出现了core文件(会比较大)
ju@musicoder:~/study/dump$ ./dump
段错误 (core dumped)
ju@musicoder:~/study/dump$ ls -l
总用量 160
-rw------- 1 ju ju 221184 2012-04-10 00:06 core-dump-17044-1333987618
-rwxr-xr-x 1 ju ju 34437 2012-04-10 00:06 dump
-rw-r--r-- 1 ju ju 154 2012-04-10 00:05 dump.cpp
ju@musicoder:~/study/dump$
4.调试
ju@musicoder:~/study/dump$ gdb ./dump core-dump-17044-1333987618
GNU gdb (GDB) 7.1-ubuntu
Copyright (C) 2010 Free Software Foundation, Inc.
#好多xxx
#最后可以看到
Loaded symbols for /lib/ld-linux.so.2
Core was generated by `./dump'.
Program terminated with signal 11, Segmentation fault.
#0 0x080485a4 in test_fun () at dump.cpp:9
9 *szTmp = 0x11;
(gdb)
#很容易就定位了,一般指针出错都会有完整的堆栈信息,而数组越界则堆栈信息不完整显示
1.不对文章正确性做保证,只为本人学习之用。
2.本文参考了好多其它作者的文章,也引用了一些文字,对他们的知识共享精神表示感谢。
3.本文链接:
(1)好像加了这个就会被网易屏蔽
(2)http://pppboy.blog.163.com/blog/static/30203796201231011715932/
4.本文可以任意转载修改使用,但请保证文章完整性,不要误导他人。
5.注意身体,早点休息,不做就别做,做就做好。