1. core文件的简单介绍
在一个程序崩溃时,它一般会在指定目录下生成一个core文件,core文件包含了程序运行时的内存,寄存器状态,堆栈指针,内存管理信息等,可以帮助我们进行调试。
2. 造成coredump的常见原因
(1) 内存访问越界
(2) 多线程程序使用了线程不安全的函数
(3) 多线程读写的数据未加锁保护
(4) 非法指针
(5) 堆栈溢出
3. core文件的生成开关和大小限制
(1) 使用ulimit –c命令可查看core文件的生成开关,若结果为0,则表示关闭了此功能,不会生成core文件。
(2) 使用ulimit –c filesize命令,可以限制core文件的大小,如果此文件大小超过限制,将会被裁剪,最终生成不完整的core文件。若为ulimit –c unlimited,则不限制core文件的大小。
注意:在测试前需检查core文件的开关是否打开;在测试过程中发现程序异常退出,但没有产生core,我们也需要第一时间检查core文件是否打开。有几种方式让程序产生core:
(1) 修改core文件生成大小的配置,例如ulimit –c 1000,这个修改只对当前会话有效;
(2) 通过将一个相应的 ulimit 语句添加到由登录 shell 读取的文件,如~/.profile,例如在wx用户下的~/.profile增加ulimit –c unlimited,那么对于wx用户就可以生成没有大小限制的core文件,但是对于其他用户不生效;
(3) 修改/etc/profile文件,将默认配置# ulimit -Sc 0,将配置改成可用,并设置为ulimit -Sc unlimited,那么该机器的所有用户都将生成无大小限制的core文件;
(4) 在程序的启动脚本(例如restart.sh)的开头设置ulimit –c unlimited,这只是对该进程有用;
4. core文件的名称和生成路径设置
若系统生成的core文件不带其他任何扩展名称,则全部命名为core,新的core文件生成将会覆盖原来的core文件。
/proc/sys/kernel/ core_uses_pid可以控制core文件的文件名是否添加pid作为扩展。文件内容为1表示添加pid,生成的core文件格式为core.XXXX,为0表示不添加。可以通过以下命令修改此文件:echo “1”> /proc/sys/kernel/ core_uses_pid。
/proc/sys/kernel/ core_pattern可以控制core文件保存位置和文件名格式。可以通过以下命令修改此文件:
echo “/corefile/core-%e-%p-%t”> core_pattern,可以将core文件统一生成到/corefile目录下,产生的文件名为core-命令名-pid-时间戳,以下是参数列表:
%p表示添加pid;
%u表示添加当前uid;
%g表示添加当前gid;
%s表示添加导致产生core的信号;
%t表示添加core文件生产时的unix时间;
%h表示添加主机名;
%e表示添加命令名;
5. 如何查看core文件
如果我们不清楚core是由哪个进程产生的,我们可以通过使用命令“file core文件”来查看。
例如core文件是由test这个进程产生的,那么通过命令“gdb test corefile”查看core文件的内容,在输入bt或where检查程序运行到哪里,来定位coredump的行。