在系统默认动作列,“终止
w/core
”表示在进程当前工作目录的
core
文件中复制了该进程的存储图像(该文件名为
core
,由此可以看出这种功能很久之前就是
UNIX
功能的一部分)。大多数
UNIX
调试程序都使用
core
文件以检查进程在终止时的状态。
core
文件的产生不是
POSIX.1
所属部分
,
而是很多
UNIX
版本的实现特征。
UNIX
第
6
版没有检查条件
(a)
和
(b)
,并且其源代码中包含如下说明:“如果你正在找寻保护信号,那么当设置
-
用户
-ID
命令执行时,将可能产生大量的这种信号”。
4.3 + BSD
产生名为
core.prog
的文件,其中
prog
是被执行的程序名的前
1 6
个字符。它对
core
文件给予了某种标识,所以是一种改进特征。
表中“硬件故障”对应于实现定义的硬件故障。这些名字中有很多取自
UNIX
早先在
DP-11
上的实现。请查看你所使用的系统的手册,以确切地确定这些信号对应于哪些错误类型。
下面比较详细地说明这些信号。
? SIGABRT
调用
abort
函数时产生此信号。进程异常终止。
? SIGBUS
指示一个实现定义的硬件故障。
? SIGEMT
指示一个实现定义的硬件故障。
EMT
这一名字来自
PDP-11
的
emulator trap
指令。
? SIGFPE
此信号表示一个算术运算异常,例如除以
0
,浮点溢出等。
? SIGILL
此信号指示进程已执行一条非法硬件指令。
4.3BSD
由
abort
函数产生此信号。
SIGABRT
现在被用于此。
? SIGIOT
这指示一个实现定义的硬件故障。
IOT
这个名字来自于
PDP-11
对于输入/输出
TRAP(input/output TRAP)
指令的缩写。系统
V
的早期版本,由
abort
函数产生此信号。
SIGABRT
现在被用于此。
? SIGQUIT
当用户在终端上按退出键(一般采用
Ctrl-\
)时,产生此信号,并送至前台进
程组中的所有进程。此信号不仅终止前台进程组(如
SIGINT
所做的那样),同时产生一个
core
文件。
? SIGSEGV
指示进程进行了一次无效的存储访问。
名字
SEGV
表示“段违例(
segmentation violation
)”。
? SIGSYS
指示一个无效的系统调用。由于某种未知原因,进程执行了一条系统调用指令,
但其指示系统调用类型的参数却是无效的。
? SIGTRAP
指示一个实现定义的硬件故障。
此信号名来自于
PDP-11
的
TRAP
指令。
? SIGXCPU SVR4
和
4.3+BSD
支持资源限制的概念。如果进程超过了其软
C P U
时间限制,则产生此信号。
? SIGXFSZ
如果进程超过了其软文件长度限制,则
SVR4
和
4.3+BSD
产生此信号。
摘自《
UNIX
环境高级编程》第
10
章
信号。
使用
core
文件调试程序
看下面的例子:
/*core_dump_test.c*/
1 #include <stdio.h>
2
3 const char *str = "test";
4
5 void core_test()
6 {
7 str[1] = 'T';
8 }
9
10 int main()
11 {
12 core_test();
13
14 return 0;
15 }
编译:
[zhangrong@localhost core_dump]$ gcc �Cg core_dump_test.c -o core_dump_test
如果需要调试程序的话,使用
gcc
编译时加上
-g
选项,这样调试
core
文件的时候比较容易找到错误的地方。
执行:
[zhangrong@localhost core_dump]$ ./core_dump_test
段错误
运行
core_dump_test
程序出现了“段错误”,但没有产生
core
文件。这是因为系统默认
core
文件的大小为
0
,所以没有创建。可以用
ulimit
命令查看和修改
core
文件的大小。
[zhangrong@localhost core_dump]$ ulimit -c
0
[zhang
rong
@localhost core_dump]$ ulimit -c 1000
[zhang
rong
@localhost core_dump]$ ulimit -c
1000
-c
指定修改
core
文件的大小,
1000
指定了
core
文件大小。也可以对
core
文件的大小不做限制,如:
[zhang
rong
@localhost daemon]# ulimit -c unlimited
[zhang
rong
@localhost daemon]# ulimit -c
unlimited
如果想让修改永久生效,则需要修改配置文件,如
.bash_profile
、
/etc/profile
或
/etc/security/limits.conf
。
再次执行:
[zhang
rong
@localhost core_dump]$ ./core_dump_test
段错误
(core dumped)
[zhang
rong
@localhost core_dump]$ ls core.*
core.6133
可以看到已经创建了一个
core.6133
的文件
.6133
是
core_dump_test
程序运行的进程
ID
。
调式
core
文件
core
文件是个二进制文件,需要用相应的工具来分析程序崩溃时的内存映像。
[zhang
rong
@localhost core_dump]$ file core.6133
core.6133: ELF 32-bit LSB core file Intel 80386, version 1 (SYSV), SVR4-style, from 'core_dump_test'
在
Linux
下可以用
GDB
来调试
core
文件。
[zhang
rong
@localhost core_dump]$ gdb core_dump_test core.6133
GNU gdb Red Hat Linux (5.3post-0.20021129.18rh)
Copyright 2003 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute copies of it under certain conditions.
Type "show copying" to see the conditions.
There is absolutely no warranty for GDB. Type "show warranty" for details.
This GDB was configured as "i386-redhat-linux-gnu"...
Core was generated by `./core_dump_test'.
Program terminated with signal 11, Segmentation fault.
Reading symbols from /lib/tls/libc.so.6...done.
Loaded symbols for /lib/tls/libc.so.6
Reading symbols from /lib/ld-linux.so.2...done.
Loaded symbols for /lib/ld-linux.so.2
#0 0x080482fd in core_test () at core_dump_test.c:7
7 str[1] = 'T';
(gdb) where
#0 0x080482fd in core_test () at core_dump_test.c:7
#1 0x08048317 in main () at core_dump_test.c:12
#2 0x42015574 in __libc_start_main () from /lib/tls/libc.so.6
GDB
中键入
where
,就会看到程序崩溃时堆栈信息(当前函数之前的所有已调用函数的列表(包括当前函数),
gdb
只显示最近几个),我们很容易找到我们的程序在最后崩溃的时候调用了
core_dump_test.c
第
7
行的代码,导致程序崩溃。注意:在编译程序的时候要加入选项
-g
。您也可以试试其他命令, 如
fram
、
list
等。更详细的用法,请查阅
GDB
文档。
core
文件创建在什么位置
在进程当前工作目录的下创建。通常与程序在相同的路径下。但如果程序中调用了
chdir
函数,则有可能改变了当前工作目录。这时
core
文件创建在
chdir
指定的路径下。有好多程序崩溃了,我们却找不到
core
文件放在什么位置。和
chdir
函数就有关系。当然程序崩溃了不一定都产生
core
文件。
什么时候不产生
core
文件
在下列条件下不产生
core
文件:
( a )
进程是设置
-
用户
-ID
,而且当前用户并非程序文件的所有者;
( b )
进程是设置
-
组
-ID
,而且当前用户并非该程序文件的组所有者;
( c )
用户没有写当前工作目录的许可权;
( d )
文件太大。
core
文件的许可权
(
假定该文件在此之前并不存在
)
通常是用户读
/
写,组读和其他读。
利用
GDB
调试
core
文件,当遇到程序崩溃时我们不再束手无策。