我们知道所有的程序最终运行起来,都会变成进程,进程在运行时可能会异常终止或崩溃,而Linux操作系统会将程序当时的内存状态记录下来,保存在一个文件中,这种行为就叫做Core Dump
(中文有的翻译成核心转储)。
保存的这个文件通常是:该进程的同目录下以core.PID
的方式命名的文件。
在Linux下core dump选项一般是被关闭的,我们可以通过ulimit -a
查看当前Linux下系统资源的限制。
可以看到,core file size
的大小是0,这说明系统不允许我们生成core file
文件 ,我们可以使用命令设置生成的core file
文件的大小的最大限制。
ulimit -c 10240
可以看到使用此命令以后我们生成的core file
文件的大小的最大限制就变为了10240 blocks了。
在Linux下有很多信号我们可以使用kill -l
查看:
kill -l
但是并不是所有的信号引起的退出都会产生core file
文件,只有有core
标志的信号引起的退出才会产生core file
文件,我们可以通过 man 7 signal
查看信号的详细信息
man 7 signal
11
号信号SIGSEGV
是一个段错误的信号,当你的进程有内存越界等问题时,通常会收到该信号,可以看到该信号是有core
标志的。
2
号信号SIGINT
其实就是我们常用的 Ctrl + C 键产生的信号,可以看到该进程是没有core标志的
下面我们用代码来验证:
#include
#include
using namespace std;
int main()
{
while (true)
{
cout << "我是一个正在运行的进程..." << endl;
sleep(1);
}
return 0;
}
对于这个死循环代码我们使用 Ctrl + C 来进行终止,观察是否有core file
文件的产生。
可以看到并没有core file
文件的生成。
我们再来看下面的代码:
#include
#include
using namespace std;
int main()
{
int* p = nullptr;
*p = 10;
cout << "野指针问题" << endl;
return 0;
}
很明显这里会收到SIGSEGV
信号,而SIGSEGV
是有core标志的,因此此进程运行完毕以后应该生成core file
文件。
运行结果:
可以看到确实生成了core file
文件,我们打开该文件:
发现是乱码,这时因为core file里面是数据都是内存中的二进制数据,我们不使用特殊编码是看不懂里面的含义的。
在以前我们学习进程等待时一定学习过:对于一个存储了进程的退出码的变量,其内部结构是这样的: 次第8
位表示退出码,最低7
位表示终止信号,终止信号的前一位就是core dump
标志位。
按照这样的结构,如果我们创建一个子进程,让子进程直接遇到野指针收到SIGSEGV
信号直接退出,然后我们在父进程里面检查core dump的标志位是否被置为1
#include
#include
#include
#include
#include
using namespace std;
int main()
{
pid_t id = fork();
if (id == 0)
{
// 子进程
int* p = nullptr;
*p = 10;
cout << "野指针问题" << endl;
exit(0);
}
int status = 0;
wait(&status);
cout << "子进程的退出信号:" << (status & 0x7F) << endl;
cout << "子进程的core dump标志位:" << ((status >> 7) & 0x1) << endl;
return 0;
}
运行结果:
当然这个结果是在core dump被开启的条件下,那么我们将core dump关闭运行的结果还会一致吗?
运行同样的代码,结果是:
可以看到 core dump标志位被改为了0
。
结论:
同样的程序,在core dump是否开启时会有不同的效果。
如果core dump开启,遇到有core 标志的信号,会进行核心转储,并且退出码里面的core dump 标志位会被置为1
。
如果core dump关闭,遇到有core 标志的信号,也不会进行核心转储,并且退出码里面的core dump 标志位始终置为0
。
因为core file
文件内部有进程退出时的内存中的相关信息 ,所以我们可以用这些信息在gdb
里面进行调试我们的代码,注意调试的程序要以debug
模式发布。
例如下面的代码生成的core file 文件:
#include
#include
using namespace std;
int main()
{
int* p = nullptr;
*p = 10;
cout << "野指针问题" << endl;
return 0;
}
我们在gdb
里面进行调试,然后直接使用下面的命令,gdb就能直接帮我们找到问题的根源了,这种调试手段一般被称为事后调试。
core-file core文件