用户输入命令,在Shell下启动一个前台进程:
为什么使用Ctrl+C后,该进程就终止了?
当用户按下Ctrl+C后,键盘输入会产生一个硬中断,被操作系统获取并解释成信号(Ctrl+C被解释成2号信号),然后操作系统将2号信号发送给目标前台进程,当前台进程收到2号信号后就会退出。
我们可以使用signal函数对2号信号进行捕捉,证明当我们按Ctrl+C时进程确实是收到了2号信号。使用signal函数时,我们需要传入两个参数,第一个是需要捕捉的信号编号,第二个是对捕捉信号的处理方法,该处理方法的参数是int,返回值是void。
#include
#include
#include
#include
using namespace std;
void catchSig(int signum)
{
cout << "进程捕捉到一个信号,正在处理中....:" << signum << " pid:" << getpid() << endl;
}
int main()
{
signal(SIGINT, catchSig);
while(true)
{
cout << "我是一个进程,我正在运行...., pid:" << getpid() << endl;
sleep(1);
}
return 0;
}
注意:signal函数,仅仅是修改进程对特定信号的后续处理动作,不是直接调用对应的处理动作,如果后续没有任何SIGINT信号产生,就永远不会发生调用。
注意:
Ctrl+C
产生的信号只能发给前台进程。一个命令后面加个&
可以放到后台运行,这样Shell不必等待进程结束就可以接受新的命令,启动新的进程。Ctrl+C
这种控制键产生的信号。Ctrl+C
而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都有可能收到 SIGINT 信号而终止,所以信号相对于进程的控制流程来说是异步(Asynchronous)的。我们可以是有kill -l
命令来查看信号列表:
其中1 ~ 31 号信号是普通信号,34 ~ 64号信号是实时信号,普通信号和实时信号各自都有31个,每个信号都有一个编号和一个宏定义名称:
信号是如何记录的?
实际上,当一个进程接收到某种信号后,该信号是被记录在该进程的进程控制块当中的。我们都知道进程控制块本质上就是一个结构体变量,而对于信号来说我们主要就是记录某种信号是否产生,因此,我们可以用一个32位的位图来记录信号是否产生。
一个进程收到信号,本质就是该进程内的信号位图被修改了,也就是该进程的数据被修改了,而只有操作系统才有资格修改进程的数据,因为操作系统是进程的管理者。也就是说,信号的产生本质上就是操作系统直接去修改目标进程的task_struct中的信号位图。
注意: 信号只能由操作系统发送,但信号发送的方式有多种。
可选的处理动作有以下三种:
对于刚刚的程序,我们不仅可以使用Ctrl+C
来结束,也可以使用Ctrl+\
来结束:
#include
#include
#include
#include
using namespace std;
void catchSig(int signum)
{
cout << "进程捕捉到一个信号,正在处理中....:" << signum << " pid:" << getpid() << endl;
}
int main()
{
signal(SIGINT, catchSig);
while(true)
{
cout << "我是一个进程,我正在运行...., pid:" << getpid() << endl;
sleep(1);
}
return 0;
}
Ctrl+C和Ctrl+\有什么区别吗?
Ctrl+C实际上是向进程发送的2号信号SIGINT,Ctrl+\向进程发送的3号信号SIGQUIT,我们查看这两个信号的默认动作,发现他们的Action是不一样的,2号信号是Term,而3号信号是Core。
Term和Core都代表着终止进程,但是Core在终止进程的时候会进行一个动作,那就是核心转储。
什么是核心转储?
我们使用的云服务器中,核心转储的功能是被关闭的,我们可以通过ulimit -a
命令查看:
我们也可以使用ulimit -c
命令打开核心转储的功能:
此时使用Ctrl+\终止我们的进程,就会发现多了一个core dumped
标志:
并且会在当前路径下生成一个core文件,该文件以一串数字为后缀,而这一串数字实际上就是发生这一次核心转储的进程的PID。
注意:ulimit命令改变的是Shell进程的Resource Limit,但myproc进程的PCB是由Shell进程复制而来的,所以也具有和Shell进程相同的Resource Limit值。
核心转储功能有什么用?
当我们的代码出错了,我们最关心的是我们的代码是什么原因出错的。如果我们的代码运行结束了,那么我们可以通过退出码来判断代码出错的原因,而如果一个代码是在运行过程中出错的,那么我们也要有办法判断代码是什么原因出错的。
当我们的程序在运行过程中崩溃了,我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下,我们会用到核心转储,核心转储指的是操作系统在进程收到某些信号而终止运行时,将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中,这个磁盘文件也叫做核心转储文件,一般命名为core.pid
。
我们来看下面这段代码:
int main()
{
cout << "我是一个进程,我正在运行...." << endl;
sleep(5);
int a = 100;
a /= 0;
return 0;
}
很明显,上面这段代码出现了除0错误,我们运行进程,会发现他在5秒以后就会崩溃,同时会核心转储时生成一个core文件。
使用gdb对当前可执行程序进行调试,然后直接使用core-file core
文件命令加载core文件,即可判断出该程序在终止时收到了8号信号,并且定位到了产生该错误的具体代码。
说明一下: 事后用调试器检查core文件以查清错误原因,这种调试方式叫做事后调试。
core dump标志
我们在学习进程等待这一章节的时候有一个core dump标志:
我们来回忆一下我们的waitpid函数:
pid_t waitpid(pid_t pid, int *status, int options);
waitpid函数的第二个参数status是一个输出型参数,用于获取子进程的退出状态。status是一个整型变量,但status不能简单的当作整型来看待,status的不同比特位所代表的信息不同,若进程是正常终止的,那么status的次低8位就表示进程的退出状态,即退出码。若进程是被信号所杀,那么status的低7位表示终止信号,而第8位比特位是core dump标志,即进程终止时是否进行了核心转储。
我们看下面这段代码:
int main()
{
pid_t id = fork();
if(id == 0)
{
cout << "我是一个进程,我正在运行...." << endl;
sleep(1);
int a = 100;
a /= 0;
}
int status = 0;
waitpid(id, &status, 0);
cout << "父进程:" << getpid() << " 子进程:" << id
<< " exit sig:" << (status & 0x7F) << " is core:" << ((status >> 7) & 1) << endl;
return 0;
}
此时is core为1,就表示第7个比特位为1,即可说明子进程在被终止时进行了核心转储:
因此,我们也就理解了,core dump标志实际上就是用于表示程序崩溃的时候是否进行了核心转储。
注意:一般生产环境下都是关闭core dump
的,因为发生核心转储以后,核心转储会将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中,产生core.pid
文件,这个文件并不会被主动被删除,频繁core dump
的话,磁盘空间就会被占满。
我们在使用kill
命令的时候,可以通过kill + 信号编号
来杀死进程:
也可以通过kill + 信号名
来杀死进程:
kill函数
kill命令是通过调用kill函数实现的,kill函数可以给指定的进程发送指定的信号,kill函数的函数原型如下:
static void Usage(char* proc)
{
cout << "Usage:\r\n\t" << proc << " signumber processid" << endl;
}
int main(int argc, char *argv[])
{
if (argc != 3)
{
Usage(argv[0]);
exit(1);
}
int signumber = atoi(argv[1]);
int procid = atoi(argv[2]);
kill(procid, signumber);
return 0;
}
raise函数
raise函数可以给当前进程发送指定信号,即自己给自己发送信号,raise函数的函数原型如下:
int raise(int sig);
raise函数用于给当前进程发送sig号信号,如果信号发送成功,则返回0,否则返回一个非零值。
如下代码:
void handler(int sig)
{
cout << "get s signal:" << sig << endl;
}
int main()
{
signal(2, handler);
while(true)
{
sleep(1);
raise(2);
}
return 0;
}
abort函数
abort函数可以给当前进程发送SIGABRT信号,使得当前进程异常终止,abort函数的函数原型如下:
void abort(void);
代码如下,代码当中每隔一秒向当前进程发送一个SIGABRT信号:
void handler(int sig)
{
cout << "get s signal:" << sig << endl;
}
int main()
{
signal(6, handler);
while(true)
{
sleep(1);
abort();
}
return 0;
}
与之前不同的是,虽然我们对SIGABRT信号进行了捕捉,并且在收到SIGABRT信号后执行了我们给出的自定义方法,但是当前进程依然是异常终止了。
注意: abort函数的作用是异常终止进程,exit函数的作用是正常终止进程,而abort本质是通过向当前进程发送SIGABRT信号而终止进程的,因此使用exit函数终止进程可能会失败,但使用abort函数终止进程总是成功的。
我们如何理解通过系统函数向进程发信号呢?
用户调用系统接口—>执行OS对应的系统调用代码—>OS提取参数或者设定特定的数值—>OS像目标进程写信号—>修改对应进程的信号标记位—>进程后续处理信号—>执行对应的处理动作
SIGPIPE信号
SIGPIPE信号实际上就是一种由软件条件产生的信号,当进程在使用管道进行通信时,读端进程将读端关闭,而写端进程还在一直向管道写入数据,那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。
int main()
{
//1.创建匿名管道
int pipefd[2] = {0};
int n = pipe(pipefd);
assert(n != -1);
(void) n;
//2.创建子进程
pid_t id = fork();
if(id == 0)
{
//关闭读端
close(pipefd[0]);
//子进程向管道写入数据
const char* msg = "hello father, i am child....";
int count = 5;
while(count--)
{
write(pipefd[1], msg, strlen(msg));
sleep(1);
}
close(pipefd[1]);
exit(1);
}
close(pipefd[1]); //父进程关闭写端
close(pipefd[0]); //父进程关闭读端
int status = 0;
waitpid(id, &status, 0);
cout << "child get signal:" << (status & 0x7F) << endl; //打印子进程收到的信号
return 0;
}
SIGALRM信号
调用alarm函数可以设定一个闹钟,也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程,alarm函数的函数原型如下:
unsigned int alarm(unsigned int seconds);
alarm函数的作用就是,让操作系统在seconds秒之后给当前进程发送SIGALRM信号,SIGALRM信号的默认处理动作是终止进程。
alarm函数的返回值:
运行代码后,可以发现我当前的云服务器在一秒内可以将一个变量累加到四万左右:
实际上我当前的云服务器在一秒内可以执行的累加次数远大于两万,那为什么上述代码运行结果比实际结果要小呢?
主要原因有两个:首先,由于我们每进行一次累加就进行了一次打印操作,而与外设之间的IO操作所需的时间要比累加操作的时间更长,其次,由于我当前使用的是云服务器,因此在累加操作后还需要将累加结果通过网络传输将服务器上的数据发送过来,因此最终显示的结果要比实际一秒内可累加的次数小得多。
我们可以先让count变量一直执行累加操作,直到一秒后进程收到SIGALRM信号后再打印累加后的数据:
int count = 0;
void handler(int signum)
{
cout << "get a signal:" << signal << endl;
cout << "count:" << count << endl;
exit(1);
}
int main()
{
signal(SIGALRM, handler);
alarm(1);
while(true)
{
count++;
}
return 0;
}
我们可以看见,ount变量在一秒内被累加的次数变成了五亿多,由此也证明了,与计算机单纯的计算相比较,计算机与外设进行IO时的速度是非常慢的。
由前面的学习我们可以知道,我们程序当中出现类似于除0、野指针、越界之类的错误时,为什么程序会崩溃?本质上是因为进程在运行过程中收到了操作系统发来的信号进而被终止。
那么操作系统是如何识别到一个进程触发了某种问题的呢?
首先,我们以除0错误为例:
我们知道,进行计算的是CPU这个硬件,CPU当中有一堆寄存器,当我们需要对两个数进行算术运算时,我们是先将这两个操作数分别放到两个寄存器当中,然后进行算术运算并把结果写回寄存器当中。
CPU当中还有一个寄存器叫做状态寄存器,有对应的状态标记位,溢出标记位;OS会在自动计算完成后进行检测,如果溢出标记位是1,OS里面识别到有溢出问题,就会立即找到当前运行的进程然后提取pid,发送信号,进程就会在合适的时候进行处理,最终终止进程;
那么,野指针错误又是如何识别呢?
首先,我们需要知道,对于一个变量的访问,我们都需要访问它的地址才可以,所以一定要经过页表映射,将虚拟地址转化为物理地址,然后才能进行访问。
其中页表属于一种软件映射关系,而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU,它是一种负责处理CPU的内存访问请求的计算机硬件,因此映射工作不是由CPU做的,而是由MMU做的,但现在MMU已经集成到CPU当中了。
当需要进行虚拟地址到物理地址的映射时,我们先将页表的左侧的虚拟地址导给MMU,然后MMU会计算出对应的物理地址,我们再通过这个物理地址进行相应的访问。
而MMU既然是硬件单元,那么它当然也有相应的状态信息,当我们要访问不属于我们的虚拟地址时,MMU在进行虚拟地址到物理地址的转换时就会出现错误,然后将对应的错误写入到自己的状态信息当中,这时硬件上面的信息也会立马被操作系统识别到,进而将对应进程发送SIGSEGV信号。
所以,C/C++程序会崩溃,是因为程序当中出现的各种错误最终一定会在硬件层面上有所表现,进而会被操作系统识别到,然后操作系统就会发送相应的信号将当前的进程终止。
总结下来就是:
根据信号在内核中的表示方法,每个信号的未决标志只有一个比特位,非0即1,如果不记录该信号产生了多少次,那么阻塞标志也只有一个比特位,因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储。
sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。
阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”,至于这个类型内部如何存储这些bit则依赖于系统的实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset(sigset_t *set, int signum);
int sigdelset(sigset_t *set, int signum);
int sigismember(const sigset_t *set, int signum);
函数解释:
注意: 在使用sigset_t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号处于确定的状态。
#include
#include
using namespace std;
int main()
{
sigset_t s;
sigemptyset(&s);
sigfillset(&s);
sigaddset(&s, SIGINT);
sigdelset(&s, SIGINT);
sigismember(&s, SIGINT);
return 0;
}
注意: 代码中定义的sigset_t类型的变量s,与我们平常定义的变量一样都是在用户空间定义的变量,所以后面我们用信号集操作函数对变量s的操作实际上只是对用户空间的变量s做了修改,并不会影响进程的任何行为。因此,我们还需要通过系统调用,才能将变量s的数据设置进操作系统。
sigprocmask函数可以用于读取或更改进程的信号屏蔽字(阻塞信号集),该函数的函数原型如下:
int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);
参数说明:
sigprocmask函数调用成功返回0,出错返回-1。
假设当前的信号屏蔽字为mask,下表说明了how参数的可选值:
选项 | 含义 |
---|---|
SIG_BLOCK | set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask I set |
SIG_UNBLOCK | set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask I ~set |
SIG_SETMASK | 设置当前信号屏蔽字为set所指向的值,相当于mask=set |
注意: 如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。
sigpending函数可以用于读取进程的未决信号集,该函数的函数原型如下:
int sigpending(sigset_t *set);
sigpending函数读取当前进程的未决信号集,并通过set参数传出。该函数调用成功返回0,出错返回-1。
我们可以采用一段代码来验证一下,代码步骤如下:
#include
#include
#include
#include
using namespace std;
void showPending(sigset_t& pending)
{
for(int sig = 1; sig < 31; sig++)
{
if(sigismember(&pending, sig))
cout << "1 ";
else
cout << "0 ";
}
cout << endl;
}
int main()
{
//1.定义信号集对象
sigset_t set, oset;
sigset_t pending;
//2.初始化对象
sigemptyset(&set);
sigemptyset(&oset);
sigemptyset(&pending);
//3.添加需要屏蔽的信号
sigaddset(&set, 2);
//4.设置set到内核中对应的进程内部[默认情况进程不会对任何信号进行block]
int n = sigprocmask(SIG_BLOCK, &set, &oset);
assert(n == 0);
(void) n;
//5.重复打印当前信号集
while(true)
{
//5.1获取当前进程pending信号集
sigpending(&pending);
//5.2显示pending信号集中没有被递达的信号
showPending(pending);
sleep(1);
}
return 0;
}
运行进程,我们就可以看到程序刚刚运行时,因为没有收到任何信号,所以此时该进程的pending表一直是全0,而当我们使用kill命令向该进程发送2号信号后,由于2号信号是阻塞的,因此2号信号一直处于未决状态,所以我们看到pending表中的第二个数字一直是1。
如果我们想看到2号信号递达后pending表的变化,我们可以设置一段时间后,自动解除2号信号的阻塞状态,解除2号信号的阻塞状态后2号信号就会立即被递达。因为2号信号的默认处理动作是终止进程,所以为了看到2号信号递达后的pending表,我们可以将2号信号进行捕捉,让2号信号递达时执行我们所给的自定义动作。
#include
#include
#include
#include
using namespace std;
void showPending(sigset_t &pending)
{
for (int sig = 1; sig < 31; sig++)
{
if (sigismember(&pending, sig))
cout << "1 ";
else
cout << "0 ";
}
cout << endl;
}
void handler(int signum)
{
cout << "捕捉信号:" << signum << endl;
}
int main()
{
signal(2, handler);
// 1.定义信号集对象
sigset_t set, oset;
sigset_t pending;
// 2.初始化对象
sigemptyset(&set);
sigemptyset(&oset);
sigemptyset(&pending);
// 3.添加需要屏蔽的信号
sigaddset(&set, 2);
// 4.设置set到内核中对应的进程内部[默认情况进程不会对任何信号进行block]
int n = sigprocmask(SIG_BLOCK, &set, &oset);
assert(n == 0);
(void)n;
cout << "block 2 号信号成功...., pid: " << getpid() << endl;
int count = 0;
// 5.重复打印当前信号集
while (true)
{
// 5.1获取当前进程pending信号集
sigpending(&pending);
// 5.2显示pending信号集中没有被递达的信号
showPending(pending);
sleep(1);
count++;
if (count == 20)
{
int n = sigprocmask(SIG_SETMASK, &oset, nullptr);
cout << "解除对于2号信号的block" << endl;
assert(n == 0);
(void)n;
}
}
return 0;
}
运行进程我们可以发现,进程收到2号信号后,该信号在一段时间内处于未决状态,当解除2号信号的屏蔽后,2号信号就会立即递达,执行我们所给的自定义动作,而此时的pending表也变回了全0。
注意:在解除2号信号后,2号信号的自定义动作是在打印“解除对2号信号的block”之前执行的。因为如果调用sigprocmask解除对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。
在理解捕捉信号之前,我们需要再来认识一下内核空间与用户空间:
虽然每个进程都能够看到操作系统,但并不意味着每个进程都能够随时对其进行访问。
如何理解进程切换?
在当前进程的进程地址空间中的内核空间,找到操作系统的代码和数据,。执行操作系统的代码,将当前进程的代码和数据剥离下来,而我们的CPU中是存在大量的寄存器,这些代码和数据就会被放入CPU的寄存器当中。此时,在换上另一个进程的代码和数据,当另一个进程代码和数据运行完毕后,此时需要运行我们刚才进程的时候,在唤醒我们刚刚放入寄存器中的进程代码和数据,继续运行刚刚的进程,如此,就完成了进程间切换。
进程收到信号之后,并不是立即处理信号,而是在合适的时候,这里所说的合适的时候实际上就是指,从内核态切换回用户态的时候。
内核态和用户态之间是进行如何切换的?
从用户态切换为内核态通常有如下几种情况:
与之相对应,从内核态切换为用户态有如下几种情况:
其中,由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时,本质上是因为我们需要执行操作系统的代码,比如系统调用函数是由操作系统实现的,我们要进行系统调用就必须先由用户态切换为内核态。
当我们在执行主控制流程的时候,可能因为中断,异常或系统调用而陷入内核,当内核处理完毕准备返回用户态时,就需要进行信号pending的检查。(此时仍处于内核态,有权力查看当前进程的pending位图)
在查看pending位图时,如果发现有未决信号,并且该信号没有被阻塞,那么此时就需要该信号进行处理。
如果待处理信号的处理动作是默认或者忽略,则执行该信号的处理动作后清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,从主控制流程中上次被中断的地方继续向下执行即可。
但如果待处理信号是自定义捕捉的,即该信号的处理动作是由用户提供的,那么处理该信号时就需要先返回用户态执行对应的自定义处理动作,执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,继续执行主控制流程的代码。
注意: sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。
简化理解如下:
该图形与直线有几个交点就代表在这期间有几次状态切换,而箭头的方向就代表着此次状态切换的方向,图形中间的圆点就代表着检查pending表。
当识别到信号的处理动作是自定义时,能直接在内核态执行用户空间的代码吗?
理论上来说是可以的,因为内核态是一种权限非常高的状态,但是绝对不能这样设计。
如果允许在内核态直接执行用户空间的代码,那么用户就可以在代码中设计一些非法操作,比如清空数据库等,虽然在用户态时没有足够的权限做到清空数据库,但是如果是在内核态时执行了这种非法代码,那么数据库就真的被清空了,因为内核态是有足够权限清空数据库的。
也就是说,不能让操作系统直接去执行用户的代码,因为操作系统无法保证用户的代码是合法代码,即操作系统不信任任何用户。
捕捉信号除了用前面用过的signal函数之外,我们还可以使用sigaction函数对信号进行捕捉,sigaction函数的函数原型如下:
int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
sigaction函数可以读取和修改与指定信号相关联的处理动作,该函数调用成功返回0,出错返回-1。
参数说明:
其中,参数act和oldact都是结构体指针变量,该结构体的定义如下:
struct sigaction {
void(*sa_handler)(int);
void(*sa_sigaction)(int, siginfo_t *, void *);
sigset_t sa_mask;
int sa_flags;
void(*sa_restorer)(void);
};
结构体的第一个成员sa_handler:
注意: 所注册的信号处理函数的返回值为void,参数为int,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然这是一个回调函数,不是被main函数调用,而是被系统所调用。
结构体的第二个成员sa_sigaction:
sa_sigaction是实时信号的处理函数。
结构体的第三个成员sa_mask:
首先需要说明的是,当某个信号的处理函数被调用,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。
如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时,自动恢复原来的信号屏蔽字。
结构体的第四个成员sa_flags:
sa_flags字段包含一些选项,这里直接将sa_flags设置为0即可。
结构体的第五个成员sa_restorer:
该参数没有使用。
#include
#include
#include
#include
using namespace std;
struct sigaction act, oact;
void handler(int signum)
{
cout << "get a signal:" << signum << endl;
sigaction(2, &oact, nullptr);
}
int main()
{
memset(&act, 0, sizeof(act));
memset(&oact, 0, sizeof(oact));
act.sa_handler = handler;
act.sa_flags = 0;
sigemptyset(&act.sa_mask);
sigaction(2, &act, &oact);
while (true)
{
cout << "I am process...." << endl;
sleep(1);
}
return 0;
}
运行代码后,第一次向进程发送2号信号,执行我们自定义的打印动作,当我们再次向进程发送2号信号,就执行该信号的默认处理动作了,即终止进程。
这个链表,初一看并没有什么问题,下面我们来具体分析一下:
这个链表有3个结点:
1.首先,main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到sighandler函数。
2. sighandler也调用insert函数向同一个链表head中插入节点node2。
3. 插入操作的两步都做完之后从sighandler返回内核态,此时链链表结构如下:
4. ,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步之后被打断,现在继续做完第二步插入node1结点:
结果是main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点node1真正插入链表中了。
像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。
如果一个函数符合以下条件之一则是不可重入的:
volatile是C语言的一个关键字,该关键字的作用是保持内存的可见性。
我们来看下面这段代码:
#include
#include
using namespace std;
int flag = 0;
void handler(int signum)
{
cout << "get a signal:" << signum << endl;
flag = 1;
}
int main()
{
signal(2, handler);
while(!flag);
cout << "process quit normal\n" << endl;
return 0;
}
我们对2号信号进行了捕捉,当该进程收到2号信号时会将全局变量flag由0置1。也就是说,在进程收到2号信号之前,该进程会一直处于死循环状态,直到收到2号信号时将flag置1才能够正常退出。
在编译代码时携带-O2选项使得编译器的发生优化级,此时再运行该代码,就算向进程发生2号信号,该进程也不会终止。
#include
#include
#include
using namespace std;
int flag = 0;
void changeFlag(int signum)
{
(void) signum;
cout << "changeFlag:" << flag;
flag = 1;
cout << "->" << flag << endl;
}
int main()
{
signal(2, changeFlag);
while(!flag);
cout << "进程正常退出后:" << flag << endl;
return 0;
}
那么这是为什么呢?
代码中的main函数和handler函数是两个独立的执行流,而while循环是在main函数当中的,在编译器编译时只能检测到在main函数中对flag变量的使用。
此时编译器检测到在main函数中并没有对flag变量做修改操作,在编译器优化的时候,就有可能将flag设置进寄存器里面。
此时main函数在检测flag时只检测寄存器里面的值,而handler执行流只是将内存中flag的值置为1了,那么此时就算进程收到2号信号也不会跳出死循环。
我们就可以使用volatile关键字对flag变量进行修饰,告知编译器,对flag变量的任何操作都必须真实的在内存中进行,即保持了内存的可见性。
#include
#include
#include
using namespace std;
volatile int flag = 0;
void changeFlag(int signum)
{
(void) signum;
cout << "changeFlag:" << flag;
flag = 1;
cout << "->" << flag << endl;
}
int main()
{
signal(2, changeFlag);
while(!flag);
cout << "进程正常退出后:" << flag << endl;
return 0;
}
运行程序,就可以发现此时就算我们编译代码时携带-O2选项,当进程收到2号信号将内存中的flag变量置1时,main函数执行流也能够检测到内存中flag变量的变化,进而跳出死循环正常退出。
进程一章讲过用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一 下,程序实现复杂。
其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。
#include
#include
#include
#include
using namespace std;
void handler(int signum)
{
cout << "子进程退出:" << signum << " 父进程:" << getpid() << endl;
}
int main()
{
signal(SIGCHLD, handler);
if(fork() == 0)
{
cout << "child pid:" << getpid() << endl;
sleep(5);
exit(0);
}
while(true)
{
sleep(1);
}
return 0;
}
运行进程,调用监控脚本我们可以发现,5秒以后子进程退出,父进程并没有对他进行回收,子进程进入僵尸状态:
此时我们更改代码,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数。
#include
#include
#include
#include
using namespace std;
int main()
{
signal(SIGCHLD, SIG_IGN);
if(fork() == 0)
{
cout << "child pid: " << getpid() << endl;
sleep(5);
exit(0);
}
while(true)
{
cout << "father: " << getpid() << " 执行我自己的任务!!" << endl;
sleep(1);
}
return 0;
}