《Linux学习笔记》——进程信号

文章目录

  • 什么是Linux信号?
  • 信号产生
    • 通过终端按键产生信号
    • 调用系统函数向进程发信号
    • 由软件条件产生信号
    • 硬件异常产生信号
    • 信号捕捉初识
    • 小结
  • 信号保存
    • 信号其他相关常见概念
    • 信号在内核中的表示示意图
    • sigset_t信号集
    • 信号集操作函数
    • sigprocmask
    • sigpending
  • 信号处理
    • 在什么时候处理信号?
    • 捕捉信号的原理
    • 信号的操作
    • volatile关键字
    • SIGCHLD信号

什么是Linux信号?

信号的概念

    生活中的信号有红绿灯、闹钟、狼烟等,为什么人类能识别这些信号呢?是因为我们记住了对应场景下的信号和后续应该做的动作,也就是识别了这个信号。在我们的大脑中能识别信号,且即使无法理解处理的时候,也一定会被临时记住。

    Linux信号本质上是一种异步通知机制,用户或操作系统通过发送一定的信号,来通知进程某些事件已经发生,该进程可以后续进行处理。

《Linux学习笔记》——进程信号_第1张图片

    进程要处理信号,必须具备识别信号的能力,包含看到信号和处理动作。 进程能识别信号是程序员设定的,而且信号的产生是随机的,进程可能正在忙自己的事情,所以信号的后续处理,可能不是立即处理的。信号会临时记录对应的信号,方便后续处理。一般而言,信号的产生相对于进程而言是异步的。


信号如何产生

    用户输入命令,在Shell下启动一个前台进程,用户按下Ctrl-C ,这个键盘输入产生一个硬件中断,被OS获取,解释成2号信号,发送给目标前台进程,前台进程因为收到信号,进而引起进程退出。

    假设你的快递到了,快递员就像操作系统一样给进程发信号,快递员则打电话给你说你快递到了,然后我自己说等下下去取。就像使用键盘敲出ctrl+c一样给操作系统,然后操作系统发送信号给进程,进程然后终止。


信号处理常见方式

  1. 执行该信号的默认处理动作(进程自带的,程序员写好的逻辑)。
  2. 忽略此信号(也是信号处理的一种方式)。
  3. 自定义动作也称为捕捉信号,提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数。

常见信号

    用kill -l命令可以察看系统定义的信号列表。1 ~ 31信号被叫为普通信号,34 ~ 64信号被称为实时信号。每个信号都有一个编号和一个宏定义名称,这些宏定义可以在signal.h中找到,例如其中有定义 #defineSIGINT 2。这些信号各自在什么条件下产生,默认的处理动作是什么,在signal(7)中都有详细说明: man 7 signal

《Linux学习笔记》——进程信号_第2张图片


信号发送的本质

    用户按下Ctrl-C ,键盘输入产生一个硬件中断,被OS获取,解释成2号信号。2号信号为SIGINT,默认处理动作是终止进程,3号信号为SIGQUIT的默认处理动作是终止进程并且Core Dump。

    进程PCB内部必须有保存信号的相关数据结构,使用unsigned int位图的结构来保存信号。信号位图在task_struct内核数据结构中保存,只有操作系统有这个资格修改PCB的内部字段,信号发送的本质是OS向目标进程写信号,就是OS直接修改PCB中的指定位图结构,完成发送信号的过程。 当用户按下Ctrl-C的时候,OS解释组合键并查找进程列表,将对应的信号写入到进程内部的位图结构中。


信号产生

通过终端按键产生信号

    获取子进程status,wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充.如果传递NULL,表示不关心子进程的退出状态信息。否则操作系统会根据该参数,将子进程的退出信息反馈给父进程。status不能简单的当作整形来看待,可以当作位图来看待,要按照比特位划分,最低的7个比特位表示进程接受到的信号,次低8位表示进程退出的退出码。具体细节如下图(只研究status低16比特位):
《Linux学习笔记》——进程信号_第3张图片


Core Dump

   首先解释什么是Core Dump。当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部 保存到磁盘上,文件名通常是core,这叫做Core Dump。进程异常终止通常是因为有Bug,比如非法内存访问导致段错误,事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug(事后调试)。一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存 在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024K: $ ulimit -c 1024。ulimit命令改变了Shell进程的Resource Limit,test进程的PCB由Shell进程复制而来,所以也具有和Shell进程相同的Resource Limit值,这样就可以产生Core Dump了。

调用系统函数向进程发信号

    可以使用kill命令给它发SIGSEGV信号杀死一个死循环进程。kill命令是调用系统接口的kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。raise函数可以给当前进程发送指定的信号(自己给自己发信号)。abort函数使当前进程接收到信号而异常终止,属于6号信号。

#include 
int kill(pid_t pid, int signo);
int raise(int signo);

《Linux学习笔记》——进程信号_第4张图片
《Linux学习笔记》——进程信号_第5张图片

#include 
void abort(void);
就像exit函数一样,abort函数总是会成功的,所以没有返回值。

《Linux学习笔记》——进程信号_第6张图片


如何理解用户调用系统接口,执行OS对应的系统调用代码?

    OS首先会提取参数或者设置特别的数值,并向目标进程写信号,修改对应进程的信号标记为,进程后续会处理信号,执行对应的处理动作。


由软件条件产生信号

    在使用管道进行进程间通信的时候,管道读端关闭,而写端一直写入,OS会通过发送SIGPIPE信号的方式自动终止对应的写端进程。软件条件给进程
发送信号就是OS显示别到某种软件条件触发或者不满足条件,OS再构建信号发送给指定的进程。举例:alarm函数 和SIGALRM信号。

《Linux学习笔记》——进程信号_第7张图片
《Linux学习笔记》——进程信号_第8张图片

#include 
unsigned int alarm(unsigned int seconds);
调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM信号, 该信号的默认处理动作是终止当前进程。

   这个函数的返回值是0或者是以前设定的闹钟时间还余下的秒数。打个比方,某人要小睡一觉,设定闹钟为30分钟之后响,20分钟后被人吵醒了,还想多睡一会儿,于是重新设定闹钟为15分钟之后响,“以前设定的闹钟时间还余下的时间”就是10分钟。如果seconds值为0,表示取消以前设定的闹钟,函数的返回值仍然是以前设定的闹钟时间还余下的秒数。

 1	#include<iostream>
 2	#include<stdlib.h>
 3	#include<signal.h>
 4	#include<unistd.h>
 5	
 6	int main(int argc,char* argv[])
 7	{
 8	    int count=0;
 9	    alarm(1);
10	    while(1)
11	    {
12	        std::cout<<"count:"<<count++<<std::endl;
13	    }
14	    return 0;
15	}

结果为:
《Linux学习笔记》——进程信号_第9张图片

由图知道1S中count打印了2W次左右,这个程序的作用是1秒钟之内不停地数数,1秒钟到了就被SIGALRM信号终止。为啥打印出来只有2W?

换种代码试下

 1	#include<iostream>
 2	#include<stdlib.h>
 3	#include<signal.h>
 4	#include<unistd.h>
 5	int count=0;
 6	void handler(int signo)
 7	{
 8	    std::cout<<"count:"<<count<<std::endl;
 9	    exit(1);
10	}
11	int main(int argc,char* argv[])
12	{
13	    signal(14,handler);
14	    alarm(1);
15	    while(1)
16	    {
17	        count++;
18	    }
19	    return 0;
20	}

这里的结果变成了4亿!因为上面改的程序不往IO上面去输出,往IO上输出会影响效率


硬件异常产生信号

   硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。

   例如当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释为SIGFPE信号发送给进程。

   再例如当前进程访问了非法内存地址,该地址为虚拟地址,通过页表和MMU(Memory Manager Unit,是硬件)转化为物理地址,MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。


信号捕捉初识

1	#include<iostream>
2	#include<signal.h>
3	void handler(int signo)
4	{
5	    std::cout<<"catch a signal:"<<signo<<std::endl;
6	}
7	int main()
8	{
9	    signal(2,handler);//捕捉2号信号
10	    while(1);
11	    return 0;
12	}

此代码会在用户使用Ctrl+C的时候,打印2,因为2号信号捕捉了,此时终止不了进程。handler捕捉不了9号信号。


小结

  • 上面所说的所有信号产生,最终都要有OS来进行执行,因为OS是进程的管理者。
  • 信号的处理不是立即处理的,而是在在合适的时候。信号如果不是被立即处理,那么信号需要暂时被进程记录下来,记录在PCB对应的位图结构。
  • 一个进程在没有收到信号的时候,能知道自己应该对合法信号作何处理。 OS向进程发送信号就是OS修改位图。

信号保存

信号其他相关常见概念

  • 实际执行信号的处理动作称为信号递达(Delivery)
  • 信号从产生到递达之间的状态,称为信号未决(Pending)。
  • 进程可以选择阻塞 (Block )某个信号。被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作。
  • 阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。
    《Linux学习笔记》——进程信号_第10张图片

信号在内核中的表示示意图

《Linux学习笔记》——进程信号_第11张图片
   每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。block位图,结构和pending一模一样,只是位图中的内容,代表含义是对应信号是否被阻塞。handler是一个函数指针数组,数组的下标就是信号的编号。SIG_DFL和SIG_IGN信号编号分别对应宏定义0和1,当handler[signal]为0,则执行对应的动作handler[signal](),为1则表示忽略动作。


信号被处理的处理过程

   OS发送信号,更改pending位图。pending收到信号后,进行block检测。如果是被block的,则直接终止,否则继续进行hanlder对应的处理方法。


sigset_t信号集

   每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t位图数据类型来表示,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。 sigset_t不允许用户进行位操作,OS给用户提供了对应的操作位图的方法。用户可以直接使用 sigset_t类型,跟内置类型没有任何差别。 sigset_t一定需要对应的系统接口,来完成对应的功能,其中系统所需要的系统接口,可能就包含了 sigset_t定义的变量或者对象。


信号集操作函数

   sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释。

#include 
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);

   函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置为1,表示该信号集的有效信号包括系统支持的所有信号。

   在使用sigset_ t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。

   初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。

   这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。


sigprocmask

   函数sigprocmask可以读取或更改进程的信号屏蔽字/阻塞信号集。
《Linux学习笔记》——进程信号_第12张图片

#include 
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
返回值:若成功则为0,若出错则为-1

   如果oset是非空指针,则将老的进程信号屏蔽字通过oset参数传出,属于输出型参数。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。

   假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。

《Linux学习笔记》——进程信号_第13张图片


sigpending

   sigpending函数用来读取当前进程的未决信号集,通过set参数传出。调用成功则返回0,出错则返回-1。
《Linux学习笔记》——进程信号_第14张图片

#include 
sigpending

《Linux学习笔记》——进程信号_第15张图片
   程序运行时,每秒钟把各信号的未决状态打印一遍,由于我们阻塞了SIGINT信号,按Ctrl-C将会 使SIGINT信号处于未决状态,按Ctrl - \仍然可以终止程序,因为SIGQUIT信号没有阻塞。

   如果对所有信号进行了自定义捕捉或者进行block,那不就是写了一个不会被用户杀死的进程吗,OS也想到了这个问题,所以9号信号属于管理员信号,无法自定义捕捉动作;9号信号也不可被屏蔽。


信号处理

在什么时候处理信号?

   信号相关的数据字段都是在进程的PCB内部,属于内核范畴,那么处理信号一定处于内核状态。进行系统调用或缺陷、异常等情况,也会从用户体态进入内核态,从内核态返回用户态的时候,进行信号检测和处理《Linux学习笔记》——进程信号_第16张图片
   用户态是一个受管控的状态,内核态是一个操作系统执行自己代码的状态,具有非常高的优先级。在进程地址空间中3~4G的空间属于内核地址空间,且每个进程都有自己的内核地址空间,但是OS只有一个份,所以在进程地址空间和物理内存之间存在着内核级页表,可以被所有进程看到。用户有没有权力执行OS的代码就是凭借用户是内核态还是用户态,cpu中的寄存器有两套,一套可见,一套自用,其中CR3寄存器表示当前CPU的执行权限,1表示内核态,3表示用户态。假设执行open系统调用接口的时候,open内部封装了汇编代码int80,此代码可以从汇编的角度切换CPU的执行权限。


捕捉信号的原理

   如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,

举例如下: 用户程序注册了SIGQUIT信号的处理函数sighandler。 当前正在执行
main函数,这时发生中断/异常/系统调用函数切换到内核态。 在内核处理完毕后要返回用户态的main函数之前先检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函数(内核其实可以直接执行sighandler函数,但是OS不相信任何人,不能使用内核态来执行用户的代码),sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。
《Linux学习笔记》——进程信号_第17张图片

《Linux学习笔记》——进程信号_第18张图片


信号的操作

#include 
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);

   sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回-1。signo是指定信号的编号。act是输入型参数,若act指针非空则根据act修改该信号的处理动作。oact为输出型参数,若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体:

《Linux学习笔记》——进程信号_第19张图片


如果在处理信号执行自定义动作的时候,又来了同样的信号,OS如何处理?

   当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。


volatile关键字

  标准情况下,键入 CTRL-C ,2号信号被捕捉,执行自定义动作,修改 flag=1,while 条件不满足,退出循环,进程退出。

#include 
#include 
int flag = 0;
void handler(int sig)
{
	printf("chage flag 0 to 1\n");
	flag = 1;
}
int main()
{
	signal(2, handler);
	while(!flag);
	printf("process quit normal\n");
	return 0;
}

  优化情况下,键入 CTRL-C ,2号信号被捕捉,执行自定义动作,修改 flag=1 ,但是 while 条件依旧满足,进程继续运行!但是很明显flag肯定已经被修改了,但是为何循环依旧执行?很明显, while 循环检查的flag,并不是内存中最新的flag,这就存在了数据二异性的问题。 while 检测的flag其实已经因为优化,被放在了CPU寄存器当中。

  这时就需要volatile关键字,volatile关键字禁止编译器对该语句做出优化。就比如定义一个全局变量,此时如果优化的话,则这个值会被存到寄存器中,此时你如果对该全局变量进行修改的话,只是对内存中的数据进行修改,寄存器的值是不变的。

   volatile关键字禁止将我这个值优化到寄存器中,保持内存的可见性,告知编译器,被该关键字修饰的变量,不允许被优化,对该变量的任何操作,都必须在真实的内存中进行操作

volatile int flag = 0;

SIGCHLD信号

   wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一 下,程序实现复杂。其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。

你可能感兴趣的:(linux,c++,C,进程,信号)