信号—signal

linux 信号详解_第1张图片

一、信号的基本概念  

   为了理解信号,先从我们最熟悉的场景说起:

   1. 用户输入命令,在Shell下启动一个前台进程。            

   2. 用户按下Ctrl-C,这个键盘输入产生一个硬件中断。          

   3. 如果CPU当前正在执行这个进程的代码,则该进程的用户空间代码暂停   执行,CPU从用户态 切换到内核态处理硬件中断。  

   4. 终端驱动程序将Ctrl-C解释成一个SIGINT信号,记在该进程的PCB中(也   可以说发送了个SIGINT信号给该进程)。  

   5. 当某个时刻要从内核返回到该进程的用户空间代码继续执行之前,先   处理PCB中记录的信号,发现有一个SIGINT信号待处理,这个信号的默认处   理动作是终止进程,所以直接终止进程而不再返回它的用户空间代码执。    注意,Ctrl-C产生的信号只能发给前台进程一个命令后加个&可以放到后台运行,这样Shell不必等待进程结束就可以接受新的命令,启动新的进程。Shell可以同时运一个前台进程和任意多个后台进程,只有前台进程才能接到像Ctrl-C这种控制键产生的信号。前台进程在运行过程中用户随时可能按下Ctrl-C产生一个信号,也就是说该进程的用户空间代码执到任何地何都有可能收到SIGINT信号终止,所以信号相对于进程的控制流程来说是异步(Asynchronous)

 kill -l命令可以察看系统定义的信号列表:

linux 信号详解_第2张图片 

   每个信号都有一个编号和一个宏定义名称,这些宏定义可以在signal.h 中找到,例如其中有定义#define SIGINT 2编号34以上的是实时信号,在此不讨论实时信号。这些信号各自在什么条件下产生,默认的处理动作是什么,在signal(7)中都有详细说明: man 7 signal


产生信号的条件主要有: 

   1. 用户在终端按下某些键时,终端驱动程序会发送信号给前台进程,例如   Ctrl-C产生SIGINT号,Ctrl-\产生SIGQUIT信号,Ctrl-Z产生SIGTSTP信号(可使前台进暂停)。 

   2. 硬件异常产生信号,这些条件由硬件检测到并通知内核,然后内核向当前进程发送适当的信。例如当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释为SIGFPE信号发送给进程。再比如当前进程访问了非法内存地址,, MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。 

   3. 一个进程调用kill(2)函数可以发送信号给另一个进程。 可以kill(1)命令发送信号给某个进程,kill(1)命令也是调kill(2)函数实现的,如果不明确指定信号则发送SIGTERM信号,该信号的默认处理动作是终止进程。当内核检测到某种软件条件发生时也可以通过信号通知进程,例如闹钟超时产生SIGALRM信号,向读端已关闭的管道写数据时产生SIGPIPE信号。如果不想按默认动作处理信号,用户程序可以调sigaction(2)函数告诉内核如何处理某种信号 

(sigaction函数稍后详细介绍), 可选的处理动作有以下三种: 

   1. 忽略此信号。

   2. 执行该信号的默认处理动作。 

   3. 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。 


二、产生信号 

  A. 通过终端按键产信号

   上面讲过,SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump,现在我们来验证下。 

 先解释什么是Core Dump。当一个进程要异常终止时,可以选择把进程的户空间内存数据全部保存到磁盘上,文件名通常是core,这叫做Core Dump。进程异常终止通常是因为有Bug ,如非法内存访问导致段错误,事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug一个进程允许产生多少的core文件取决于进程的Resource Limit(这个信息保存 在PCB中)默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。 

ulimit命令改变Shell进程的Resource Limit,允许core文件最大(系统默认)为0 K: 

 linux 信号详解_第3张图片

 

 可以用 ulimit -c (修改大小)来改变 core file size

linux 信号详解_第4张图片

  B. 调用系统函数向进程发信号 

先在后台执行死循环程序,然后用kill命令给它发SIGSEGV信号。  linux 信号详解_第5张图片

  21936my_signal进程的id 。之所以要再次回车才显示Segmentation fault ,是因为在21936程终止掉之前已经回到了Shell提示符等待用户输入下条命令,Shell不希望Segmentation fault 信息和用户的输入交错在一起,所以等用户输入命令之后才显示

  指定某种信号的kill命令可以有多种写 法,上面的命令还可以写成kill -SIGSEGV 21936 或kill -11 21936 , 11是信号SIGSEGV的编号。以往遇 到的段错误都是由非法内存访问产生的,这个程序本身没错,给它发SIGSEGV也能产生段错误。 

  kill命令是调kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。

  raise函数可以给当前进程发送指定的信号(自己给自己发信号)。

  #include

   int kill(pid_t pid, int signo); 

   int raise(int signo);

  这两个函数都是成功返回0,错误返回-1 。

  abort函数使当前进程接收到SIGABRT信号异常终止。 

  #include

   void abort(void);

  就像exit函数一样,abort函数总是会成功的,所以没有返回值。 

 

  C. 由软件条件产生信号 

   本节主要介绍alarm函数 和SIGALRM信号。 

   #include

   unsigned int alarm(unsigned int seconds);

   调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM信号, 该信号的默认处理动作是终止当前进程。这个函数的返回值是0或者是以前设定的闹钟时间还余下 的秒数。打个比方,某人要睡觉,设定闹钟为30分钟之后响,20分钟后被吵醒了,还想多睡 会,于是重新设定闹钟为15分钟之后响,“以前设定的闹钟时间还余下的时间”就是10分钟。如果seconds值为0,表示取消以前设定的闹钟,函数的返回值仍然是以前设定的闹钟时间还余下的秒数

  程序实例:

#include
#include

int main()
{
	int i=0;
	alarm(5);
	while(1)
	{
		printf("i'm sleep:%d\n",++i);
		sleep(1);
	}
	return 0;
}

 运行结果:

linux 信号详解_第6张图片


三、阻塞信号 

   A. 信号在内核中的表示

   以上我们讨论了信号产生(Generation )的各种原因,实际执行信号的处理动作称为信号递达(Delivery ),信号从产生到递达之间的状态,称为信号未决(Pending )进程可以选择阻塞 (Block )某个信号。被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才 执行递达的动作。注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,忽略是在递达之后 可选的一种处理动作。信号在内核中的表示可以看作是这样的: 

  
linux 信号详解_第7张图片

   每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标。在上图的例子中,

   1. SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。

   2. SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。

   3. SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。 

   如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?      POSIX.1 允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,实时信号在递达之前产生多次可以依次放在一个队列。在此不讨论实时信号。

   从上图来看,每个信号只有一个bit的未决标志,0即1,不记录该信号产了多少次,阻塞标志也是这样表示。因此,未决和阻塞标志可以用相同的数据类型sigset_t 来存储,sigset_t 称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“蔽”应该理解为阻塞而不是忽略。

   B. 信号集操作函数 

   sigset_t 类型对于每种信号用一个bit表示“有效”或“无效”状态,于这个类型内部如何存储这 些bit则依赖于系统实现,从使用者的角度是不必关的,使用者只能调用以下函数来操作sigset_t 变量,不应该对它的内部数据做任何解释,如printf直接打印sigset_t 变量是没 有意义的。 

   #include

    int sigemptyset(sigset_t *set);

    int sigfillset(sigset_t *set);

    int sigaddset(sigset_t *set, int signo);

    int sigdelset(sigset_t *set, int signo);

    int sigismember(const sigset_t *set, int signo); 

   函数sigemptyset 初始化set 所指向的信号集,使其中所有信号的对应bit位清零,表示该信号集不包含任何有效信号。函数sigfillset初始化set 所指向的信号集,使其中所有信号的对应bit置位,表 该信号集的有效信号包括系统持的所有信号。

   注意,在使sigset_t 类型的变量之前,定要调sigemptysetsigfillset做初始化,使信号集处于确定的状。初始化sigset_t 变量之后就可以在调sigaddsetsigdelset在该信号集中添加或删除某种有效信号。这四个函数都是成功返回0,出错返回-1 。sigismember 是个布尔函数,用于判断个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1 。 

   C. sigprocmask 

   调用函数sigprocmask 可以读取或更改进程的信号屏蔽字(阻塞信号集)。 

   #include

   int sigprocmask(int how,const sigset_t *set,sigset_t* oset); 

   返回值:若成功则为0,若出错则为-1 

   如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则 更改进程的信号屏蔽字,参数how 指示如何更改。如果oset和set 都是非空指针,则先将原来的信号 屏蔽字备份到oset,然后根据set 和how 参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how 参数的可选值。 

   如果调sigprocmask 解除了对当前若一个未决信号的阻塞,则在sigprocmask 返回前,至少将其中一个信号递达。 

linux 信号详解_第8张图片

   D. sigpending  

   #include

    int sigpending(sigset_t *set);

   sigpending读取当前进程的未决信号集,通过set 参数传出。调成功则返回0,出错则返回-1 。下面用刚学的几个函数做个实验。

   程序如下:

#include
#include
#include

void printsigset(sigset_t *sig)
{
	int i=0;
	for(;i<32;++i)
	{
		if(sigismember(sig,i))
		    putchar('1');
		else
			putchar('0');
	}
	putchar('\n');
}

int main()
{
	sigset_t s,p;//定义信号集
	sigemptyset(&s);//初始化阻塞信号集
	sigaddset(&s,SIGINT);//将 SIGINT添加到信号集中  (位操作)
	sigprocmask(SIG_BLOCK,&s,NULL);
	while(1)
	{
		sigpending(&p);//获取未决信号集  存入p
		printsigset(& p);//打印 p
		sleep(1);
	}
	return 0;
}

   运行结果:

linux 信号详解_第9张图片 

 ps:(W)为 \  ^为 ctrl

 

   程序运行时, 每秒钟把各信号的未决状态打印一遍, 由于我们阻塞了SIGINT 信号, 按Ctrl-C将会使SIGINT信号处于未决状态,按Ctrl-\仍然可以终程序,因为SIGQUIT信号没有阻塞。 

    

三、捕捉信号 

   A. 内核如何实现信号的捕捉  

   如果信号的处理动作是用户定义函数,在信号递达时就调这个函数, 这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下:

   1.用户程序注册了SIGQUIT信号的处理函数sighandler。  

   2. 当前正在执main函数,这时发中断或异常切换到内核态。  

   3. 在中断处理完毕后要返回户态的main函数之前检查到有信号SIGQUIT递达。  

   4. 内核决定返回户态后不是恢复main函数的上下继续执,是执sighandler函数,sighandler和main函数使不同的堆栈空间,它们之间不存在调和被调的关系,是 两个独立的控制流程

   5. sighandler函数返回后动执特殊的系统调sigreturn再次进内核态。  

   6. 如果没有新的信号要递达,这次再返回户态就是恢复main函数的上下继续执了。  

   B. sigaction 

   #include

   int sigaction(int signo,const struct sigaction *act, struct 

   sigaction *oact); 

   sigaction函数可以读取和修改与指定信号相关联的处理动作。调成功则返回0,出错则返回- 1。signo指定信号的编号。若act 指针非空,则根据act 修改该信号的处理动作。

   若oact指针非空,则通过oact传出该信号原来的处理动作。actoact指向sigaction构体:

linux 信号详解_第10张图片

    将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为 常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示执行定义函数捕捉信号,或者说向内核注册了一个信号处理函 数,该函数返回值为void,可以带一个int 参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。 

    当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么 它会被阻塞到当前处理结束为止。

    如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 

    sa_flags 字段包含一些选项,本章的代码都把sa_flags设为0,  

    sa_sigaction是实时信号的处理函 数,在此不详细解释这两个字段。

   C. pause 

   #include

   int pause(void);

   pause函数使调用进程挂起直到有信号递达如果信号的处理动作是终进程,则进程终止,pause函数没有机会返回;如果信号的处理动作是忽略,则进程继续处于挂起状态,pause不返回;如果信号的处理动作是捕捉,则调用了信号处理函数之后pause返回-1 ,errno设置为EINTR,所以pause只有出错的返回值。错误码EINTR表 示“被信号中断”。 

   

   下面我们用alarm和pause实现sleep(3) 函数,称为mysleep: 

#include
#include
#include

void sig_alarm()
{
	//do nothing
}

unsigned int my_sleep(unsigned int sleeps)
{
	struct sigaction new, old;//生成捕捉信号结构体
	unsigned int unslept=0;
	new.sa_handler=sig_alarm;//将自定函数给结构体成员
	new.sa_flags=0;
	sigemptyset(&new.sa_mask);//初始化信号表
	sigaction(SIGALRM,&new,&old);//注册函数
	alarm(sleeps);//调用alarm函数
	pause();//程序挂起到 有信号递达
	alarm(0);//取消以前的闹钟
	sigaction(SIGALRM,&old,NULL);//恢复信号默认执行函数
	return unslept;
}

int main()
{
	while(1)
	{
		my_sleep(5);//休眠 5s
		printf("i'm sleep 5s\n");
	}
	return 0;
}

   运行结果:

linux 信号详解_第11张图片

解释:

 1. main函数调用mysleep函数,后者调用sigaction注册了SIGALRM信号的处理函数sig_alarm 。  

 2. 调用alarm(sleeps)设定闹钟。            

 3. 调用pause等待,内核切换到别的进程运行。            

 4. sleeps秒之后,闹钟超时,内核发SIGALRM给这个进程。      

 5. 从内核态返回这个进程的用户态之前处理未决信号,发现有SIGALRM信号,其处理函数是sig_alarm 。  

 6. 切换到用户态执行sig_alarm 函数,进入sig_alarm 函数时SIGALRM信号被自动屏蔽,从sig_alarm 函数返回时SIGALRM信号自动解除屏蔽。然后自动执系统调sigreturn再次进入内核,再返回用户态继续执行进程的主控制流程(main函数调用的mysleep函数)。  

 7. pause函数返回-1 ,然后调用alarm(0) 取消闹钟,调用sigaction恢复SIGALRM信号 以前的处理 动作。  

思考:   

 1、信号处理函数sig_alarm 什么都没有,为什么还要注册它作为SIGALRM的处理函数?不注册信号处 理函数可以吗?  (SIGALRM会终止进程?)

   解释:因为SIGALRM 信号的默认处理是结束进程  如果不重新注册函数

那么调用alarm()函数返回后会结束进程 而不是返回主函数继续循环。

 2、为什么在mysleep函数返回前要恢复SIGALRM信号原来的sigaction?  (想想不恢复会怎样?)

   解释:假设你不恢复  如果同一进程后续逻辑中需要通过alarm()退出

,而你之前将其响应函数更改了,那么会出问题。因此,改回去更严谨。

 3、my_sleep函数的返回值表示什么含义?什么情况下返回0值?

   解释:my_sleep的返回值表示闹钟的剩余时间,也是提前退出未休眠的剩余时间;

   D. 可重入函数 

   当捕捉到信号时,不论进程的主控制流程当前执到哪,都会先跳到信号处理函数中执,从信号处理函数返回后再继续执主控制流程。信号处理函数是个单独的控制流程,因为它和主控制流程是异步的,者不存在调和被调的关系,并且使不同的堆栈空间。引了信号处理函数使得个进程具有多个控制流程,如果这些控制流程访问相同的全局资源(全局变量、硬件资源等), 就有可能出现冲突,如下的例所。


如下是不可重的函数:

linux 信号详解_第12张图片

   main函数调insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的 时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换 到sighandler函数,sighandler也调insert函数向同一个链表head中插一节点node2,插入操作的 两步都做完之后从sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续 往下执行,先前做第一步之后被打断,现在继续做完第一。结果是,main函数和sighandler先后 向链表中插入两个节点,最后只有一个节点真正插入链表中了。 

    像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函 数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为 不可重入 函数,反之,如果一个函数只访问一个的局部变量或参数,则称为可重入(Reentrant) 函数

    思考,为什么两个不同的控制流程调用同一个函数,访问它的同一个局

部变量或参数就不会造成错乱?

    解释:因为 线程有独立的栈空间,因此虽然访问同一个函数 、变量,但都在单独开辟的栈空间,所以不会有影响。

    如果一个函数符合以下条件之一 则是不可重入的: 

    1.调用了mallocfree,因为malloc也是由全局链表来管理堆的

    2.调用了标准I/O 库函数。标准I/O 库的很多实现都以不可重入的形式使用全局数据结构。 

    SUS规定有些系统函数必须以线程安全的方式实现,这里不列出。

    E. sig_atomic_t类型与volatile限定符 

    在上面的例子中,mainsighandler都调用insert函数则有可能出现链表的错乱,其根本原因在 于,对全局链表的插入操作要分两步完成,不是一个原操作,假如这两步操作必定会一起做完,中间不可能被打断,就不会出现错误了。

    现在想一下,如果对全局数据的访问只有一行代码,是不是原子操作呢? 如,mainsighandler都对一个全局变量赋值,会不会出现错乱呢?如下的程序: 

linux 信号详解_第13张图片

    带调试信息编译,然后带源代码反汇编:

wKioL1csFQSxFgOxAAAj_97Fp6Q439.png

    其中main函数的指令中有: 

linux 信号详解_第14张图片

    虽然C代码只有一行,但是在32位机上对一个64位的long long变量赋值需要两条指令完成,因此 不是原子操作。同样地,读取这个变量到寄存器需要两个32位寄存器才放得下,也需要两条指令,也不是原子操作。设想一种时序,mainsighandler都对这个变量a赋值,最后变量a的值发生错乱。 

    如果上述程序在64位机上编译执,则有可能用一条指令完成赋值,因为是原操作。如果a是32位的int 变量,在32位机上赋值是原子操作,在16位机上就不是。如果在程序中需要使用一个变量, 要保证对它的读写都是原子操作, 应该采用什么类型呢? 为了解决这些平台相关的问 题,C标准定义了一个类型sig_atomic_t,在不同平台的C语眼库中取不同的类型,例如在32位机 上定义sig_atomic_tint 类型。


在使sig_atomic_t类型的变量时,还需要注意另个问题。看如下的例: 

linux 信号详解_第15张图片

为了简洁,这只写了个代码框架来说明问题。在main函数中先要注册某个信号的处理函 数sighandler,然后在个while死循环中等待信号发,如果有信号递达则执sighandler, 在sighandler中将a改为1,这样再次回到main函数时就可以退出while循环,执后续处理。上面的方法编译和反汇编这个程序,在main函数的指令中有:

linux 信号详解_第16张图片 

全局变量a从内存读到eax 寄存器,对eax 和eax 做AND运算,若结果为0则跳回循环开头,再次从 内存读变量a的值,可见这三条指令等价于C代码的while(!a);循环。如果在编译时加了优化选项,例如: 

wKioL1cu2v3A1C_BAAA_he5-UbI494.png

则main函数的指令中有: 

wKioL1cu2xngqRE9AACIDLO83yA838.png

第一条指令将全局变量a 的内存单元直接和0 较, 如果相等, 则第条指令成了个死循环, 注 意,这是个真正的死循环:即使sighandler将a改为1,只要没有影响Zero标志位,回到main函数 后仍然死在第条指令上,因为不会再次从内存读取变量a的值。 

是编译器优化得有错误吗?不是的。设想下,如果程序只有单的执流程,只要当前执流程 没有改变a的值,a的值就没有理由会变,不需要反复从内存读取,因此上的两条指令 和while(!a);循环是等价的,并且优化之后省去了每次循环读内存的操作,效率非常高。所以不能 说编译器做错了,只能说编译器法识别程序中存在多个执流程。之所以程序中存在多个执流 程,是因为调了特定平台上的特定库函数,如sigactionpthread_create,这些不是C语本 的规范,不归编译器管,程序员应该处理这些问题。C语提供了volatile 限定符,如果将 上述变量定义为volatile sig_atomic_t a=0;那么即使指定了优化选项,编译器也不会优化掉对变 量a内存单元的读写。 

对于程序中存在多个执流程访问同全局变量的情况,volatile 限定符是必要的,此外,虽然程 序只有单的执流程,但是变量属于以下情况之一的,也需要volatile 限定: 

  1. 变量的内存单元中的数据不需要写操作就可以发生变化,每次读上来的值都可能不一

  2. 即使多次向变量的内存单元中写数据,只写不读,也并不是在做无用功,是有特殊意义的。什么样的内存单元会具有这样的特性呢?肯定不是普通的内存,是映射到内存地址空间的硬件寄存器,例如串的接收寄存器属于上述第种情况,发送寄存器属于上述第种情况。

 sig_atomic_t类型的变量应该总是加上volatile 限定符,因为要使sig_atomic_t型的理由也正 是要加volatile 限定符的理由。 

四、竞态条件与sigsuspend 函数 

  现在重新审视“mysleep” 程序,设想这样的时序: 

   1. 注册SIGALRM信号的处理函数。            

   2. 调alarm(nsecs)设定闹钟。            

   3. 内核调度优先级更的进程取代当前进程执,并且优先级更的进程有很多个,每个都要 执行很长时间  

   4. nsecs秒钟之后闹钟超时了,内核发送SIGALRM信号给这个进程,处于未决状态。      

   5. 优先级更高的进程执完了,内核要调度回这个进程执。SIGALRM信号递达,执处理函 数sig_alrm 之后再次进内核。  

   6. 返回这个进程的主控制流程,alarm(nsecs)返回,调pause()挂起等待。            

   7. 可是SIGALRM信号已经处理完了,还等待什么呢?             

    出现这个问题的根本原因是系统运行的时序(Timing )并不像我们写程序时所设想的那样。

    虽然alarm(nsecs)紧接着的下面就是pause(),但是无法保证pause()定会在调alarm(nsecs)之 后的nsecs秒之内被调。由于异步事件在任何时候都有可能发生(这的异步事件指出现更优高先级的进程), 如果我们写程序时考虑不周密,就可能由于时序问题导致错误,这叫做竞态条件 ( Race Condition )。 

如何解决上述问题呢?读者可能会想到,在调pause之前屏蔽SIGALRM信号使它不能提前递达就可 以了。看看以下法可行吗? 

   1.屏蔽SIGALRM信号; 

   2.alarm(nsecs)

   3. 解除对SIGALRM信号的屏蔽; 

   4.pause()

   从解除信号屏蔽到调pause之间存在间隙,SIGALRM仍有可能在这个间隙递达。要消除这个间隙,我们把解除屏蔽移到pause后可以吗? 

   1.屏蔽SIGALRM信号;   

   2.alarm(nsecs)

   3. pause()

   4. 解除对SIGALRM信号的屏蔽; 

   这样更不了,还没有解除屏蔽就调pause,pause根本不可能等到SIGALRM信号。要是“解除信号屏蔽”和“挂起等待信号”这两步能合并成个原操作就好了,这正是sigsuspend函数的功 能。sigsuspend包含了pause的挂起等待功能,同时解决了竞态条件的问题,在对时序要求严格的场合下都应该调sigsuspend不是pause。 

   #include

   int sigsuspend(const sigset_t *sigmask); 

   和pause一样,sigsuspend没有成功返回值,只有执了个信号处理函数之后

sigsuspend才返回,返回值为-1 ,errno设置为EINTR。 

   调sigsuspend时,进程的信号屏蔽字由sigmask参数指定,可以通过指定sigmask来临时解除对某 个信号的屏蔽,然后挂起等待,当sigsuspend返回时,进程的信号屏蔽字恢复为原来的值,如果原来对该信号是屏蔽的,从sigsuspend返回后仍然是屏蔽的。 

以下sigsuspend重新实现mysleep函数: 

#include
#include
#include

void sig_alrm()//注册 SIGALRM 捕捉函数
{
	//do nothing
}

unsigned int my_sleep(unsigned int time)
{	
	unsigned int unslept=0;//my_sleep 返回值
	struct sigaction new,old;//新 旧 SIGALRM 信号执行函数
	sigset_t newmask,oldmask,suspmask;//注册信号集
	new.sa_handler=sig_alrm;//绑定 处理函数
	new.sa_flags=0;//默认行为  0
	sigemptyset(&new.sa_mask);//清空 handler 信号集
	sigemptyset(&newmask);//清空block信号集
	sigaddset(&newmask,SIGALRM);//将阻塞信号集 SIGALRM 信号 置 1
	sigaction(SIGALRM,&new,&old);//注册 处理函数 保存旧的注册
	sigprocmask(SIG_BLOCK,&newmask,&oldmask);//阻塞 SIGALRM 信号

	alarm(time);//闹钟函数
	suspmask=oldmask;//
	sigdelset(&suspmask,SIGALRM);//alarm执行后 解除 SIGALRM 阻塞
	sigsuspend(&suspmask);//执行类 pause 的sigsuspend 函数
	unslept=alarm(0);// 清空闹钟 获取返回值
	sigaction(SIGALRM,&old,NULL);//恢复 SIGALRM 默认执行函数
	sigprocmask(SIGALRM,&oldmask,NULL);//恢复信号屏蔽字
	return unslept;

}

int main(){
	int i=0;
	while(i++<5){
		my_sleep(2);
		printf("i'm sleep 2s !\n");
	}
	return 0;
}

   执行结果:

linux 信号详解_第17张图片


  如果在调mysleep函数时SIGALRM信号没有屏蔽: 

   1.调sigprocmask(SIG_BLOCK, &newmask, &oldmask); 时屏蔽SIGALRM

   2.调sigsuspend(&suspmask);时解除对SIGALRM的屏蔽,然后挂起等待待。

   3.SIGALRM递达后suspend返回,动恢复原来的屏蔽字,也就是再次屏蔽SIGALRM

   4.调sigprocmask(SIG_SETMASK, &oldmask, NULL); 时再次解除对SIGALRM屏蔽。 


 关于SIGCHLD 信号 

   waitwaitpid函数清理僵进程,进程可以阻塞等待进程结束,也可以非阻 塞地查询是否有进程结束等待清理(也就是轮询的式)。采用第一种式,进程阻塞了就不 能处理的工作了;采用第二种式,进程在处理的作的同时还要记得时不时地轮询 下,程序实现复杂。 



   其实,进程在终时会给进程发SIGCHLD信号,该信号的默认处理动作是忽略,进程可以定义SIGCHLD信号的处理函数,这样进程只需专处理的作,不必关心子进程了,子进程 终止时会通知进程,进程在信号处理函数中调wait清理进程即可。 

   编写个程序完成以下功能:进程fork出进程,进程调exit(2)终,进程定 

SIGCHLD信号的处理函数,在其中调wait获得进程的退出状态并打印。

 代码如下:

#include
#include
#include

void sig_child()//注册 SIGCHLD 捕捉函数
{
	int status=0;
	wait(&status);
	printf("child exit !  stuts:%d, code:%d\n",status&&0xFF,(status>>8)&&0xFF);
	//do nothing
}


int main(){
	
	pid_t id1,id2;
	id1=fork();
	if(id1<0)
		return;
	if(id1==0)
	{
		printf("child 1 is sleep!%d\n",(int)getpid());
		sleep(2);
		exit(2);
	}
	else{
		id2=fork();
		if(id2<0)
			return;
		if(id2==0)
		{
			printf("child 2 is sleep!%d\n",(int)getpid());
			sleep(2);
 			exit(3);
		}
		else
		{
      		int i=0;
		while(i++<10){
			signal(SIGCHLD,sig_child);
			printf("father do somthing !\n");
			sleep(1);
			}
		}
	}
	return 0;
}

运行结果:

linux 信号详解_第18张图片

linux 信号详解_第19张图片


分析:上面的程序虽然达到了目的,但是在多处理器情况下,同时又多个子进程退出并同时 向父进程发 SIGCHLD 信号,当父进程 进入 sig_child()函数处理第一个 子进程退出时,其他进程发送的 SIGCHLD信号被阻塞,因此,会无法有效的对所有子进程执行wait()函数。可能造成僵尸进程。

因此代码改为:

#include
#include
#include
#include
#include
void sig_child()//注册 SIGALRM 捕捉函数
{
	int status=0;
	if(waitpid(-1,&status,WNOHANG)>=0){
		printf("child exit !  status:%d, code:%d\n",status&&0xFF,WEXITSTATUS(status));
	}
	//do nothing
}


int main(){
	
	pid_t id1,id2;
	id1=fork();
	if(id1<0)
		return;
	if(id1==0)
	{
		printf("child 1 is sleep!%d\n",(int)getpid());
		sleep(2);
		exit(2);
	}
	else{
		id2=fork();
		if(id2<0)
			return;
		if(id2==0)
		{
			printf("child 2 is sleep!%d\n",(int)getpid());
			sleep(2);
 			exit(3);
		}
		else
		{
      		int i=0;
		while(i++<10){
			signal(SIGCHLD,sig_child);
			printf("father do somthing !\n");
			sleep(1);
			}
		}
	}
	return 0;
}

事实上,由于UNIX 的历史原因,要想不产僵进程还有另外种办法:进程调

sigactionSIGCHLD的处理动作置为SIG_IGN,这样fork出来的进程在终时会动

清理掉,不 会产僵尸进程,也不会通知进程。系统默认的忽略动作和用户sigaction函数定义的忽略 通常是没有区别的,但这是个特例。此法对于Linux可以,但不保证在其它UNIX系统上都可行。请编写程序验证这样做不会产僵进程。

代码如下: 

#include
#include
#include
#include
int main(){
	
	pid_t id1,id2;
	id1=fork();
	if(id1<0)
		return;
	if(id1==0)
	{
		printf("child 1 is sleep!%d\n",(int)getpid());
		sleep(2);
		exit(2);
	}
	else{
		id2=fork();
		if(id2<0)
			return;
		if(id2==0)
		{
			printf("child 2 is sleep!%d\n",(int)getpid());
			sleep(2);
 			exit(3);
		}
		else
		{
      		int i=0;
		while(i++<10){
			signal(SIGCHLD,SIG_IGN);
			printf("father do somthing !\n");
			sleep(1);
			}
		}
	}
	return 0;
}