这部分先对信号做一个整体的介绍,更详细的内容会在后文讲解。
通过kill -l查看全部的信号。
man 7 signal可以查看信号在什么条件下产生、默认的处理动作是什么……
上图中的信号本质是一个宏,可以如下查看某个信号对应的宏的值。
上图中有三个头文件中包含了SIGQUIT(其实也包含了全部的信号),下面随便打开一个头文件查看其中的宏(部分宏如下)。
信号收到时,不一定要立刻处理,比如当前有更重要的任务要执行,就可以先暂时搁置信号,但是要记录下这个信号需要在未来“合适”的时间处理掉,所以信号需要用一段内容来记录。
信号记录在进程的task_struct(PCB)结构体中,对于普通信号,本质是记录多个信号“是否”产生。由于只有“是”或“否”两种状态,且普通信号编号是1-31,显然用一个位图(这里用无符号整型即可)的32个比特位即可很好的管理(比特位的位置代表是否收到信号,比特位为0代表没有收到了信号,为1则代表收到了信号)。
进程收到信号,本质是位图被修改,只能通过操作系统修改进程内的信号位图(虽然可以通过命令行或代码向某个进程发送信号,但其实还通过了操作系统,所以本质还是操作系统)。
执行如下死循环代码:
#include
#include
int main()
{
while (1)
{
printf("hello signal!\n");
sleep(1);
}
return 0;
}
对于这种死循环的进程,需要从键盘输入Ctrl+C来终止,而这本身也是一种信号。
这里要注意:Shell可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接到像Ctrl+C这种控制键产生的信号。
在运行进程的命令后加&即可将进程放到后台运行,这时Shell不必等待进程结束就可以接受新的命令,启动新的进程,但是后台进程无法用Ctrl+C结束,可以用kill -3来终止。
上面的动图中,后台进程用Ctrl+C无法终止,这时要通过kill -3再加上后台进程的PID来终止。
为什么通过Ctrl+C可以终止一个进程呢?它本质还是向进程发送了一个编号为2的SIGINT信号,只不过这个信号是通过键盘输入的,然后经过操作系统处理后再发送给进程。
SIGINT原本是用来结束进程的,但用signal自定义它的功能后就可以使它对进程的效果改变。
下面的代码就通过signal函数自定义了2号信号的功能,我这里是当输入2号信号(Ctrl+C)时打印"new function!",而系统原来定义的终止进程的功能不再起作用。
#include
#include
#include
//handle函数内实现的功能是打印"new function!"
void handle(int sigNum)
{
printf("new function! sigNum:%d\n", sigNum);
}
int main()
{
signal(2, handle);//将2号信号的功能改为handle
while (1)
{
printf("a\n");
sleep(1);
}
return 0;
}
可以看到,每次按下Ctrl+C,都会打印对应内容(实现自定义的功能而不是像原来一样终止进程),而sigNum也证明Ctrl+C对应的信号值确实是2号。
但不是所有的信号都可以被自定义(捕捉)的,比如9号信号SIGKILL。
介绍两个常用的键盘输入产生的信号:Ctrl+C发送2号信号SIGINT、Ctrl+\发送3号信号SIGQUIT。(注意键盘输入的信号不止这两个,这里只是以这两个为例)
SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump。
当一个进程异常终止时,可以把进程的核心数据全部转而储存到磁盘上,文件名通常是core.PID,这一现象叫做Core Dump。
一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,泄漏会导致不安全。
如下图中所示云服务器环境中一般不允许产生core文件(core file size的值为0)。
通过ulimit -c修改core file size后,再次用Ctrl+\发送信号,可以看到进程被终止且产生了core文件。
程序异常时操作系统会向程序发送信号来终止进程,这一结果可以通过core文件来看到,下面通过用core文件进行事后调试来讲解上述过程。
进程异常终止通常是因为有Bug(比如非法内存访问导致段错误),事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug(事后调试)。
通过下面的代码(有除零错误)来大致演示通过core文件调试。
#include
#include
int main()
{
while (1)
{
sleep(1);
int a = 1 / 0;//除零错误
}
return 0;
}
运行可执行程序及后续调试如下:
可以看到core文件中包含的调试信息非常详细、精准,如果代码量极大,那么core文件会更加快速地调试。
而上面的Floating point exception报错和core中收到的8号信号SIGFPE刚好对应。
mykill.c如下,通过它产生可执行程序kill并传入命令行参数来终止其他进程。
#include
#include
#include
#include
#include
int main(int argc, char* argv[])
{
//argv[0]是执行可执行程序
//argv[1]是进程的pid
//argv[2]是发送的信号编号
//argv[3]是NULL
//argc是有效参数3
if (argc != 3)
{
printf("input error!\n");
exit(1);
}
else
{
pid_t pid = atoi(argv[1]);
int sigNo = atoi(argv[2]);
kill(pid, sigNo);
}
return 0;
}
mytest.c如下,一个简单的死循环,等待可执行程序kill发送信号将其终止。
#include
#include
#include
#include
#include
int main()
{
while (1)
{
printf("a\n");
sleep(1);
}
return 0;
}
运行test死循环后用可执行程序kill传入test的pid和信号编号来向test发送信号,注意不是使用的命令行中的kill,而是用的自己实现的可执行程序。
raise是自己给自己发送信号,与kill不同。
#include
#include
#include
#include
#include
//处理传入的信号编号
void handler(int signo)
{
printf("get a signal : %d\n", signo);
}
int main()
{
signal(2, handler);//将2号信号自定义
while (1)
{
printf("I am a process, pid : %d\n", getpid());
sleep(1);
raise(2);//该进程自己给自己发送2号信号
}
return 0;
}
可以看拿到,每次该进程自己向自己发送信号,就输出自定义后的内容。
abort使当前进程接收到信号而异常终止。
#include
#include
#include
#include
#include
void handler(int signo)
{
printf("get a signal : %d\n", signo);
}
int main()
{
signal(6, handler);
while (1)
{
printf("I am a process, pid : %d\n", getpid());
sleep(1);
abort();
}
return 0;
}
可以看到,运行到abort后收到6号信号,然后程序就终止了;
SIGPIPE就是一种因软件条件产生的信号,在【万字详解Linux系列】进程间通信(IPC) 中已经介绍过,这里不多赘述。
触发SIGALRM信号需要用到alarm函数,函数介绍如下:
函数的返回值是0或是之前设定的闹钟时间还余下的秒数。
#include
#include
#include
#include
#include
int main()
{
int count = 0;
alarm(1);//倒计时1s
while (1)
{
printf("count : %d\n", count++);//看看1s内可以将一个整型值加到多少
}
return 0;
}
可以看到1s的定时内,count被加到了17482,之后Alarm clock也说明进程收到了SIGALRM的信号。
发生硬件异常时,它被硬件以某种方式检测到并通知内核,然后内核向当前进程发送适当的信号。
例如当前进程执行了除零的指令,CPU的运算单元会产生异常,内核将这个异常解释为SIGFPE信号,并将该信号发送给进程。
再如当前进程访问了非法内存地址,MMU会产生异常,内核将这个异常解释为SIGSEGV信号,并将该信号发送给进程。
注意:阻塞和忽略是不同的,阻塞本质是不让信号递达(直到解除阻塞),而忽略本质是递达(处理信号)的一种方式。
如上,每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。
信号产生时,内核在进程控制块中设置该信号的未决标志(pending),直到信号递达才清除该标志。之后如果被阻塞,则直到阻塞结束才处理,否则直接调用handler内的方法处理该信号。
在上图的例子中:
注意:在Linux下如果常规信号在递达之前产生多次则只记最后一次,而实时信号在递达之前产生多次可以依次放在一个队列里。但本篇暂不讨论实时信号。
从上图来看,每个信号只有一个比特位的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志同理。
因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有 效”和“无效”的含义是该信号是否处于未决状态。
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些比特位则是与操作系统有关的(所以不能冒然用按位与、按位或来拿到信号,因为操作系统底层不一定是这么实现的)。
从使用者的角度是不必关心的,使用者只能调用下面介绍的函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t,这是毫无意义的。
常用的信号集操作函数有如下五个,各自的大致用法已注释在其后。
#include //头文件
int sigemptyset(sigset_t *set);//初始化set所指向的信号集,使其中所有信号的比特位清零,表示该信号集不包含任何有效信号
int sigfillset(sigset_t *set);//初始化set所指向的信号集,使其中所有信号的对应比特位置为1,表示该信号集的有效信号包括系统支持的所有信号
int sigaddset (sigset_t *set, int signo);//向信号集set中添加编号为signo的信号
int sigdelset(sigset_t *set, int signo);//从信号集set中删除编号为signo的信号
int sigismember(const sigset_t *set, int signo);//判断编号为signo的信号是否在信号集set中
这四个函数都是成功返回0、出错返回-1。sigismember用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。
注意,上面五个函数都是系统级别的函数,它们在使用时并不会影响进程的任何信息(不会修改进程的PCB)。
调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集,即上面的block表)。
how有三个选项(下面的式子中假设mask是当前的信号屏蔽字,且这些式子只是帮助理解,不能实际写在代码中)
set就是传入一个信号集,然后根据how的选项来进行操作。
oset是输出型参数,传入NULL时不做处理,如果传入非空则将原来的信号屏蔽字返回至oset,也就是拿到了修改之前的信号屏蔽字。
三个参数的功能整理如下:
这个函数非常简单,就是获取当前进程的pending位图。
下面的代码的大致功能是首先阻塞2号信号SIGINT,然后不断打印pending表(这时应该是全0),当向该进程发送2号信号后会观察到pending表第二位变为1(被阻塞而无法递达)。
#include
#include
#include
void printPending(sigset_t *pending)
{
//依次打印31个信号
int i = 1;
for (i = 1; i <= 31; i++)
{
//用sigismember判断第i个信号是否存在于pending表中
if (sigismember(pending, i))
printf("1");//存在打印1
else
printf("0");//不存在打印0
}
printf("\n");
}
int main()
{
sigset_t set, oset;
//初始化
sigemptyset(&set);
sigemptyset(&oset);
sigaddset(&set, 2);//将2号信号加入set信号集
sigprocmask(SIG_SETMASK, &set, &oset);//将2号信号加入信号屏蔽字,并将原来的信号集返回至oset
sigset_t pending;//保存pending表
while (1)
{
sigemptyset(&pending);//初始化
sigpending(&pending);//拿到pending表
printPending(&pending);//打印pending表
sleep(1);//每隔一秒打印一次
}
return 0;
}
运行如下:
最后通过Ctrl+\发送信号终止进程成功了,因为这个信号没有被阻塞;但由于Ctrl+C发送的信号被阻塞,所以无法终止进程。
对上面的程序略加修改,使2号信号在阻塞5s后递达给进程,结果是终止进程。
#include
#include
#include
void printPending(sigset_t *pending)
{
//依次打印31个信号
int i = 1;
for (i = 1; i <= 31; i++)
{
//用sigismember判断第i个信号是否存在于pending表中
if (sigismember(pending, i))
printf("1");//存在打印1
else
printf("0");//不存在打印0
}
printf("\n");
}
int main()
{
sigset_t set, oset;
//初始化
sigemptyset(&set);
sigemptyset(&oset);
sigaddset(&set, 2);//将2号信号加入set信号集
sigprocmask(SIG_SETMASK, &set, &oset);//将2号信号加入信号屏蔽字,并将原来的信号集返回至oset
sigset_t pending;//保存pending表
int count = 0;
while (1)
{
sigemptyset(&pending);//初始化
sigpending(&pending);//拿到pending表
printPending(&pending);//打印pending表
sleep(1);
count++;
if (count >= 5)//5秒后解除阻塞
{
//恢复刚开始的信号屏蔽字(2号信号被解除阻塞)
sigprocmask(SIG_SETMASK, &oset, NULL);
//恢复信号屏蔽字后,2号信号不再被阻塞,而是递达给进程
//于是进程被终止
}
}
return 0;
}
现象如下,打印两次后向进程发送2号信号SIGINT,又打印三次后解除阻塞,信号递达,进程终止。
进程收到信号后不是立即对其进行处理的,而是在“合适”的时候,这个“合适”的时候指的是从内核态切换回用户态时。那么什么是内核态和用户态,下面进行介绍。
内核态通常执行OS的代码,是一种权限非常高的状态。用户态通常执行普通用户的代码,是一种受监管的普通状态。
了解了上面的相关知识后,就不难理解下面信号处理的完整过程了,具体见下图。
如果忽略收到的信号或是按照默认处理动作处理时,整个过程比较简单(因为没有设计到多次设计状态的切换),而处理自定义的动作叫做信号捕捉,下面讲到的就是信号捕捉。
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。
运行下面的代码:
#include
#include
#include
#include
struct sigaction act, oact;//两个传入sigaction的结构体
void handler(int signo)
{
printf("get a signal : %d\n", signo);
sigaction(SIGINT, &oact, NULL);//将SIGINT的处理动作改为最开始的(系统默认的)
}
int main()
{
//初始化
memset(&act, 0, sizeof(act));
memset(&oact, 0, sizeof(oact));
act.sa_handler = handler;//捕捉信号
act.sa_flags = 0;
sigemptyset(&act.sa_mask);//初始化
sigaction(SIGINT, &act, &oact);//传入act修改SIGINT的处理动作
while (1)
{
printf("hello world!\n");
sleep(1);
}
return 0;
}
这是一个C语言的关键字,但是仅从语言的层面较难理解,所以在这里介绍操作系统的相关概念时来介绍这个关键字。
下面这段代码预计会在不收到信号时会一直死循环,如果收到2号信号则终止进程并打印内容。
#include
#include
#include
#include
int flag = 0;
void handler(int signo)
{
printf("get a signal : %d\n", signo);
flag = 1;//修改flag
}
int main()
{
signal(2, handler);//自定义2号信号
while (!flag);//只要没有收到信号,flag就一直为0,就一直死循环
printf("quit!\n");
return 0;
}
可以看到,运行可执行程序后,一开始是死循环,收到信号后打印了两段内容。
将gcc中的选项添加-O3,这会很大程度地优化代码。
可以看到,多次向进程发送2号信号结果是打印了内容,但进程并没有正常退出。
这是预料之外的结果,原因是编译时优化程度太高,为flag在寄存器中开辟了空间,main函数读取时优先从寄存器读取,而handler函数中对flag的修改是在内存层面的,但main函数中读取一直从寄存器中读取,所以虽然内存中的flag已经设为1,但main函数从寄存器中读取到的flag一直是0,导致在while判断时一直为真、死循环。
在定义flag时将其定义为volatile变量就可以避免上述情况。
#include
#include
#include
#include
volatile int flag = 0;//在定义前加上volatile
void handler(int signo)
{
printf("get a signal : %d\n", signo);
flag = 1;//修改flag
}
int main()
{
signal(2, handler);//自定义2号信号
while (!flag);//只要没有收到信号,flag就一直为0,就一直死循环
printf("quit!\n");
return 0;
}
可以看到,即使是编译时优化,但结果仍和优化之前一样。这也是volatile的作用:保持内存的可见性,告知编译器,被该关键字修饰的变量不允许被优化,对该变量的任何操作都必须在真实的内存中进行操作。