进程之间事件异步通知的一种方式。它是一种软件中断,用于向进程发送通知和指令,以便对其进行控制或传递信息。进程信号由整数值来标识,每个值对应一个特定的信号。不同的信号对应不同的状况。
信号的生命过程分为三个阶段:
进程信号有许多个,操作系统为了管理进程接收的信号,需要使用一定的结构描述信号,操作系统采用了位图结构来记录不同的信号,该位图结构记录在进程的pcb中,当操作系统向进程发送信号时,就向进程pcb中描述信号的位图结构写入数据。
使用kill-l
可以查看Linux系统定义的信号列表:
使用man 7 signal
可以查看Linux系统定义的信号详细说明:
在Linux系统中输入crtl + c可以给进程发送2号信号,2号信号默认的处理动作是终止进程。给进程发送2号信号的示例如下:
Linux系统中提供了kill -信号数 进程pid
指令用于向指定进程发送信号:
kill接口
Linux系统中提供了kill
系统调用用于向指定进程发送信号:
//kill所在的头文件和声明
#include
#include
int kill(pid_t pid, int sig);
raise接口
Linux系统中提供了raise
系统调用用于向进程自身发送信号:
//raise所在的头文件和声明
#include
int raise(int sig);
abort接口
Linux系统下C语言库中提供了abort
库函数用于向进程自身发送信号 SIGABRT
:
//abort所在的头文件和声明
#include
void abort(void);
abort
是C语言库中提供的接口。abort
向调用进程自身发送6号信号 SIGABRT
。Linux系统了调用alarm
函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM
信号, 该信号的默认处理动作是终止当前进程。
//alarm所在的头文件和声明
#include
unsigned int alarm(unsigned int seconds);
alarm
函数操作系统会创建闹钟并建立对应数据结构组织起来。硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。例如当前进程执行了除 以0的指令,CPU的运算单元会产生异常,内核将这个异常解释 为SIGFPE
信号发送给进程。再比如当前进程访问了非法内存地址,MMU会产生异常,内核将这个异常解释为SIGSEGV
信号发送给进程。
Linux操作系统可以在进程异常时,将核心代码部分和相关的内存数据全部导出到磁盘外设中,这一功能被称作核心转储。
不同的进程异常情况,进程会收到不同的进程信号,使用man 7 signal
指令查看进程信号的信息,其中Action列中为Core的信号发送给进程后,进程就会进行核心转储。
查看核心转储信息
使用ulimit -a
指令可以查看到系统核心转储文件的信息:
云服务中默认设定核心转储文件的大小上限为0,也就是不进行核心转储。
修改核心转储信息
使用ulimit -c
指令可以修改核心转储文件的大小上限:
核心转储文件的主要作用是当程序发生崩溃或异常终止时,通过分析核心转储文件,可以了解程序崩溃的原因、定位错误的位置以及查找潜在的缺陷。
运行一个进程用于,然后给它发送8号信号,让他产生核心转储文件:
使用gdb调试可执行程序,然后使用core-file
指令打开核心转储文件,就能从调试中看到进程异常原因:
如果某一进程产生异常生成了核心转储文件,Linux系统下进程使用系统接口等待回收该进程,获得的退出信息中倒数第八位会被置为1:
也就是core dump
标志被置为1。
信号在内核中的表示示意图如下:
操作系统在内核数据结构task_struct
中为信号维护了三张表:
每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。 因此,未决和阻塞标志可以用相同的数据类型sigset_t
来存储,sigset_t
称为信号集。
sigset_t
类型可以表示每个信号 的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有 效”和“无效”的含义是该信号是否处于未决状态。
sigeset_t
类型的底层实现也是一种位图结构。
sigset_t
类型对于每种信号用一个bit表示“有效”或“无效”状态,这个类型内部如何存储这些bit则依赖于系统实现,用户不需要关心具体实现,只要能够按需求操作信号集即可,因此Linux系统提供了如下函数来操作信号集:
//信号集操作函数所在的头文件及函数声明
#include
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);
函数sigemptyset
初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
函数sigfillset
初始化set所指向的信号集,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号。
注意,在使用sigset_ t
类型的变量之前,一定要调 用sigemptyset
或sigfillset
做初始化,使信号集处于确定的状态。
初始化sigset_t
变量之后就可以在调用sigaddset
和sigdelset
在该信号集中添加或删除某种有效信号。
前四个函数都是成功返回0,出错返回-1。
sigismember
是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。
调用函数sigprocmask
可以读取或更改进程的信号屏蔽字(阻塞信号集–block表)。
//sigprocmask所在的头文件及函数声明
#include
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
假设当前的信号屏蔽字为mask,下表说明了how参数的可选值:
SIG_BLOCK | set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask|set |
---|---|
SIG_UNBLOCK | set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask&~set |
SIG_SETMASK | 设置当前信号屏蔽字为set所指向的值,相当于mask=set |
调用函数sigpending
可以读取当前进程的未决信号集,通过set参数传出:
//sigpending所在的头文件及函数声明
#include
int sigpending(sigset_t *set);
Linux系统中进程地址空间分为两个部分,一个部分是用户空间,另一个部分是内核空间,两个部分都有自身对应的页表,一个是用户级页表,另一个是内核级页表,操作系统计算机开机时会将自身的代码和数据加载到内存中,这部分代码和数据通过同一张内核级页表映射到每个进程的地址空间中的内核部分,示意图如下:
由于操作系统的代码和数据通过同一张内核级页表映射到每个进程的地址空间中的内核部分,因此在进程运行时,只需要像跳转到动态库一样,跳转到操作系统的代码和数据,使得进程代码和操作系统代码的切换可以在一张进程地址空间中跳转完成,但操作系统为了不让用户通过进程地址空间中的内核部分的随意访问操作系统的代码和数据,操作系统设置了两种状态:**用户态和内核态,当处于用户态时,进程只能访问用户进程的代码和数据,当处于内核态时,进程只能访问操作系统的代码和数据。**为了记录当前处于用户态还是内核态,将标志信息记录在CPU的寄存器中。
小总结一下:
当进程从内核态切换回用户态的时候(信号记录在内核中,只能在内核态访问),进程会在操作系统的指导下,进程信号的检测和处理。
用户态切换至内核态的情况如下:
补充说明: 计算机存在一个计时器硬件,当计时器记录进程运行到一定时间后,操作系统会执行对应的中断方法,检查时间片,如果时间片到了就会调用操作系统中的调度函数,完成进程的切换。
在进程运行执行对应代码时,遇到需要切换至内核态的情况,产生中断跳转至内核态,进入内核态后完成对应中断处理后,开始检测信号,进行,执行信号对应的处理动作,若是默认处理或者忽略处理后就会直接进入用户态跳转回用户态中断前代码,如果是自定义处理动作,会进入用户态跳转执行对应的自定义处理动作,然后调用sigreturn
回到内核态,再调用sys_sigreturn
进入用户天跳转回用户态中断前代码。执行自定义处理动作的过程示意图如下:
调用函数signal
可以将对应信号的处理动作改为自定义处理动作:
//signal所在的头文件及函数声明
#include
typedef void (*sighandler_t)(int);
sighandler_t signal(int signum, sighandler_t handler);
SIG_DFL
为默认处理动作,SIG_IGN
为忽略动作。SIG_ERR
。SIGKILL
和 SIGSTOP
信号不能被修改为自定义处理动作。编写如下代码进行测试:
#include
#include
#include
using namespace std;
void handler(int signo)
{
cout << "get the signal: " << signo << endl;
}
int main()
{
signal(SIGINT, handler);
while(true)
{
cout << "i am running, pid: " << getpid() << endl;
sleep(1);
}
return 0;
}
编译代码运行查看结果:
sigaction
函数可以读取和修改与指定信号相关联的处理动作。
//sigaction所在的头文件及函数声明
#include
int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
sigaction
函数需要使用struct sigaction
数据类型作为参数,其结构定义如下:
struct sigaction {
void (*sa_handler)(int);
void (*sa_sigaction)(int, siginfo_t *, void *);
sigset_t sa_mask;
int sa_flags;
void (*sa_restorer)(void);
};
其主要字段如下:
sigaction
函数使用结构体作为参数修改信号处理动作,相比signal
功能更为强大。
在C语言中,volatile
是一个关键字,用于告诉编译器某个变量是易变的(volatile)并且不应该进行优化。
为了体会volatile
关键字的作用,创建如下文件及文件内容:
makefile:
mysignal:mysignal.cc
g++ -o $@ $^ -std=c++11 -O2//注意此处采用O2优化级别
.PHONY:clean
clean:
rm -rf mysignal
mysignal.cc:
#include
#include
using namespace std;
int quit = 0;
void handler(int signo)
{
cout << "get the signal: " << signo << endl;
quit = 1;
cout << "quit: " << quit << endl;
}
int main()
{
signal(2, handler);
while(!quit);
cout << "process quit" << endl;
return 0;
}
编译代码并查看运行结果:
从现象中可以看出,在键盘中输入ctrl+c
传入二号信号后,执行了自定义的处理动作quit改为了1,但是循环依旧继续,程序并未终止。这是因为编译器的优化,在无优化的情况下,从汇编来看应该是在每次循环时将quit数据从内存加载到CPU寄存器中进行判断,但是由于main函数中没有quit修改的代码,编译器以为quit不会修改,直接将汇编优化成了只从内存中加载一次quit,然后只进行判断,信号处理后修改的是内存的数据,因此不会使得循环停止。
使用volatile
关键字修改代码:
#include
#include
using namespace std;
volatile int quit = 0;
void handler(int signo)
{
cout << "get the signal: " << signo << endl;
quit = 1;
cout << "quit: " << quit << endl;
}
int main()
{
signal(2, handler);
while(!quit);
cout << "process quit" << endl;
return 0;
}
编译代码并查看运行结果:
volatile
关键字让quit不再优化,每次判断都从内存加载quit到CPU中,因此现象如上图。
子进程在终止时会给父进程发SIGCHLD
信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD
信号 的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可,具体自定义代码如下:
void handler(int signo)
{
while(true)
{
pid_t id = waitpid(-1, NULL, WNOHANG);
if (id > 0) printf("waitpid: %d, my pid: %d\n", id, getpid());
else break;
}
}
说明:
waitpid
传入-1让其接收任意一个僵尸状态的子进程。waitpid
是为了解决如果一个进程回收时,其他进程进入僵尸状态。WNOHANG
非阻塞是为了解决暂时没有子进程需要回收,进入阻塞状态。除了以上自定义处理外,Linux系统还提供了另一种方法解决僵尸状态的子进程:父进程调用sigaction
将SIGCHLD
的处理动作置为SIG_IGN
,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。(此方法对于Linux可用,但不保证在其它UNIX系统上都可用。)