目录
一.理解信号的前提知识
1.人对于信号的反应
2.信号产生的生命周期,人对应进程
3.通过一段代码理解信号
4.信号的发送与记录
5.信号处理常见方式概述
6.补充
二.信号的产生
1.通过终端按键产生信号
2.通过系统函数向进程发送信号
3.由软件条件产生的信号
4.由硬件异常产生信号
三.阻塞信号
1.信号其他相关概念
2.在内核中的表示
3.sigset_t
4.信号集操作函数
5.sigprocmask
6.sigpending
7.代码测试,使用函数
四.信号的捕捉
1.内核态和用户态
2.内核空间与用户空间
3.内核如何实现信号的捕捉
4.sigaction
五.可重入函数
六.站在OS角度理解volatile
七.SIGCHLD
(1)信号产生前 (信号可以理解为事件)
信号还没有产生的时候,对于普通的人来讲,我们是知道信号产生之后,应该怎么做的!
①信号的到来我们要先识别出来,为何能识别 ?
有人曾经给我们对于这样的信号有 “教育” (将信号特征,如何识别,及其对应的处理过程记住了
) 过程.
②信号还没有产生的时候
(2)信号产生中
信号产生的时候我们不一定立马去处理信号, 因为有可能你正在做优先级更高的事情。
① 信号已到来,暂时没有处理,什么时候处理? 在 " 合适 " 的时候处理
②此时这个信号,已经产生,但是暂时没有处理(存在时间窗口),你一定要有某种方式记下来这个信号已经产生
.
(3)信号产生后
处理信号的三个方式:
(1)(信号产生前) 进程虽然现在没有收到任何信号,但是进程知道之后,收到信号之后,该怎么做.
(2)(信号产生中) 当信号到来的时候,进程可能正在处理更重要的事情,信号可能不会被立即处理,等合适的时候在进行处理
(3)(信号产生后)对信号进行处理
(1)代码
(2)结果 : 死循环不断打印,通过Ctrl + C 终止进程
(3)为什么使用Ctrl+C后,该进程就终止了?
实际上当用户按Ctrl+C时,这个键盘输入会产生一个硬中断,被操作系统获取并解释成信号(Ctrl+C被解释成2号信号) ,然后操作系统将2号信号发送给目标前台进程,当前台进程收到2号信号后就会退出。
(4)使用signal函数对信号进行捕捉,自定义处理.
①代码
#include
#include
#include
void handler(int signo)
{
printf("get a signal: %d\n", signo);
}
int main()
{
signal(2,handler);
while(1){
printf("I am running ... \n");
sleep(1);
}
return 0;
}
·
②结果 : 此时当该进程收到2号信号后,就会执行自己定义的handler方法,而不会像之前一样直接退出了.
(5)补充
(1)查看所有信号 : kill -l
(2)其中1~31号信号是普通信号,34~64号信号是实时信号,普通信号和实时信号各自都有31个,每个信号都有一个编号和一个宏定义
(3)信号的记录
实际上,当一个进程接收到某种信号后,该信号是被记录在该进程的进程控制块(task_struc)当中的。我们都知道进程控制块本质上就是一个结构体变量,而对于信号来说我们主要就是记录某种信号是否产生; 比特位的位置代表信号的编号,而比特位的内容就代表是否收到对应信号
(4) 信号的发送
①执行该信号的默认处理动作。
②提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。
③忽略该信号
通过man手册查看各个信号默认的处理动作 man 7 signal
(1)信号是一种事件发生的通知机制,即便事件没有发生,我们的程序也知道如何处理该事件。
(2)在OS层面进程帮我们处理信号(设置,捕捉)。
(3)信号也算通信,和之前讲的通信的区别是之前的通信是以传输数据为目的,信号本质是想把事件通知。
(4)为什么要有信号? 人一定要有处理突发事件的能力,进程也是如此。本质是让进程具有处理突发事件的能力
(1)通过Ctrl + C , Ctrl + \终止进程
(2)Ctrl+C终止进程和Ctrl+\终止进程的区别
Ctrl+C实际是向进程发送2号信号SIGINT,Ctrl+\实际上是向进程发送3号信号SIGQUIT。而两个信号的处理动作不一样,2号信号是Term,而3号信号是Core。
Term和Core都代表着终止进程,但是Core在终止进程的时候会进行一个动作,那就是核心转储。
(3)什么是核心转储
①在云服务器中,核心转储是默认被关掉的,我们可以通过 ulimit -a 命令查看当前资源限制的设定。
②查看结果显示core文件的大小为0,即表示核心转储是被关闭的。
通过ulimit -c size命令来设置core文件的大小。
③再次使用Ctrl+\对进程进行终止,就会发现终止进程后会显显示Core dump
④在当前路径下生成一个core文件,该文件以一串数字为后缀,而这一串数字实际上就是发生这一次核心转储的进程的PID。
(4)核心转储功能的作用
(5)云服务器为什么默认关闭core dump ,本地虚拟机环境是打开的?
(6)运用core dump进行调试
①测试代码
②结果
③信号已经产生 ,为什么会执行最后一次打印
printf含有系统调用接口,从用户态到内核态执行打印,打印结束后从内核态->用户态进行了信号检测。
④使用gdb对当前可执行程序进行调试,然后直接使用core - file 命令加载core文件,即可判断出该程序在终止时收到了11号信号,是非法的地址访问。
事后用调试器检查core文件以查清错误原因,这种调试方式叫做事后调试。
⑤core dump标志
pid_t waitpid(pid_t pid, int *status, int options); //进程等待
waitpid函数的第二个参数status是一个输出型参数,用于获取子进程的退出状态。status是一个整型变量,但status不能简单的当作整型来看待,status的不同比特位所代表的信息不同,具体细节如下(只关注status低16位比特位):
代码测试获取core dump :打开Linux的核心转储功能,并编写下列代码。代码中父进程使用fork函数创建了一个子进程,子进程所执行的代码当中存在除0错误,必然会被操作系统所终止并在终止时进行核心转储。此时父进程使用waitpid函数便可获取到子进程退出时的状态,根据status的第8个比特位便可得知子进程在被终止时是否进行了核心转储。
#include
#include
#include
#include
#include
int main()
{
if(fork() == 0){
printf("child running ...\n");
int a = 10 / 0;
exit(-1);
}
//father
int status =0;
waitpid(-1 , &status , 0);
printf("exit code:%d, core dump:%d, signal:%d\n"
, (status >> 8)&0xff , (status >> 7)&1 , status&0x7f );
return 0;
}
(7)测试其他按键发送的信号
①将1~31号信号全部进行捕捉,将收到信号后的默认处理动作改为打印收到信号的编号。
②组合按键Ctrl+C、Ctrl+\、Ctrl+Z,查看信号
③ 向该进程发送9号信号,该进程并不会打印收到了9号信号,而是执行收到9号信号后的默认处理动作,即被终止
注意: 有些信号是不能被捕捉的,比如9号信号。因为如果所有信号都能被捕捉的话,那么进程就可以将所有信号全部进行捕捉并将动作设置为忽略,写一个病毒程序,此时该进程将无法被杀死,即便是操作系统。
(1)kill命令是调用kill函数实现的。kill函数可以给一个指定的进程发送指定的信号。
int kill(pid_t pid, int sig);
如果信号发送成功,则返回0,否则返回-1。
代码模拟实现:
#include
#include
#include
#include
void Usage(char* proc)
{
printf("Usage: %s pid signo\n", proc);
}
int main(int argc, char* argv[])
{
if (argc != 3){
Usage(argv[0]);
return 1;
}
pid_t pid = atoi(argv[1]);
int signo = atoi(argv[2]);
kill(pid, signo);
return 0;
}
结果:
(2)raise函数
int raise(int sig);
raise函数可以给当前进程发送指定信号,即自己给自己发送信号,如果信号发送成功,则返回0,否则返回一个非零值.
代码测试:
#include
#include
#include
void handler(int signo)
{
printf("get a signal:%d\n", signo);
}
int main()
{
signal(2, handler);
while (1){
sleep(1);
raise(2);
}
return 0;
}
每隔1s发送2号信号,被捕捉:
(3)abort函数
void abort(void);
abort函数可以给当前进程发送SIGABRT信号,使得当前进程异常终止
测试代码:
#include
#include
#include
#include
void handler(int signo)
{
printf("get a signal:%d\n", signo);
}
int main()
{
signal(SIGABRT, handler);
while (1){
sleep(1);
abort();
}
return 0;
}
结果: 虽然我们对SIGABRT信号进行了捕捉,并且在收到SIGABRT信号后执行了我们给出的自定义方法,但是当前进程依然是异常终止了。
注意: abort函数的作用是异常终止进程,exit函数的作用是正常终止进程,而abort本质是通过向当前进程发送SIGABRT信号而终止进程的,因此使用exit函数终止进程可能会失败,但使用abort函数终止进程总是成功的。
(1)SIGPIPE信号
SIGPIPE信号实际上就是一种由软件条件产生的信号,当进程在使用管道进行通信时,读端进程将读端关闭,而写端进程还在一直向管道写入数据,那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。
(2)SIGALRM信号
①调用alarm函数可以设定一个闹钟,也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程
②函数 : unsigned int alarm(unsigned int seconds);
③alarm函数的作用就是,让操作系统在seconds秒之后给当前进程发送SIGALRM信号, SIGALRM信号的默认处理动作是终止进程。
④alarm函数的返回值:若调用alarm函数前,进程已经设置了闹钟,则返回上一个闹钟时间的剩余时间,并且本次闹钟的设置会覆盖上一次闹钟的设置。
⑤如果调用alarm函数前,进程没有设置闹钟,则返回值为0。
⑥代码测试:
#include
#include
#include
int main()
{
int count = 0;
alarm(1);
while (1){
count++;
printf("count: %d\n", count);
}
return 0;
}
1)结果: 打印出来
2)结果 : 先计算,最后打印
#include
#include
#include
#include
int count = 0;
void handler(int signo)
{
printf("get a signal: %d\n", signo);
printf("count: %d\n", count);
exit(1);
}
int main()
{
signal(SIGALRM, handler);
alarm(1);
while (1){
count++;
}
return 0;
}
⑦两次代码测试中,count的值相差数量集很大的解释
主要原因有两个,首先,由于我们每进行一次累加就进行了一次打印操作,外设进行了IO操作,其次,由于我当前使用的是云服务器,因此在累加操作后还需要将累加结果通过网络传输将服务器上的数据发送过来,因此最终显示的结果要比实际一秒内可累加的次数小得多。
一个体系结构中,IO是影响效率的最大因素
(1)为什么C/C++程序会崩溃?
(2)野指针访问测试
#include
#include
#include
void handler(int signo)
{
printf("get a signal:%d\n" , signo);
sleep(1);
}
int main()
{
signal(11 ,handler);
printf("begin ...\n");
int* p;
*p = 100;
printf("end ...\n");
return 0;
}
结果:
①运行的结果是一直打印获得11号信号,即OS一直想进程发送11号信号.
②错误没被纠正,硬件仍能检测出来,一直发信号。
③进程中的野指针在OS是如何被发现的?
指针变量里面放的是虚拟地址,想要访问数据要将虚拟地址转换为物理地址。野指针的虚拟地址在页表里没有到物理地址的映射关系,即使有,页表中还有一些标志位,某个空间不能写入。地址转化出现了错误,在页表硬件mmu中就出现了错误。OS是硬件的管理者,当OS发现页表硬件mmu错误,OS立即形成信号,杀掉这个进程。
④如果是除0错误如何发现
OS在进行正常运行的时候发现CPU内有一个计算它的状态寄存器发生了改变(硬件上的除0错误),OS立马就定位到是我当前运行的哪个进程,所以OS识别到硬件错误将这个硬件错误解释成包装成信号发送给目标进程,本质就是OS去找到这个进程的PCB让目标进程的位图由0->1这个进程在合适的时候处理信号,进程执行对应信号的操作。
(3)深入理解硬件异常
小结:
(1)根据信号在内核中的表示方法,每个信号的未决标志只有一个比特位,非0即1,不记录该信号产生了多少次,阻塞标志也只有一个比特位。
(2)因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储(不同操作系统实现sigset_t的方案可能不同)
(3)sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。
(4)阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
(1)函数原型
#include
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset(sigset_t *set, int signum);
int sigdelset(sigset_t *set, int signum);
int sigismember(const sigset_t *set, int signum);
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”,至于这个类型内部如何存储这些bit则依赖于系统的实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。
(2)函数作用解释
注意: 在使用sigset_t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号处于确定的状态。
(3)对于比特位的设置不能使用&│必须使用函数进行操作,因为你不确定位图的结构,有可能是个结构体。
(4)sigset_t类型的变量是定义在用户栈上的,对sigset_t变量进行的各种操作是不会影响进程的任何行为,最终通过系统调用设置进OS。
int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);
(1)sigprocmask函数可以用于读取或更改进程的信号屏蔽字(阻塞信号集)
(2)参数
(3)假设当前的信号屏蔽字为mask,how的选项
(4)返回值 : sigprocmask函数调用成功返回0,出错返回-1。
注意: 如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。
int sigpending(sigset_t *set);
(1) sigpending函数可以用于读取进程的未决信号集
(2) sigpending函数读取当前进程的未决信号集,并通过set参数传出。该函数调用成功返回0,出错返回-1。
(1)代码 : 先屏蔽2号信号 ,20s后再解除屏蔽,此间一直展示pending表的信息
#include
#include
#include
void printfPending(sigset_t* pending) //打印pending信号集
{
int i =1;
for( ; i <= 31 ; ++i){
if(sigismember(pending , i)){
printf("1 ");
}
else{
printf("0 ");
}
}
printf("\n");
}
void handler(int signo)
{
printf("get signo: %d\n" , signo);
}
int main()
{
signal(2,handler); //注册2号信号的处理方式
sigset_t set,oset; //用户空间定义的变量
sigemptyset(&set);
sigemptyset(&oset);
sigaddset(&set , 2);//SIGINT
sigprocmask(SIG_SETMASK , &set , &oset); //覆盖block表,只有2号信号被阻塞
int count = 0;
sigset_t pending;
while(1){
sigemptyset(&pending); //pending信号集清空
sigpending(&pending); //获取进程pending信号集信息
printfPending(&pending); //打印pending信号集信息
sleep(1);
count++;
if(count == 20){
sigprocmask(SIG_SETMASK , &oset ,NULL);//恢复曾经的信号屏蔽字,所有的信号都不阻塞
printf("recover: \n");
}
}
return 0;
}
(2)结果
注意: 在解除2号信号后,2号信号的自定义动作是在打印“ recover ”之前执行的。因为如果调用sigprocmask解除对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。
(1)内核态与用户态:
(2)进程收到信号之后,并不是立即处理信号,而是在合适的时候,这里所说的合适的时候实际上就是指,从内核态切换回用户态的时候 ,会进行信号的检测。
(3)内核态和用户态之间是进行如何切换的?
从用户态切换为内核态:
从内核态切换为用户态:
(4)其中,由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时,本质上是因为我们需要执行操作系统的代码,比如系统调用函数是由操作系统实现的,我们要进行系统调用就必须先由用户态切换为内核态。
如何理解进程切换?
注意: 当你访问用户空间时你必须处于用户态,当你访问内核空间时你必须处于内核态。
注意: sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程
(1)无穷大记法
该图形与直线有几个交点就代表在这期间有几次状态切换,而箭头的方向就代表着此次状态切换的方向,图形中间的圆点就代表着检查pending表。
(2)为啥执行自定义处理函数要从内核态 -> 用户态? 不切换也可以执行,但是为什么切换呢?
int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
(1)捕捉信号除了用前面用过的signal函数之外,我们还可以使用sigaction函数对信号进行捕捉,
(2)sigaction函数可以读取和修改与指定信号相关联的处理动作,该函数调用成功返回0,出错返回-1。
(3)参数
(4)关于struct sigaction
①第一个成员sa_handler
注意: 所注册的信号处理函数的返回值为void,参数为int,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然这是一个回调函数,不是被main函数调用,而是被系统所调用。
②第二个成员sa_sigaction:
sa_sigaction是实时信号的处理函数。
③第三个成员sa_mask:
④第四个成员sa_flags:
sa_flags字段包含一些选项,这里直接将sa_flags设置为0即可。
⑤第五个成员sa_restorer:不使用
(5)测试代码
用sigaction函数对2号信号进行了捕捉,将2号信号的处理动作改为了自定义的打印动作,并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作 , 即捕捉一次,再次发送2号信号时进程就会退出.
struct sigaction act,oact;
void handler(int signo)
{
printf("get a signal: %d\n" , signo);
sigaction(2 , &oact ,NULL);
}
int main()
{
memset(&act ,0 ,sizeof(act));
memset(&oact ,0 ,sizeof(oact)); //初始化空间
act.sa_handler = handler;
act.sa_flags = 0;
sigemptyset(&act.sa_mask); //赋值
sigaction(2 , &act ,&oact);
while(1){
printf("I am a process !\n");
sleep(1);
}
return 0;
}
结果: 第一次捕捉,第二次进程终止
如果一个函数符合以下条件之一则是不可重入的:
volatile 作用:保持内存的可见性,告知编译器,被该关键字修饰的变量,不允许被优化,对该变量的任何操作,都必须在真实的内存中进行操作 ,凡是被volatile修饰的变量是不可被 "覆盖"的.
(1)代码 : 代码的默认优化级别是01的, 我们对2号信号进行了捕捉,当该进程收到2号信号时会将全局变量flag由0置1。也就是说,在进程收到2号信号之前,该进程会一直处于死循环状态,直到收到2号信号时将flag置1才能够正常退出。
#include
#include
int flag = 0;
void handler(int signo)
{
printf("get a signal:%d\n", signo);
flag = 1;
}
int main()
{
signal(2, handler); //执行流1
while (!flag); //执行流2
printf("process quit normal!\n");
return 0;
}
结果: 打印出来两句话说明有两条执行流 ,且感受不到彼此的存在
(2)代码不做任何改变,编译时优化级别改为 -O3
就算发送2号信号,进程也不会终止.
①经过优化之后,handler中修改的是内存中的flag ,main函数中while循环检测的是寄存器中的flag.
②相当于寄存器的值把内存的值"覆盖"了,让CPU只能看到寄存器的值。
③编译器只能够对代码进行词法分析,语法分析,对于逻辑是无法检测的。逻辑是CPU执行过程中进行检测的。
④编译器在检测main执行流时会发现,flag变量在main函数中不会被修改,对于一个不可能被修改的变量而且while是要一直对flag进行检测的,所以编译器如果要进行优化的话,最好的方式是将该flag优化到寄存器变量中。就不需要从内存中读取flag变量到寄存器中了。检测一个数是否是0也是运算(算数运算,逻辑运算)只有CPU能进行计算。
(3)添加volatile关键字 ,告知编译器,对flag变量的任何操作都必须真实的在内存中进行,即保持了内存的可见性。
volatile flag = 0;
(1)为了避免出现僵尸进程,父进程需要使用wait或waitpid函数等待子进程结束,父进程可以阻塞等待子进程结束,也可以非阻塞地查询的是否有子进程结束等待清理,即轮询的方式。采用第一种方式,父进程阻塞就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。
(2)其实,子进程在终止时会给父进程发生SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理动作,这样父进程就只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait或waitpid函数清理子进程即可
(3)下面代码中对SIGCHLD信号进行了捕捉,并将在该信号的处理函数中调用了waitpid函数对子进程进行了清理。
①代码
#include
#include
#include
#include
#include
void handler(int signo)
{
printf("get a signal: %d\n" , signo);
int ret = 0;
while((ret = waitpid(-1,NULL,WNOHANG)) > 0){
printf("wait child %d success!\n" , ret);
}
}
int main()
{
signal(17 ,handler);
if(fork() == 0){ //child
printf("child is running , begin dead ! : %d\n" , getpid());
sleep(3);
exit(1);
}
//father
while(1);
return 0;
}
注意:
②结果
(4)事实上,由于UNIX的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的,但这是一个特列。此方法对于Linux可用,但不保证在其他UNIX系统上都可用。