【Linux】进程信号

进程信号

  • 一、信号入门
    • 1、生活角度的信号
    • 2、技术层面的信号
    • 3、ctrl+c是2号信号
    • 4、提醒点
    • 5、信号发送与记录
      • (1)信号是如何被记录的
      • (2)信号是如何产生的
    • 6、信号处理常见方式概述
  • 二、产生信号
    • 1、通过终端按键产生信号(ctrl+\)
    • 2、Ctrl+C终止进程和按Ctrl+\终止进程,有什么区别
    • 3、什么是核心转储
    • 4、核心转储功能有什么用
    • 5、如何运用核心转储进行调试
    • 6、core dump标志
    • 7、其他信号
    • 8、通过系统函数向进程发信号
      • (1)kill函数
      • (2)raise
      • (3)abort函数
    • 9、由软件条件产生信号
      • (1)SIGALRM信号
    • 10、由硬件异常产生信号
  • 三、阻塞信号
    • 1、信号其他相关的概念
    • 2、在内核中的表示
    • 3、sigset_t
    • 4、信号集操作函数
    • 5、sigprocmask
      • (1)参数说明
      • (2)返回值
    • 6、sigpending
    • 7、进行阻塞尝试打印
      • (1)标准打印
      • (2)pending表的变化
  • 四、捕捉信号
    • 1、内核空间与用户空间
      • 如何理解进程切换
    • 2、内核态与用户态
      • (1)内核态和用户态之间的切换
        • i、内核态切换到用户态
        • ii、用户态切换到内核态
      • (2)内核如何实现信号的捕捉
        • i、记忆方式
        • ii、当识别到信号的处理动作是自定义时,能直接在内核态执行用户空间的代码吗
      • (3)sigaction
        • i、参数说明
          • (i)结构体的第一个成员sa_handler
          • (ii)结构体的第二个成员sa_sigaction
          • (iii)结构体的第三个成员sa_mask
          • (iv)结构体的第四个成员sa_flags
          • (v)结构体的第五个成员sa_restorer
        • ii、使用
    • 3、可重入函数
    • 4、volatile
    • 5、SIGCHLD信号


一、信号入门

1、生活角度的信号

  • 你在网上买了很多件商品,再等待不同商品快递的到来。但即便快递没有到来,你也知道快递来临时,你该怎么处理快递。也就是你能“识别快递”。
  • 当快递员到了你楼下,你也收到快递到来的通知,但是你正在打游戏,需5min之后才能去取快递。那么在在这5min之内,你并没有下去去取快递,但是你是知道有快递到来了。也就是取快递的行为并不是一定要立即执行,可以理解成“在合适的时候去取”。
  • 在收到通知,再到你拿到快递期间,是有一个时间窗口的,在这段时间,你并没有拿到快递,但是你知道有一个快递已经来了。本质上是你“记住了有一个快递要去取”。
  • 当你时间合适,顺利拿到快递之后,就要开始处理快递了。而处理快递一般方式有三种:1. 执行默认动作(幸福的打开快递,使用商品)2. 执行自定义动作(快递是零食,你要送给你的女朋友)3. 忽略快递(快递拿上来之后,扔掉床头,继续开一把游戏)。
  • 快递到来的整个过程,对你来讲是异步的,你不能准确断定快递员什么时候给你打电话。

2、技术层面的信号

我们编写以下的代码并运行:

#include
#include 
using namespace std;
int main()
{
    while(1)
    {
        cout << "hello linux" << endl;
        sleep(1);
    }
    return 0;
}

我们知道该程序的运行结果就是死循环地进行打印,而对于死循环来说,最好的方式就是使用Ctrl+C对其进行终止。
【Linux】进程信号_第1张图片

所以为什么ctrl+c以后,进程就终止了?

3、ctrl+c是2号信号

实际上当用户按Ctrl+C时,这个键盘输入会产生一个硬中断,被操作系统获取并解释成信号(Ctrl+C被解释成2号信号),然后操作系统将2号信号发送给目标前台进程,当前台进程收到2号信号后就会退出。
我们可以使用signal函数对2号信号进行捕捉,证明当我们按Ctrl+C时进程确实是收到了2号信号。使用signal函数时,我们需要传入两个参数,第一个是需要捕捉的信号编号,第二个是对捕捉信号的处理方法,该处理方法的参数是int,返回值是void

void signal(int id, void handle);
#include
#include
#include
using namespace std;
void handle(int sig)
{
    printf("get the signal is:%d\n", sig);
}
int main()
{
    signal(2, handle);
    while(1)
    {
        printf("hello linux\n");
        sleep(1);
    }    
    return 0;
}

此时当该进程收到2号信号后,就会执行我们给出的handler方法,而不会像之前一样直接退出了,因为此时我们已经将2号信号的处理方式由默认改为了自定义了。
【Linux】进程信号_第2张图片

4、提醒点

  • Ctrl-C 产生的信号只能发给前台进程一个命令后面加个&可以放到后台运行,这样Shell不必等待进程结束就可以接受新的命令,启动新的进程。
  • Shell可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接到像 Ctrl-C 这种控制键产生的信号。
  • 前台进程在运行过程中用户随时可能按下 Ctrl-C 而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都有可能收到 SIGINT 信号而终止,所以信号相对于进程的控制流程来说是异步(Asynchronous)的
  • 信号是进程之间事件异步通知的一种方式,属于软中断

5、信号发送与记录

【Linux】进程信号_第3张图片

其中1到31号信号是普通信号,34到64号信号是实时信号,普通信号和实时信号各自都有31个,每个信号都有一个编号和一个宏定义名称:

【Linux】进程信号_第4张图片

(1)信号是如何被记录的

实际上,当一个进程接收到某种信号后,该信号是被记录在该进程的进程控制块当中的。我们都知道进程控制块本质上就是一个结构体变量,而对于信号来说我们主要就是记录某种信号是否产生,因此,我们可以用一个32位的位图来记录信号是否产生
我们看下图,比特位的位就代表了信号的编号,我们下图中的位图的比特位的2号编号变成1则是收到了2号信号。
【Linux】进程信号_第5张图片

(2)信号是如何产生的

信号的产生本质上就是操作系统直接去修改目标进程的task_struct中的信号位图。因为当进程收到信号了以后,必然信号比特位图发生了改变,同时该进程的数据被修改了,只有操作系统是进程的管理者,能够管理进程.信号只能由操作系统发送,但信号发送的方式有多种。

6、信号处理常见方式概述

  • 执行该信号的默认处理动作。
  • 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。
  • 忽略该信号。
sudo yum install man-pages // 下载man手册
man 7 signal

【Linux】进程信号_第6张图片
【Linux】进程信号_第7张图片

二、产生信号

1、通过终端按键产生信号(ctrl+\)

#include
#include 
using namespace std;
int main()
{
    while(1)
    {
        cout << "hello linux" << endl;
        sleep(1);
    }
    return 0;
}

【Linux】进程信号_第8张图片

2、Ctrl+C终止进程和按Ctrl+\终止进程,有什么区别

按Ctrl+C实际上是向进程发送2号信号SIGINT,而按Ctrl+\实际上是向进程发送3号信号SIGQUIT。查看这两个信号的默认处理动作,可以看到这两个信号的Action是不一样的,2号信号是Term,而3号信号是Core
【Linux】进程信号_第9张图片
Term和Core都代表着终止进程,但是Core在终止进程的时候会进行一个动作,那就是核心转储

【Linux】进程信号_第10张图片

3、什么是核心转储

在云服务器中,核心转储是默认被关掉的,我们可以通过使用ulimit -a命令查看当前资源限制的设定。
core文件是0,那么表示核心转储是被关闭的。
【Linux】进程信号_第11张图片

我们可以通过ulimit -c size命令来设置core文件的大小

【Linux】进程信号_第12张图片

core文件的大小设置完毕后,就相当于将核心转储功能打开了。此时如果我们再使用Ctrl+\对进程进行终止,就会发现终止进程后会显示core dumped
【Linux】进程信号_第13张图片
并且会在当前路径下生成一个core文件,该文件以一串数字为后缀,而这一串数字实际上就是发生这一次核心转储的进程的PID

【Linux】进程信号_第14张图片
ulimit命令改变的是Shell进程的Resource Limit,但sig进程的PCB是由Shell进程复制而来的,所以也具有和Shell进程相同的Resource Limit值。

4、核心转储功能有什么用

我们代码运行出错了以后,我们肯定很慌,最想要知道的是因为什么而出错,为什么会出错,总共有两种出错的方式,第一种方式是进程结束后出错了,那么就是有退出码,我们可以根据退出码来进行找出错地方和出错原因;而加入说是运行过程中出错了呢?

当我们的程序在运行过程中崩溃了,我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下,我们会用到核心转储,核心转储指的是操作系统在进程收到某些信号而终止运行时,将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中,这个磁盘文件也叫做核心转储文件,一般命名为core.pid。也就是这个进程在运行的时候出错了可以方便调试的定位。

5、如何运用核心转储进行调试

我们写一个除零错误,看一下我们的核心转储到哪了:

#include
#include
using namespace std;
int main()
{
    printf("begining...\n");
    sleep(2);
    int a = 2 / 0;
    printf("end...\n");
    return 0;
}

【Linux】进程信号_第15张图片
【Linux】进程信号_第16张图片
使用gdb对当前可执行程序进行调试,然后直接使用core-file core文件命令加载core文件,即可判断出该程序在终止时收到了8号信号,并且定位到了产生该错误的具体代码。
事后用调试器检查core文件以查清错误原因,这种调试方式叫做事后调试。
【Linux】进程信号_第17张图片

6、core dump标志

进程等待函数waitpid函数的第二个参数:

pid_t waitpid(pid_t pid, int *status, int options);

waitpid函数的第二个参数status是一个输出型参数用于获取子进程的退出状态status是一个整型变量,但status不能简单的当作整型来看待,status的不同比特位所代表的信息不同,具体细节如下(只关注status低16位比特位):

【Linux】进程信号_第18张图片
若进程是正常终止的,那么status的次低8位就表示进程的退出状态,即退出码。若进程是被信号所杀,那么status的低7位表示终止信号,而第8位比特位是core dump标志,即进程终止时是否进行了核心转储

【Linux】进程信号_第19张图片

打开Linux的核心转储功能,并编写下列代码。代码中父进程使用fork函数创建了一个子进程,子进程所执行的代码当中存在野指针问题,当子进程执行到*p = 100时,必然会被操作系统所终止并在终止时进行核心转储。此时父进程使用waitpid函数便可获取到子进程退出时的状态,根据status的第7个比特位便可得知子进程在被终止时是否进行了核心转储。

#include 
#include 
#include 
#include 
#include 
int main()
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork erroe\n");
        return 1;
    }
    else if(id == 0)
    {
        // child
        printf("beginning...");
        int* p = NULL;
        *p = 100;
        exit(0);
    }
    // father
    int status = 0;
	waitpid(-1, &status, 0);
	printf("exitCode:%d, coreDump:%d, signal:%d\n", (status >> 8) & 0xff, (status >> 7) & 1, status & 0x7f);
    return 0;
}

所获取的status的第7个比特位为1,即可说明子进程在被终止时进行了核心转储。core dump标志实际上就是用于表示程序崩溃的时候是否进行了核心转储。
【Linux】进程信号_第20张图片

7、其他信号

#include
#include
#include
#include 
using namespace std;
void handle(int signo)
{
    printf("get the signal is:%d\n", signal);
}
int main()
{
    int signo = 0;
    for(signo = 1; signo < 32; signo++)
    {
        signal(signo, handle);
    }
    while(1)
    {
        sleep(1);
    }
    printf("ending...");
    return 0;
}

当我们按下组合按键Ctrl+C、Ctrl+\、Ctrl+Z后,便可以得知这些组合按键分别是向前台进程发送几号信号了。但如果我们此时向该进程发送9号信号,该进程并不会打印收到了9号信号,而是执行收到9号信号后的默认处理动作,即被终止。
【Linux】进程信号_第21张图片
说明: 有些信号是不能被捕捉的,比如9号信号。因为如果所有信号都能被捕捉的话,那么进程就可以将所有信号全部进行捕捉并将动作设置为忽略,此时该进程将无法被杀死,即便是操作系统。

8、通过系统函数向进程发信号

当我们要使用kill命令向一个进程发送信号时,我们可以以kill -信号名 进程ID的形式进行发送。
【Linux】进程信号_第22张图片

也可以以kill -信号编号 进程ID的形式进行发送。

【Linux】进程信号_第23张图片

(1)kill函数

实际上kill命令是通过调用kill函数实现的,kill函数可以给指定的进程发送指定的信号,kill函数的函数原型如下:

int kill(pid_t pid, int sig);

kill函数用于向进程ID为pid的进程发送sig号信号,如果信号发送成功,则返回0,否则返回-1

我们写一下mykill函数:
mykill.cpp:

#include 
#include 
#include 
#include 
using namespace std;
void Usage(char* proc)
{
    printf("Usage:%s pid signo\n", proc);
}
int main(int argc, int* argv[])
{
    if (argc != 3)
    {
		Usage(argv[0]);
		return 1;
	}
	pid_t pid = atoi(argv[1]);
	int signo = atoi(argv[2]);
	kill(pid, signo);
    return 0;
}

为了让生成的可执行程序在执行时不用带上路径,我们可以将当前路径导入环境变量PATH当中。

【Linux】进程信号_第24张图片
此时我们便模拟实现了一个kill命令,该命令的使用方式为mykill 进程ID 信号编号

【Linux】进程信号_第25张图片

(2)raise

raise函数可以给当前进程发送指定信号,即自己给自己发送信号,raise函数的函数原型如下:

int raise(int sig);

raise函数用于给当前进程发送sig号信号,如果信号发送成功,则返回0,否则返回一个非零值。

#include
#include
#include
using namespace std;
void handler(int signo)
{
    cout << "get a signo is#" << signo << endl;
}
int main()
{
    signal(2, handler);
    while(1)
    {
        sleep(1);
        raise(2);
    }
    return 0;
}

【Linux】进程信号_第26张图片

(3)abort函数

abort函数可以给当前进程发送SIGABRT信号,使得当前进程异常终止,abort函数的函数原型如下:

void abort(void); // 无参数
#include
#include
#include
#include
using namespace std;
void handler(int proc)
{
    cout << "get a signal is#" << proc << endl;
}
int main()
{
    signal(SIGABRT, handler);
    while(1)
    {
        sleep(1);
        abort();
    }
    return 0;
}

与之前不同的是,虽然我们对SIGABRT信号进行了捕捉,并且在收到SIGABRT信号后执行了我们给出的自定义方法,但是当前进程依然是异常终止了。
【Linux】进程信号_第27张图片
abort函数的作用是异常终止进程exit函数的作用是正常终止进程,而abort本质是通过向当前进程发送SIGABRT信号而终止进程的,因此使用exit函数终止进程可能会失败,但使用abort函数终止进程总是成功的。

9、由软件条件产生信号

SIGPIPE信号实际上就是一种由软件条件产生的信号,当进程在使用管道进行通信时,读端进程将读端关闭,而写端进程还在一直向管道写入数据,那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。

我们写下面的代码,也就是创建一个匿名管道,父进程负责读端,子进程负责写端,而此时父进程不讲武德,关闭了读端也关闭了写端,子进程却一直在写,我们看一下下面的代码和运行情况:

#include 
#include 
#include 
#include 
#include 
#include 
using namespace std;
int main()
{
    // pipe
    int fd[2] = { 0 }; // 0为读端,1为写端
    int pp = pipe(fd);
    if(pp < 0)
    {
        perror("pipe error\n");
        return 1;
    }
    // 创建进程
    pid_t id = fork();
    if(id == 0)
    {
        // child
        close(fd[0]); // 关闭读端
        // 写入
        const char* msg = "hello I am your child...";
        int count = 5;
        while(count--)
        {
            write(fd[1], msg, strlen(msg)); // 写端写入
        }
        close(fd[1]); // 关闭写端
        exit(0);
    }
    // father
    close(fd[1]); // 关闭写端
    close(fd[0]); // 直接关闭读端
    int status = 0;
    waitpid(id, &status, 0); // 等待进程退出
    printf("child get a signal is#%d\n", status & 0x7F);
    return 0;
}

运行代码后,即可发现子进程在退出时收到的是13号信号,即SIGPIPE信号。
【Linux】进程信号_第28张图片

(1)SIGALRM信号

调用alarm函数可以设定一个闹钟,也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程,alarm函数的函数原型如下:

unsigned int alarm(unsigned int seconds);

alarm函数的作用就是,让操作系统在seconds秒之后给当前进程发送SIGALRM信号,SIGALRM信号的默认处理动作是终止进程

alarm函数的返回值:

  • 若调用alarm函数前,进程已经设置了闹钟,则返回上一个闹钟时间的剩余时间,并且本次闹钟的设置会覆盖上一次闹钟的设置
  • 如果调用alarm函数前,进程没有设置闹钟,则返回值为0。

我们用下面的代码来测试一下云服务器的计算速度,也就是一秒钟可以累加到多大?

#include
#include
#include
using namespace std;
int main()
{
    alarm(1);
    int count = 0;
    while(1)
    {
        count++;
        cout << "cout#" << count << endl;
    }
    return 0;
}

我们发现最大可以到62899这么大。
【Linux】进程信号_第29张图片

但是我可以打包票的说,远远不止这么点儿,因为我们还有打印这个步骤,肯定是需要浪费很多时间的,同时我们因为是在云服务器上跑,因此在累加操作后还需要将累加结果通过网络传输将服务器上的数据发送过来,因此最终显示的结果要比实际一秒内可累加的次数小得多。
为了尽可能避免上述问题,我们可以先让count变量一直执行累加操作,直到一秒后进程收到SIGALRM信号后再打印累加后的数据。

#include
#include
#include
#include
using namespace std;
int count = 0;
void handler(int proc)
{
    cout << "get a signal is#" << proc << endl;
    cout << "count is#" << count << endl;
    exit(0);
}
int main()
{
    signal(SIGALRM, handler);
    alarm(1);
    while(1)
    {
        count++;
    }
    return 0;
}

此时可以看到,count变量在一秒内被累加的次数变成了五亿多,由此也证明了,与计算机单纯的计算相比较,计算机与外设进行IO时的速度是非常慢的。
【Linux】进程信号_第30张图片

10、由硬件异常产生信号

当我们程序当中出现类似于除0、野指针、越界之类的错误时,为什么程序会崩溃?本质上是因为进程在运行过程中收到了操作系统发来的信号进而被终止,那操作系统是如何识别到一个进程触发了某种问题的呢?

我们知道,CPU当中有一堆的寄存器,当我们需要对两个数进行算术运算时,我们是先将这两个操作数分别放到两个寄存器当中,然后进行算术运算并把结果写回寄存器当中。此外,CPU当中还有一组寄存器叫做状态寄存器,它可以用来标记当前指令执行结果的各种状态信息,如有无进位、有无溢出等等。而操作系统是软硬件资源的管理者,在程序运行过程中,若操作系统发现CPU内的某个状态标志位被置位,而这次置位就是因为出现了某种除0错误而导致的,那么此时操作系统就会马上识别到当前是哪个进程导致的该错误,并将所识别到的硬件错误包装成信号发送给目标进程,本质就是操作系统去直接找到这个进程的task_struct,并向该进程的位图中写入8信号,写入8号信号后这个进程就会在合适的时候被终止。

野指针问题硬件怎么处理呢?

#include
#include
using namespace std;
int main()
{
    printf("beginning...\n");
    sleep(2);
    int* p = NULL;
    *p = 200;
    return 0;
}

【Linux】进程信号_第31张图片
首先我们必须知道的是,当我们要访问一个变量时,一定要先经过页表的映射,将虚拟地址转换成物理地址,然后才能进行相应的访问操作。

其中页表属于一种软件映射关系,而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU,它是一种负责处理CPU的内存访问请求的计算机硬件,因此映射工作不是由CPU做的,而是由MMU做的,但现在MMU已经集成到CPU当中了。

当需要进行虚拟地址到物理地址的映射时,我们先将页表的左侧的虚拟地址导给MMU,然后MMU会计算出对应的物理地址,我们再通过这个物理地址进行相应的访问。

而MMU既然是硬件单元,那么它当然也有相应的状态信息,当我们要访问不属于我们的虚拟地址时,MMU在进行虚拟地址到物理地址的转换时就会出现错误,然后将对应的错误写入到自己的状态信息当中,这时硬件上面的信息也会立马被操作系统识别到,进而将对应进程发送SIGSEGV信号。

【Linux】进程信号_第32张图片

三、阻塞信号

1、信号其他相关的概念

  • 实际执行信号的处理动作,称为信号递达(Delivery)
  • 信号从产生到递达之间的状态,称为信号未决(pending)
  • 进程可以选择阻塞(Block)某个信号
  • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作。
  • 需要注意的是,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后的一种处理动作。

2、在内核中的表示

【Linux】进程信号_第33张图片

  • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
  • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会在改变处理动作之后再接触阻塞。
  • SIGQUIT信号未产生过,但一旦产生SIGQUIT信号,该信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前,这种信号产生过多次,POSIX.1允许系统递达该信号一次或多次。Linux是这样实现的:普通信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里,这里只讨论普通信号。

总结一下:

  • 在block位图中,比特位的位置代表某一个信号,比特位的内容代表该信号是否被阻塞。
  • 在pending位图中,比特位的位置代表某一个信号,比特位的内容代表是否收到该信号。
  • handler表本质上是一个函数指针数组,数组的下标代表某一个信号,数组的内容代表该信号递达时的处理动作,处理动作包括默认、忽略以及自定义。
  • block、pending和handler这三张表的每一个位置是一一对应的。

3、sigset_t

根据信号在内核中的表示方法,每个信号的未决标志只有一个比特位,非0即1,如果不记录该信号产生了多少次,那么阻塞标志也只有一个比特位。

因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储。在我当前的云服务中,sigset_t类型的定义如下:

#define _SIGSET_NWORDS (1024 / (8 * sizeof (unsigned long int)))
typedef struct
{
	unsigned long int __val[_SIGSET_NWORDS];
} __sigset_t;

typedef __sigset_t sigset_t;

sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。

  • 在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞。
  • 在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。

阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。

4、信号集操作函数

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”,至于这个类型内部如何存储这些bit则依赖于系统的实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t变量,而不应该对它的内部数据做任何解释。

#include 

int sigemptyset(sigset_t *set);

int sigfillset(sigset_t *set);

int sigaddset(sigset_t *set, int signum);

int sigdelset(sigset_t *set, int signum);

int sigismember(const sigset_t *set, int signum);  
  • sigemptyset函数:初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
  • sigfillset函数:初始化set所指向的信号集,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号。
  • sigaddset函数:在set所指向的信号集中添加某种有效信号。
  • sigdelset函数:在set所指向的信号集中删除某种有效信号。
  • sigemptyset、sigfillset、sigaddset和sigdelset函数都是成功返回0,出错返回-1。
  • sigismember函数:判断在set所指向的信号集中是否包含某种信号,若包含则返回1,不包含则返回0,调用失败返回-1。

使用:

#include 
#include 

int main()
{
	sigset_t s; //用户空间定义的变量

	sigemptyset(&s);

	sigfillset(&s);

	sigaddset(&s, SIGINT);

	sigdelset(&s, SIGINT);

	sigismember(&s, SIGINT);
	return 0;
}

5、sigprocmask

sigprocmask函数可以用于读取或更改进程的信号屏蔽字(阻塞信号集),该函数的函数原型如下:

int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);

(1)参数说明

  • how表示指示如何更改,set表示判断是否更改信号屏蔽字,oldset表示输出参数。
  • 如果oldset是非空指针,则读取进程当前的信号屏蔽字通过oldset参数传出。
  • 如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。
  • 如果oldset和set都是非空指针,则先将原来的信号屏蔽字备份到oldset里,然后根据set和how参数更改信号屏蔽字。

当前的信号屏蔽字为mask,下表说明了how参数的可选值及其含义:

选项 含义
SIG_BLOCK set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask
SIG_UNBLOCK set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask 或上 ~set
SIG_SETMASK 设置当前信号屏蔽字为set所指向的值,相当于mask=set

(2)返回值

sigprocmask函数调用成功返回0,出错返回-1。
如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。

6、sigpending

sigpending函数可以用于读取进程的未决信号集,该函数的函数原型如下:

int sigpending(sigset_t *set);

sigpending函数读取当前进程的未决信号集,并通过set参数传出。该函数调用成功返回0,出错返回-1。

7、进行阻塞尝试打印

(1)标准打印

  • 先用上述的函数将2号信号进行屏蔽(阻塞)。
  • 使用kill命令或组合按键向进程发送2号信号。
  • 此时2号信号会一直被阻塞,并一直处于pending(未决)状态。
  • 使用sigpending函数获取当前进程的pending信号集进行验证。

代码如下:

#include
#include 
#include 
using namespace std;
void Print(sigset_t* pending)
{
    int i = 0;
    for(int i = 1;i <= 31; i++)
    {
        if(sigismember(pending, i))
        {
            cout << "1" << " ";
        }
        else
        {
            cout<< "0" << " ";
        }
    }
    cout << endl;
}
int main()
{
    sigset_t set, oldset;
    sigemptyset(&set);
    sigemptyset(&oldset);
    sigaddset(&set, 2); // 初始化
    sigprocmask(SIG_SETMASK, &set, &oldset); // 阻塞二号信号
    sigset_t pending;
    sigemptyset(&pending); // 初始化未决
    while(1)
    {
        sigpending(&pending); // 获取pending
        // 打印
        Print(&pending);
        sleep(1);
    }
    return 0;
}

可以看到,程序刚刚运行时,因为没有收到任何信号,所以此时该进程的pending表一直是全0,而当我们使用kill命令向该进程发送2号信号后,由于2号信号是阻塞的,因此2号信号一直处于未决状态,所以我们看到pending表中的第二个数字一直是1。
【Linux】进程信号_第34张图片

(2)pending表的变化

为了看到2号pending表的变化,我们可以设置经过一段时间后,将2号信号的阻塞状态给解除解除。2号信号的阻塞状态后2号信号就会立即被递达。因为2号信号的默认处理动作是终止进程,所以为了看到2号信号递达后的pending表,我们可以将2号信号进行捕捉,让2号信号递达时执行我们所给的自定义动作。

#include
#include 
#include 
using namespace std;
void Print(sigset_t* pending)
{
    int i = 0;
    for(int i = 1;i <= 31; i++)
    {
        if(sigismember(pending, i))
        {
            cout << "1" << " ";
        }
        else
        {
            cout<< "0" << " ";
        }
    }
    cout << endl;
}
void handler(int signo)
{
    cout << "the signo is#" << signo <<endl; 
}
int main()
{
    signal(2, handler); // 继续来此信号进行打印
    sigset_t set, oldset;
    sigemptyset(&set);
    sigemptyset(&oldset);
    sigaddset(&set, 2); // 初始化
    sigprocmask(SIG_SETMASK, &set, &oldset); // 阻塞二号信号
    sigset_t pending;
    sigemptyset(&pending); // 初始化未决
    int count = 0;
    while(1)
    {
        sigpending(&pending); // 获取pending
        // 打印
        Print(&pending);
        sleep(1);
        count++;
        if(count == 25)
        {
            // 解除阻塞
            sigprocmask(SIG_SETMASK, &oldset, NULL); // 第三个参数为NULL,通过第三个信号屏蔽字传出来
            cout << "恢复屏蔽字..." << endl;
        }
    }
    return 0;
}

【Linux】进程信号_第35张图片

四、捕捉信号

1、内核空间与用户空间

每一个进程都有自己的进程地址空间,该进程地址空间由内核空间和用户空间组成:

  • 用户所写的代码和数据位于用户空间,通过用户级页表与物理内存之间建立映射关系。
  • 内核空间存储的实际上是操作系统代码和数据,通过内核级页表与物理内存之间建立映射关系。

内核级页表是一个全局的页表,它用来维护操作系统的代码与进程之间的关系。因此,在每个进程的进程地址空间中,用户空间是属于当前进程的,每个进程看到的代码和数据是完全不同的,但内核空间所存放的都是操作系统的代码和数据,所有进程看到的都是一样的内容。
虽然每个进程都能够看到操作系统,但并不意味着每个进程都能够随时对其进行访问。

【Linux】进程信号_第36张图片

如何理解进程切换

在当前进程的进程地址空间中的内核空间,找到操作系统的代码和数据。
执行操作系统的代码,将当前进程的代码和数据剥离下来,并换上另一个进程的代码和数据。

2、内核态与用户态

  • 内核态通常用来执行操作系统的代码,是一种权限非常高的状态。
  • 用户态是一种用来执行普通用户代码的状态,是一种受监管的普通状态。

进程收到信号之后,并不是立即处理信号,而是在合适的时候,这里所说的合适的时候实际上就是指,从内核态切换回用户态的时候。

(1)内核态和用户态之间的切换

i、内核态切换到用户态

系统调用返回时。
进程切换完毕。
异常、中断、陷阱等处理完毕。

ii、用户态切换到内核态

需要进行系统调用时。
当前进程的时间片到了,导致进程切换。
产生异常、中断、陷阱等。

其中,由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时,本质上是因为我们需要执行操作系统的代码,比如系统调用函数是由操作系统实现的,我们要进行系统调用就必须先由用户态切换为内核态。

(2)内核如何实现信号的捕捉

当我们在执行主控制流程的时候,可能因为某些情况而陷入内核,当内核处理完毕准备返回用户态时,就需要进行信号pending的检查
在查看pending位图时,如果发现有未决信号,并且该信号没有被阻塞,那么此时就需要该信号进行处理。
如果待处理信号的处理动作是默认或者忽略,则执行该信号的处理动作后清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,从主控制流程中上次被中断的地方继续向下执行即可。

【Linux】进程信号_第37张图片

但如果待处理信号是自定义捕捉的,即该信号的处理动作是由用户提供的,那么处理该信号时就需要先返回用户态执行对应的自定义处理动作,执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,继续执行主控制流程的代码。
sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程。
【Linux】进程信号_第38张图片

i、记忆方式

直线与这个正无穷的交线有几个交点就几次切换,箭头的方向就代表着此次状态切换的方向,图形中间的圆点就代表着检查pending表。
【Linux】进程信号_第39张图片

ii、当识别到信号的处理动作是自定义时,能直接在内核态执行用户空间的代码吗

理论上是可以实现的,但是是绝对不允许的。
很好理解,倘若可以在内核态执行用户空间的代码,那么会不会有非法操作?假如在内核态有一个非法操作是将其数据库都删掉了,那么这可恢复不了了,因为内核态的权限是足够大的。虽然在用户态时没有足够的权限做到清空数据库,但是如果是在内核态时执行了这种非法代码,那么数据库就真的被清空了,因为内核态是有足够权限清空数据库的。
也就是说,不能让操作系统直接去执行用户的代码,因为操作系统无法保证用户的代码是合法代码,即操作系统不信任任何用户。

(3)sigaction

捕捉信号除了用前面用过的signal函数之外,我们还可以使用sigaction函数对信号进行捕捉,sigaction函数的函数原型如下:

int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
i、参数说明

signum代表指定信号的编号。
若act指针非空,则根据act修改该信号的处理动作。
若oldact指针非空,则通过oldact传出该信号原来的处理动作。

其中,参数act和oldact都是结构体指针变量,该结构体的定义如下:

struct sigaction 
{
	void(*sa_handler)(int);
	void(*sa_sigaction)(int, siginfo_t *, void *);
	sigset_t   sa_mask;
	int        sa_flags;
	void(*sa_restorer)(void);
};
(i)结构体的第一个成员sa_handler
  • 将sa_handler赋值为常数SIG_IGN传给sigaction函数,表示忽略信号。
  • 将sa_handler赋值为常数SIG_DFL传给sigaction函数,表示执行系统默认动作。
  • 将sa_handler赋值为一个函数指针,表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数。

注意: 所注册的信号处理函数的返回值为void,参数为int,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然这是一个回调函数,不是被main函数调用,而是被系统所调用。

(ii)结构体的第二个成员sa_sigaction

sa_sigaction是实时信号的处理函数。

(iii)结构体的第三个成员sa_mask

首先需要说明的是,当某个信号的处理函数被调用,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。
如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时,自动恢复原来的信号屏蔽字。

(iv)结构体的第四个成员sa_flags

sa_flags字段包含一些选项,这里直接将sa_flags设置为0即可。

(v)结构体的第五个成员sa_restorer

不用。

ii、使用

下面我们用sigaction函数对2号信号进行了捕捉,将2号信号的处理动作改为了自定义的打印动作,并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作。

#include
#include 
#include 
#include 
using namespace std;
struct sigaction act, oldact;
void handler(int signo)
{
    cout << "get a signo#" << signo << endl;
    sigaction(2, &oldact, NULL);
}
int main()
{
    memset(&act, 0, sizeof(act));
	memset(&oldact, 0, sizeof(oldact));
    act.sa_handler = handler;
    act.sa_flags = 0;
    sigemptyset(&act.sa_mask);
    sigaction(2, &act, &oldact);
    while(1)
    {
        cout << "I am a process..." << endl;
        sleep(1);
    }
    return 0;
}

【Linux】进程信号_第40张图片

3、可重入函数

下面主函数中调用insert函数向链表中插入结点node1,某信号处理函数中也调用了insert函数向链表中插入结点node2,我们应该得到的是下面的结构,head连node1,node1连node2,node2连后面的结点。

【Linux】进程信号_第41张图片

而实际上肯定不是这样的,我们简单来分析一下:
对于下面的链表结点:
【Linux】进程信号_第42张图片

1、main函数中调用了insert函数,想将结点node1插入链表,但插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回到用户态之前检查到有信号待处理,于是切换到sighandler函数。而sighandler函数中也调用了insert函数,将结点node2插入到了链表中,插入操作完成第一步后的情况如下:
【Linux】进程信号_第43张图片

2、当结点node2插入的两步操作都做完之后从sighandler返回内核态,此时链表的布局如下:

【Linux】进程信号_第44张图片

3、再次回到用户态就从main函数调用的insert函数中继续往下执行,即继续进行结点node1的插入操作。
【Linux】进程信号_第45张图片

结果是,main函数和sighandler函数先后向链表中插入了两个结点,但最后只有node1结点真正插入到了链表中,而node2结点就再也找不到了,造成了内存泄漏

在这里插入图片描述
insert函数被不同的控制流调用(main函数和sighandler函数使用不同的堆栈空间,它们之间不存在调用与被调用的关系,是两个独立的控制流程),有可能在第一次调用还没返回时就再次进入该函数,我们将这种现象称之为重入
而insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数我们称之为不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称之为可重入(Reentrant)函数

如果一个函数符合以下条件之一则是不可重入的
调用了malloc或free,因为malloc也是用全局链表来管理堆的。
调用了标志I/O库函数,因为标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

4、volatile

volatile是C语言的一个关键字,该关键字的作用是保持内存的可见性。

我们将2号信号进行捕捉,当进程收到2号信号后会将全局变量flag由0置1。也就是说,在进程收到2号信号之前,该进程会一直处于死循环状态,直到收到2号信号时将flag置1才能够正常退出。

#include
#include
#include
using namespace std;
int flag = 0;
void handler(int signo)
{
    cout << "get a signal is#" << signo << endl;
    flag = 1;
}
int main()
{
    signal(2, handler);
    cout << "process beginning" << endl;
    while(!flag)
    {
        // 什么也不做
    }
    cout << "process exit..." << endl;
    return 0;
}

【Linux】进程信号_第46张图片
看着好像是那么回事,但是,有个打错特错的地方,我们进行画图分析:
代码中的main函数和handler函数是两个独立的执行流,而while循环是在main函数当中的,在编译器编译时只能检测到在main函数中对flag变量的使用。
此时编译器检测到在main函数中并没有对flag变量做修改操作,在编译器优化级别较高的时候,就有可能将flag设置进寄存器里面。
此时main函数在检测flag时只检测寄存器里面的值,而handler执行流只是将内存中flag的值置为1了,那么此时就算进程收到2号信号也不会跳出死循环。
【Linux】进程信号_第47张图片

在编译代码时携带-O3选项使得编译器的优化级别最高,此时再运行该代码,就算向进程发生2号信号,该进程也不会终止。

【Linux】进程信号_第48张图片

面对这种情况,我们就可以使用volatile关键字对flag变量进行修饰,告知编译器,对flag变量的任何操作都必须真实的在内存中进行,即保持了内存的可见性。

#include
#include
#include
using namespace std;
volatile int flag = 0;
void handler(int signo)
{
    cout << "get a signal is#" << signo << endl;
    flag = 1;
}
int main()
{
    signal(2, handler);
    cout << "process beginning" << endl;
    while(!flag)
    {
        // 什么也不做
    }
    cout << "process exit..." << endl;
    return 0;
}

【Linux】进程信号_第49张图片

5、SIGCHLD信号

为了避免出现僵尸进程,父进程需要使用wait或waitpid函数等待子进程结束,父进程可以阻塞等待子进程结束,也可以非阻塞地查询的是否有子进程结束等待清理,即轮询的方式。采用第一种方式,父进程阻塞就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。
其实,子进程在终止时会给父进程发生SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理动作,这样父进程就只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait或waitpid函数清理子进程即可。

#include 
#include 
#include 
#include 
#include 
using namespace std;
void handler(int signo)
{
    cout << "get a signal#" << signo << endl;
	int ret = 0;
	while ((ret = waitpid(-1, NULL, WNOHANG)) > 0)
    {
        cout << "wait child" << ret << "sucess" << endl;
	}
}
int main()
{
	signal(SIGCHLD, handler);
    pid_t id = fork();
	if (id == 0)
    {
		//child
        cout << "child is running, begin dead#" << getpid() << endl;
		sleep(3);
		exit(1);
	}
	//father
	while (1);
	return 0;
}
  • SIGCHLD属于普通信号,记录该信号的pending位只有一个,如果在同一时刻有多个子进程同时退出,那么在handler函数当中实际上只清理了一个子进程,因此在使用waitpid函数清理子进程时需要使用while不断进行清理。
  • 使用waitpid函数时,需要设置WNOHANG选项,即非阻塞式等待,否则当所有子进程都已经清理完毕时,由于while循环,会再次调用waitpid函数,此时就会在这里阻塞住。

【Linux】进程信号_第50张图片

事实上,由于UNIX的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的,但这是一个特列。此方法对于Linux可用,但不保证在其他UNIX系统上都可用。

下面代码中调用signal函数将SIGCHLD信号的处理动作自定义为忽略。

#include 
#include 
#include 
#include 
using namespace std;
int main()
{
	signal(SIGCHLD, SIG_IGN);
    pid_t id = fork();
	if (id == 0)
    {
		//child
        cout << "child is running, child dead:" << getpid() << endl;
		sleep(3);
		exit(1);
	}
	//father
	while (1);
	return 0;
}

此时子进程在终止时会自动被清理掉,不会产生僵尸进程,也不会通知父进程。
【Linux】进程信号_第51张图片

你可能感兴趣的:(Linux,linux,运维,服务器,c++)