深入探索 Linux 进程信号的奥秘

Linux 进程信号

  • 0 查看IPC(进程间通信)资源的指令
  • 1 学习进程信号的过程
  • 2 Linux 进程信号的基本概念
    • 2.1 对信号的基本认知
  • 3 Linux 进程信号的产生方式
  • 4 Linux 进程信号的保存和处理
  • 5 Linux 进程信号递达
  • 6 volatile关键字

0 查看IPC(进程间通信)资源的指令

ipcs -m : 查看共享内存

深入探索 Linux 进程信号的奥秘_第1张图片
ipcs -s 查看信号量

深入探索 Linux 进程信号的奥秘_第2张图片
ipcs -q 查看消息队列

深入探索 Linux 进程信号的奥秘_第3张图片
删除进程间通信资源

  • ipcrm -m : 查看共享内存
  • ipcrm -q : 删除消息队列
  • ipcrm -s : 删除信号量

1 学习进程信号的过程

深入探索 Linux 进程信号的奥秘_第4张图片

2 Linux 进程信号的基本概念

2.1 对信号的基本认知

从生活角度来讲

  • 你在网上买了很多件商品,再等待不同商品快递的到来。但即便快递没有到来,你也知道快递来临时,你该怎么处理快递。也就是你能“识别快递”
  • 当快递员到了你楼下,你也收到快递到来的通知,但是你正在打游戏,需5min之后才能去取快递。那么在在这5min之内,你并没有下去去取快递,但是你是知道有快递到来了。也就是取快递的行为并不是一定要立即执行,可以理解成“在合适的时候去取”。
  • 在收到通知,再到你拿到快递期间,是有一个时间窗口的,在这段时间,你并没有拿到快递,但是你知道有一个快递已经来了。本质上是你“记住了有一个快递要去取”
  • 当你时间合适,顺利拿到快递之后,就要开始处理快递了。而处理快递一般方式有三种:1. 执行默认动作(幸福的打开快递,使用商品)2. 执行自定义动作(快递是零食,你要送给你你的女朋友)3. 忽略快递(快递拿上来之后,扔掉床头,继续开一把游戏)
  • 快递到来的整个过程,对你来讲是异步的,你不能准确断定快递员什么时候给你打电话

从技术角度
用户输入命令,在Shell下启动一个前台进程。

  1. 用户按下Ctrl-C ,这个键盘输入产生一个硬件中断,被OS获取,解释成信号,发送给目标前台进程
  2. 前台进程因为收到信号,进而引起进程退出

如下代码
深入探索 Linux 进程信号的奥秘_第5张图片
深入探索 Linux 进程信号的奥秘_第6张图片

从这两个角度来看,进程就是我,操作系统就是快递员,信号就是快递

注意

  1. Ctrl + c 产生的信号只能发给前台进程,当 “命令” + & 可以把进程放到后台运行,这样 Shell 就不必等待进程结束就可以接受新的命令,启动新的进程。
  2. Shell 可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接受到 Crtl + c这样的控制键产生的信号。使用 bg 可以把前台进程转为后台进程 fg 可以把后台进程转为前台进程
  3. 前台进程在运行过程中用户随时可能按下 Ctrl-C 而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都有可能收到 SIGINT 信号而终止,所以信号相对于进程的控制流程来说是异步(Asynchronous)的。

信号概念

  • 信号是进程之间事件异步通知的一种方式,属于软中断。

用kill -l命令可以察看系统定义的信号列表
深入探索 Linux 进程信号的奥秘_第7张图片

  • 每个信号都有一个编号和一个宏定义名称,这些宏定义可以在signal.h中找到,例如其中有定 义 #define SIGINT 2
  • 编号34以上的是实时信号,我们只讨论编号34以下的信号,不讨论实时信号。

信号处理常见方式

  • 忽略此信号。
  • 执行该信号的默认处理动作,例如 Ctrl + c 终止进程
  • 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕(Catch)一个信号。

3 Linux 进程信号的产生方式

  1. 通过终端按键产生信号

SIGINT的默认处理动作是终止进程,SIGQUIT的默认处理动作是终止进程并且Core Dump,现在我们来验证一下。

Core Dump 核心转储

当一个进程异常终止时,可以选择把进程的用户空间内存数据的全部保存到磁盘上,叫 Core Dump。进程异常终止通常因为有Bug,比如非法存访问导致段错误,事后可以用调试器检查 core 文件以查清错误原因,这就叫做Post-mortem Debug(事后调试)。一个进程允许产生多大的 Core 文件取决于进程的 resource Limit (保存在PCB里)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。首先用ulimit命令改变Shell进程的Resource Limit,允许core文件最大为1024K:ulimit -c 1024

深入探索 Linux 进程信号的奥秘_第8张图片
深入探索 Linux 进程信号的奥秘_第9张图片
深入探索 Linux 进程信号的奥秘_第10张图片
深入探索 Linux 进程信号的奥秘_第11张图片

  1. 调用系统函数向进程发信号

在后台执行死循环程序,然后用kill命令给它发SIGSEGV信号,指定发送某种信号的kill命令可以有多种写法,上面的命令还可以写成 kill -SIGSEGV 进程id 或 kill -11 进程id , 11是信号SIGSEGV的编号。以往遇 到的段错误都是由非法内存访问产生的,而这个程序本身没错,给它发SIGSEGV也能产生段错误。
还有3个系统调用函数可以实现向进程发信号,kill raise abort
kill
深入探索 Linux 进程信号的奥秘_第12张图片
raise
深入探索 Linux 进程信号的奥秘_第13张图片
abort
深入探索 Linux 进程信号的奥秘_第14张图片

  1. 由软件条件产生信号

SIGPIPE是一种由软件条件产生的信号,在进程的通信的管道中已经介绍过了。本节主要介绍alarm函数和 SIGALRM信号。
深入探索 Linux 进程信号的奥秘_第15张图片
调用alarm函数可以设定一个闹钟,也就是告诉内核在seconds秒之后给当前进程发SIGALRM信号, 该信号的默认处理动作是终止当前进程。

深入探索 Linux 进程信号的奥秘_第16张图片

  1. 硬件异常产生信号

硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号。例如当前进程执行了除以0的指令,CPU的运算单元会产生异常,内核将这个异常解释 为SIGFPE信号发送给进程。再比如当前进程访问了非法内存地址,MMU会产生异常,内核将这个异常解释为SIGSEGV信号发送给进程。

模拟野指针异常

深入探索 Linux 进程信号的奥秘_第17张图片
深入探索 Linux 进程信号的奥秘_第18张图片

异常被捕获,并被自定义处理
深入探索 Linux 进程信号的奥秘_第19张图片
深入探索 Linux 进程信号的奥秘_第20张图片
由此可以确认,我们在C/C++当中除零,内存越界等异常,在系统层面上,是被当成信号处理的。
总结一下,有几个问题会在后面的知识里呈现

  1. 上面所说的所有信号产生,最终都要OS来执行,为什么?OS 是进程的管理者
  2. 信号的处理是否是立即处理的呢?不是的,是在合适的时候,而且需要被进程所记录
  3. 信号产生有4种方式,所有信号必须经过操作系统才可以发出,因为操作系统内核是进程的管理者。
  4. 野指针导致的段错误的底层原因:MMU 在页表地址映射的时候(虚拟地址<=====>物理地址),可能这个虚拟地址在页表里并不存在,或者存在但是映射到了内存中只读的位置,操作系统内核一旦发现这个问题就形成信号干掉进程。
  5. 一个进程在没有收到信号的时候能否知道,自己应该对合法信号作何处理。

4 Linux 进程信号的保存和处理

信号在进程的PCB里保存,用一个无符号数的位图来保存,比特位的位置代表是哪个信号,比特位的内容代表是否收到此信号,那么操作系统是如何给进程发(其实是写信号)信号的呢?kill -8 进程ID ==> 把进程里的位图的第8位改为1,那么进程执行信号的行为。

深入探索 Linux 进程信号的奥秘_第21张图片
信号的相关术语

  • 实际执行信号的处理动作称为信号递达(Delivery)
  • 信号从产生到递达之间的状态称为未决(Pending)
  • 进程可以**阻塞(屏蔽)(Block)**某个信号。
  • 阻塞(屏蔽)的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作
  • 注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是递达之后可选的一种处理动作

信号在内核中的表示
深入探索 Linux 进程信号的奥秘_第22张图片

  • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
  • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
  • SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。

sigset_t

  • 从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。
  • 因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号
  • 的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。
  • 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略

信号集操作函数

  • sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现
  • 从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的

深入探索 Linux 进程信号的奥秘_第23张图片

  • 函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含 任何有效信号。
  • 函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置1,表示 该信号集的有效信号包括系统支持的所有信号。
  • 注意,在使用sigset_ t类型的变量之前,一定要调 用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。
  • 这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种 信号,若包含则返回1,不包含则返回0,出错返回-1。

处理阻塞信号集和未决信号集的相关接口
sigprocmask : 读取或者更改进程的信号屏蔽字(阻塞信号集)
深入探索 Linux 进程信号的奥秘_第24张图片

  • 如果oldset 是非空指针,则读取进程的当前进程的信号屏蔽字通过oldset 参数传出。如果 set 为非空指针,则更改进程的 信号屏蔽字,参数 how 是修改方式。如果set 和oldset都是非空指针,则先将原来的信号屏蔽字备份到 oldset里,然后根据set 和 how 参数更改信号屏蔽字。假设当前的信号屏蔽字是mask,下面说明how参数的可选值。
  • SIG_BLOCK :set 包含了我们希望添加到当前信号屏蔽字的信号,相当于 mask = mask | set
  • SIG_UNBLOCK : set 包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当于 mask = mask &~set
  • SIG_SETMASK :设置当前信号屏蔽字为 set 所指向的值,相当于 mask = set
  • 如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达

sigpending : 读取当前进程的未决信号集听过输出型参数传出
深入探索 Linux 进程信号的奥秘_第25张图片
一段有意思的代码
深入探索 Linux 进程信号的奥秘_第26张图片
深入探索 Linux 进程信号的奥秘_第27张图片
深入探索 Linux 进程信号的奥秘_第28张图片

5 Linux 进程信号递达

进程信号递达的3种方式

  1. 默认
  2. 忽略
  3. 自定义捕获

相应的系统调用接口介绍
深入探索 Linux 进程信号的奥秘_第29张图片
深入探索 Linux 进程信号的奥秘_第30张图片
深入探索 Linux 进程信号的奥秘_第31张图片

sigaction函数可以读取和修改与指定信号相关联的处理动作,调用成功则返回0,出错则返回- 1。signum 是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非 空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体:
结构体成员说明:将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函 数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么 它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项,代码都把sa_flags设为0,sa_sigaction是实时信号的处理函数,不详细解释这两个字段,有兴趣的小伙伴可以在了解一下。

sigaction的使用
深入探索 Linux 进程信号的奥秘_第32张图片

结果和signal函数是一样的,sigaction函数的功能比signal函数丰富一些

深入探索 Linux 进程信号的奥秘_第33张图片
信号是什么时候处理的呢?从内核态切换到用户态的时候

6 volatile关键字

站在信号的角度理解一下 volatile

Makefile
深入探索 Linux 进程信号的奥秘_第34张图片
test.c
深入探索 Linux 进程信号的奥秘_第35张图片
结果
深入探索 Linux 进程信号的奥秘_第36张图片

  • 标准情况下,键入 CTRL-C ,2号信号被捕捉,执行自定义动作,修改 quit=1 , while 条件不满足,退出循环,进程退出

我们在看编译器优化的情况
深入探索 Linux 进程信号的奥秘_第37张图片
结果
深入探索 Linux 进程信号的奥秘_第38张图片

  • 优化情况下,键入 CTRL-C ,2号信号被捕捉,执行自定义动作,修改 quit=1 ,但是 while 条件依旧满足,进程继续运行!但是很明显 quit 肯定已经被修改了,但是为何循环依旧执行?很明显, while 循环检查的quit ,并不是内存中最新的quit,这就存在了数据二异性的问题。 while 检测的quit其实已经因为优化,被放在了CPU寄存器当中。

给全局变量 quit 加关键字 volatile 修饰

深入探索 Linux 进程信号的奥秘_第39张图片
结果
在这里插入图片描述
可以得出结论

  • volatile 作用:保持内存的可见性,告知编译器,被该关键字修饰的变量,不允许被优化,对该变量的任何操作,都必须在真实的内存中进行操作

你可能感兴趣的:(linux,进程信号)