上一篇我们讲述了信号的基本概念和相应系统接口的使用,本章我们想更深入的学习信号发送的一系列过程,目标已经确定,接下来就要搬好小板凳,准备开讲了…
handler
表可以理解为是一个函数指针数组。
block
叫做阻塞信号集。阻塞信号集(Block Signal Set)和信号屏蔽字(Signal Mask)是指相同的概念。
block
也是一个位图,位图结构和pending
位图是一模一样的。pending
表里代表的是,是否收到内容,在block
表中代表是否阻塞该信号。block
位图对应的比特位,为1的时候会拦截对应的信号去执行对应的方法。即使pending
收到了该信号,只要是block
位图对应的比特位为1,那么这个信号就无法去递达。
阻塞和忽略有什么区别呢?
忽略信号是处理信号的一种,只不过处理的方式是忽略它。(就是什么都不做,将pending位图由1置0就完了)
补充:
- 在Linux中, 普通信号(非实时信号)多次发送并不会被记录多次。当同一个信号被多次发送给进程时,操作系统只会在进程的信号处理程序中记录次,而不会累积多个相同的信号。
- 当进程接收到一个信号时,操作系统会将该信号标记为已挂起,直到进程处理完当前正在处理的信号或者通过信号处理程序返回后,才会再次传递给进程。
- 这意味着,如果进程在处理信号期间接收到了多个相同的信号, 那么只有一 个信号会被记录和传递给进程的信号处理程序。
例如:多次发送二号信号,只有一个会被递达,多余发出的信号被丢弃掉了。
sigset_t
是操作系统专门针对信号所构建的用户级的数据类型。
sigset_ t
类型称之为信号集。
pending
起来,或者未决起来。sigset_t
不能手动修改进制位图,要用对应的接口。#include
int sigemptyset(sigset_t *set);
对信号集做清空,可以理解为全清零。
int sigfillset(sigset_t *set);
对信号集全置1。
int sigaddset (sigset_t *set, int signo);
在特定的信号集当中,将特定的信号加进来。
int sigdelset(sigset_t *set, int signo);
在特定的信号集当中,将特定的信号去掉。
int sigismember(const sigset_t *set, int signo);
判断特定的一个信号,是否在该集合当中。
这一批接口,就是针对于位图结构天然设计好的各种各样的增删差改的操作。
sigprocmask
: signal
- 信号,process
- 进程,mask
- 掩码的意思。
#include
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
// 返回值:若成功则为0,若出错则为-1
可以理解成old
或者是output
,将老的信号屏蔽字返回出来,目的是为了将来的恢复需求。
这个函数第一个参数就决定了要做什么操作:
pending
信号集。set
参数传出,调用成功则返回0,出错则返回-1。综上几个接口,我们用代码演示一下:
#include
#include
#include
#include
#include
#include
#include
using namespace std;
void handler(int signo)
{
// sleep(1);
cout << "我是一个进程,刚刚获取了一个信号: " << signo << endl;
// exit(1);
}
static void showPending(sigset_t* pendings)
{
for (int sig = 1; sig <= 31; sig++)
{
// 检测这31个信号是否在这个集合里
if (sigismember(pendings, sig))
{
cout << '1';
}
else
{
cout << '0';
}
}
cout << endl;
}
int cnt = 0;
int main()
{
// 3. pending收到信号很快就递达了,所以先block,这样就能看到pending表里的信号了
// 屏蔽二号信号
sigset_t bsig, obsig;
sigemptyset(&bsig);
sigemptyset(&obsig);
// 3.1 添加2号信号到信号屏蔽字中
sigaddset(&bsig, 2);
// 3.2 设置用户级的信号屏蔽字到内核中,让当前进程屏蔽掉2号信号
sigprocmask(SIG_SETMASK, &bsig, &obsig);
// 2. signal将二号信号进行自定义捕捉
signal(2, handler);
// 1. 不断获取当前进程的pending信号集
// 表示当前进程的所有pending信号
sigset_t pendings;
while (true)
{
// 1.1 清空信号集
sigemptyset(&pendings);
// 1.2 获取当前进程(谁调用,获取谁)的pending信号集
if (sigpending(&pendings) == 0)
{
// 获取成功
// 1.3 打印一下当前进程的pending信号集
showPending(&pendings);
}
sleep(1);
// 先跑十秒钟,再解除屏蔽
cnt++;
if (cnt == 10)
{
cout << "解除对所有信号的block...." << endl;
sigset_t sigs;
sigemptyset(&sigs);
sigaddset(&sigs, 2);
// 只对2号解除屏蔽
// sigprocmask(SIG_UNBLOCK, &sigs, nullptr);
// 解除全部信号屏蔽
sigprocmask(SIG_SETMASK, &obsig, nullptr);
}
}
return 0;
}
演示结果:
进程收到了信号该如何处理呢?
进程处理信号,不是立即处理的:
信号可能不是立即处理的,可能当前进程做着更重要的事情。 是在合适的时候处理的。
具体在什么时候处理呢?
每一个进程都有一个内核空间,用于内核级页表的映射:
内核页表:
用户级页表:
内核态vs用户态:
OS在不在内存中被加载呢??在!
当前进程如何具备权力,访问这个内核页表,乃至访问内核数据呢?
我怎么知道我是用户态的还是内核态的呢?
0是内核态
,3是用户态
。普通用户的身份是无法访问到操作系统中的任何数据的。
补充:
- 当我们想调用某些系统调用的时候,这些系统调用的代码,实际上在执行时,除了要跳转到目标函数之外,还要
陷入内核
就是通过计算机帮我们直接去执行某些寄存器操作,将CR3寄存器权限标志位由3 (用户态)改为0(内核态),操作系统当在进行身份认证的时候,发现是0就有权访问,否则就不能访问。
- 当把操作系统的代码执行完,准备返回的时候,返回时CPU内的级别再由0被改成了3再返回代码处继续执行。
达成的共识:
最终的认识:
3~4G
的内核空间是完全一样的,所以任何进程经过身份切换都可以,变成内核态去执行操作系统的代码。0~3G
的数据,更高的访问不了。补充:
我们的程序,会无数次直接或者间接的访问系统级软硬件资源(管理者是OS),本质上,你并没有自己去操作这些软硬件资源,而是必须通过OS -> 无数次的陷入内核(1.切换身份 2.切换页表) -> 调用内核的代码 -> 完成访问的动作 -> 结果返回给用户(1.切换身份 2.切换页表) -> 得到结果。
例如:
while(1); -> 必须有自己的时间片 -> 时间片到了的时候 -> 内核态,更换内核级页表 -> 保护上下文,执行调度算法 -> 选择了新的进程 -> 恢复新进程的上下文 -> 用户态,更换成用户级页表 -> CPU执行的就是新进程的代码!
什么是陷入内核:
- 在Linux中,"陷入内核"是指用户程序或进程进入内核空间执行的一种状态。当用户程序需要执行特权操作或需要访问受限资源时,例如打开文件、创建进程等,就会触发一个系统调用来请求内核的帮助。
- 当一个用户程序调用系统调用时,CPU会从用户态切换到内核态,进入内核空间执行相应的内核代码。在内核态下,用户程序可以访问受限资源并执行特权操作。这种切换是通过将用户程序的上下文保存起来,并加载内核的上下文来实现的。
- 一旦用户程序陷入内核,它会执行内核提供的相关功能,并等待内核完成请求的操作后返回结果。完成后,CPU会从内核态切换回用户态,并将结果返回给用户程序继续执行。
- 通过将用户程序和内核区分开来,Linux实现了安全性和稳定性的目标。用户程序无法直接访问和修改内核的数据结构,这样可以避免用户程序对系统造成破坏。同时,内核提供了一套系统调用接口,使得用户程序能够通过请求内核来获取系统资源和执行特权操作。
进程的生命周期中,会有很多次机会去陷入内核(中断,陷阱,系统调用,异常…),一定会存在很多次的机会进行内核态返回用户态
!
open调用一定会陷入内核~
调用接口执行open
的代码。
sturct file
结构。inode
,以及该文件所对应的路径信息全部都设置好。实际上操作系统,在准备返回之前(open继续向后执行之前),其实不是简单的返回了,而是返回之前先查,查进程的信号列表。
为什么自定义方法只能用用户身份来执行?
为什么不在自定义方法调用结束时直接返回?
处理完走到内核当中,在内核里面特定的系统调用,特定的系统返回,把代码寄存器状态等方面恢复出来,让它继续跑到当前进程的代码里继续执行。
pending和block都为0:
pending和block都是1:
pending为1,block是0:(默认)
pending为1,block为0:(忽略)
SIG_IGN
,就是忽略。这个函数除了能处理普通信号,实时信号也能处理。
sigaction
函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回-1。
我们不考虑实时信号,所以有些字段我们不考虑:
#include
#include
#include
using namespace std;
void handler(int signo)
{
cout << "获取到一个信号,信号编号是: " << signo << endl;
sigset_t pending;
// 永远都会正在处理2号信号
while (true)
{
cout << "." << endl;
sigpending(&pending);
for (int i = 1; i <= 31; i++)
{
if (sigismember(&pending, i))
cout << '1';
else
cout << '0';
}
cout << endl;
sleep(1);
}
}
int main()
{
struct sigaction act, oact;
act.sa_handler = handler;
// act.sa_handler = SIG_IGN;
// act.sa_handler = SIG_DFL;
act.sa_flags = 0;
sigemptyset(&act.sa_mask);
// 三号信号拦截
sigaddset(&act.sa_mask, 3);
// 对二号信号的捕捉
sigaction(2, &act, &oact);
// sigaction的更大意义在于,当我们在做信号处理时
// 操作系统不允许嵌套式的递归式的处理多个信号。
while (true)
{
cout << "main running" << endl;
sleep(1);
}
return 0;
}
sa_mask
字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。原因:
- 通过将当前信号加入信号屏蔽字,内核确保在信号处理函数执行期间,同一信号不会再次中断进程。
- 这种机制是必要的,因为信号处理函数是在异步上下文中执行的,即当信号发生时,处理函数会立即执行,而不管进程当前正在进行什么操作。
- 如果不使用信号屏蔽字来屏蔽同一信号的再次中断,就可能导致信号处理函数被递归调用,而且多个信号处理函数同时执行,可能会引起不可预测的行为或系统崩溃。
一直处理某个信号,查看pending表:
看下面一段代码:
#include
#include
// 保持内存的可见性,每次做检测必须从内存里拿
volatile int flags = 0;
void handler(int signo)
{
printf("更改flags: 0->1\n");
flags = 1;
}
int main()
{
signal(2, handler);
while (!flags);
printf("进程是正常退出的!\n");
return 0;
}
如果上述代码不带上volatile
,则不同编译器会有不同的结果:
gcc test.c -o test -O2
main
执行流里发现没有对falgs
做任何修改。flags
值优化到寄存器里,从此往后再做while
循环检测时候,只做一件事,从这个寄存器里做数据读取,所以这个寄存器里的值永远不会被修改了。
volatile
关键字,告诉编译器,不准对flags
做任何优化,每次CPU计算的时候,拿内存中的数据,都必须在内存中拿!!
volatile
和const
可以同时修饰一个变量。
SIGCHLD
信号!!#include
#include
#include
using namespace std;
void handler(int signo)
{
cout << "子进程退出啦,我确实收到了信号: " << signo << " 我是: " << getpid() << endl;
}
int main()
{
signal(SIGCHLD, handler);
pid_t id = fork();
if (id == 0)
{
while (true)
{
cout << "我是子进程: " << getpid() << endl;
sleep(1);
}
exit(0);
}
// parent
while (true)
{
cout << "我是父进程: " << getpid() << endl;
sleep(1);
}
}