Linux系统编程 —时序竞态

时序竞态

什么是时序竞态?将同一个程序执行两次,正常情况下,前后两次执行得到的结果应该是一样的。但由于系统资源竞争的原因,前后两次执行的结果有可能得到不一样的结果,这个现象就是时序竞态

pause函数

函数原型:

int pause(void);

函数作用:

进程调用pause函数时,会造成进程主动挂起(处于阻塞状态,并主动放弃CPU),并且等待信号将其唤醒。

返回值:

我们知道,信号的处理方式有三种:1. 默认动作;2. 忽略处理;3. 捕捉。进程收到一个信号后,会先处理响应信号,再唤醒pause函数。于是有下面几种情况:

① 如果信号的默认处理动作是终止进程,则进程将被终止,也就是说一收到信号进程就终止了,pause函数根本就没有机会返回;

② 如果信号的默认处理动作是忽略,则进程将直接忽略该信号,相当于没收到这个信号,进程继续处于挂起状态,pause函数不返回;

③ 如果信号的处理动作是捕捉,则进程调用完信号处理函数之后,pause返回-1,errno设置为EINTR,表示“被信号中断”。

④ pause收到的信号不能被屏蔽,如果被屏蔽,那么pause就不能被唤醒。

因为alarm函数可以在设定的时间之后发送SIGALRM信号,pause函数又可以将进程挂起等待信号,则二者结合可以自己写一个sleep函数,如下:

 1#include 
 2#include 
 3#include 
 4
 5void sig_alrm(int signo)
 6{
 7    /* nothing to do */
 8}
 9
10unsigned int mysleep(unsigned int nsecs)
11{
12    unsigned int unslept;
13
14    signal(SIGALRM, &sig_alrm);
15    unslept = alarm(nsecs); 
16    pause();
17
18    return unslept;
19}
20
21
22int main(void)
23{
24    while(1){
25        mysleep(2);
26        printf("Two seconds passed\n");
27    }
28
29    return 0;
30}

时序竞态前导例

在讲时序竞态具体现象之前,我们先来看一个生活中常见的场景:

想午睡10分钟,于是定了个10分钟的闹钟,希望10分钟后闹钟将自己叫醒。

正常情况:定好闹钟,午睡,10分钟后闹钟叫醒自己;

异常情况:定好闹钟,躺下睡觉2分钟,被同学叫醒去打球,打了20分钟后回来继续睡觉。但在打球期间,闹钟早就响过了,将不会再唤醒自己。

这个例子与之后要讲的时序竞态有很大的相似之处。

时序竞态问题分析

我们再回过头来看上面所写的mysleep程序。这个函数有可能是下面的时序:

  1. SIGALRM默认动作是终止进程,因此我们要将其捕捉,对SIGALRM注册信号处理函数;

  2. 调用alarm(1)函数定时1秒钟;

  3. alarm(1)调用结束,定时器开始计时。就在这时,进程失去CPU,进入就绪态等待CPU(相当于被同学叫醒去打球)。失去CPU的方式有可能是内核调度了优先级更高的进程取代了当前进程,使得当前进程无法获得CPU;

  4. 我们知道,alarm函数如果采用自然定时法的话,定时器将一直计时,与进程状态无关。于是,1秒后,闹钟定时时间到,内核向当前进程发送SIGALRM信号。高优先级进程尚未执行完毕,当前进程仍然无法获得CPU,继续处于就绪态,信号无法处理(处于未决状态);

  5. 优先级高的进程执行完毕,当前进程获得CPU资源,内核调度回当前进程执行。SIGALRM信号递达,并被进程处理;

  6. 信号处理完毕后,返回当前主控流程,并调用pause()函数,挂起等待alarm函数发送的SIGALRM信号将自己唤醒;

  7. 但实际SIGALRM信号已经处理完毕,pause()函数永远不会等到。

解决时序竞态问题

通过以上时序分析,我们可以看出,造成时序竞态的原因就是SIGALRM信号在进程失去CPU的时候就已经发送过来。为了防止这个现象出现,我们可以先将该信号阻塞,将其“抓住”,再在解除阻塞的时候立刻调用pause函数挂起等待。这样即使在调用alarm就失去CPU,也可以在进程重新获得CPU时将抓到的SIGALRM信号重新“放出来”,并将之后的pause函数唤醒。

但在解除阻塞与pause等待挂起信号之间,还是有可能失去CPU,除非将这两个步骤做成一个“原子操作”。Linux系统提供的sigsuspend函数就具备这个功能。所以,在时序要求比较严格的场合下都应该使用sigsuspend函数,而非pause函数。

函数原型:

int sigsuspend(const sigset_t *mask);

函数作用:

挂起等待信号;

函数参数:

mask,传入参数,sigsuspend函数调用期间,进程信号屏蔽字由参数mask指定。

具体用法:可将某个信号(如SIGALRM)从临时信号屏蔽字mask中删除,也就是在调用sigsuspend函数时对该信号解除屏蔽,然后挂起等待信号。但我们此时已经改变了进程的信号屏蔽字,所以调用完sigsuspend函数之后,应将进程的信号屏蔽字恢复原样。

 1#include 
 2#include 
 3#include 
 4
 5void sig_alrm(int signo)
 6{
 7    /* nothing to do */
 8}
 9
10unsigned int mysleep(unsigned int nsecs)
11{
12    struct sigaction newact, oldact;
13    sigset_t newmask, oldmask, suspmask;
14    unsigned int unslept;
15
16    //1.为SIGALRM设置捕捉函数,一个空函数
17    newact.sa_handler = sig_alrm;
18    sigemptyset(&newact.sa_mask);
19    newact.sa_flags = 0;
20    sigaction(SIGALRM, &newact, &oldact);
21
22    //2.设置阻塞信号集,阻塞SIGALRM信号
23    sigemptyset(&newmask);
24    sigaddset(&newmask, SIGALRM);
25   sigprocmask(SIG_BLOCK, &newmask, &oldmask);   //信号屏蔽字 mask
26
27    //3.定时n秒,到时后可以产生SIGALRM信号
28    alarm(nsecs);
29
30    /*4.构造一个调用sigsuspend临时有效的阻塞信号集,
31     *  在临时阻塞信号集里解除SIGALRM的阻塞*/
32    suspmask = oldmask;
33    sigdelset(&suspmask, SIGALRM);
34
35    /*5.sigsuspend调用期间,采用临时阻塞信号集suspmask替换原有阻塞信号集
36     *  这个信号集中不包含SIGALRM信号,同时挂起等待,
37     *  当sigsuspend被信号唤醒返回时,恢复原有的阻塞信号集*/
38    sigsuspend(&suspmask); 
39
40    unslept = alarm(0);
41    //6.恢复SIGALRM原有的处理动作,呼应前面注释1
42    sigaction(SIGALRM, &oldact, NULL);
43
44    //7.解除对SIGALRM的阻塞,呼应前面注释2
45    sigprocmask(SIG_SETMASK, &oldmask, NULL);
46
47    return(unslept);
48}
49
50int main(void)
51{
52    while(1){
53        mysleep(2);
54        printf("Two seconds passed\n");
55    }
56
57    return 0;
58}

可重入函数/不可重入函数

一个函数在被调用执行期间尚未调用结束的时候,由于某种时序,该函数又被重复调用,这种情况称为「重入」。如果从信号处理程序返回,则继续执行进程断点处的正常指令序列,从重新恢复到断点重新执行的过程中,函数所依赖的环境没有发生改变,就说这个函数是可重入的,反之就是不可重入的。

如果要将函数做成可重入函数,则函数内不能含有全局变量及static变量,也不能使用malloc、free。

更多精彩内容,请关注公众号良许Linux,公众内回复1024可免费获得5T技术资料,包括:Linux,C/C++,Python,树莓派,嵌入式,Java,人工智能,等等。公众号内回复进群,邀请您进高手如云技术交流群。


公众号:良许Linux

有收获?希望老铁们来个三连击,给更多的人看到这篇文章

你可能感兴趣的:(Linux系统编程 —时序竞态)