原文链接 : http://computer.uoh.edu.cn/c/9412.html , 请多多支持原作者.谢谢!!!
另推荐阅读 : http://blog.csdn.net/pi9nc/article/details/37043123#comments
虚假唤醒
最近在使用Linux条件变量的时候,经过反复测试发现,pthread_cond_signal有时候会唤起多个正在pthread_cond_wait的线程。后来通过查阅IEEE Std 1003.1, 2004中关于pthread_cond_signal虚假唤醒(spurious wakeup)的解释如下:
On a multi-processor, it may be impossible for an implementation of pthreadcondsignal() to avoid the unblocking of more than one thread blocked on a condition variable.
根据这个解释,在多处理器系统上,pthread_cond_signal是很有可能唤醒多个pthread_cond_wait()的线程。也就意味着当一个线程中,pthread_cond_wait()返回的时候,不一定代表条件已经满足了,需要在程序中做额外的判断来检测是否真的已经满足条件了:
1 pthread_mutex_lock(&lock);
2 while (condition_is_false) {
3 pthread_cond_wait(&cond, &lock);
4 }
5 pthread_mutex_unlock(&lock);
事实上,IEEE Std 1003.1, 2004中有提到,虚假唤醒(spurious wakeup)是被允许的,而且鼓励程序开发者在pthread_cond_wait()返回的时候对条件进行重新检查,只有在条件满足的情况下才继续往下执行,否则就需要继续等待了。
关于多处理器系统出现虚假唤醒(sprious wakeup)的原因,我的理解是因为多处理器上,多线程共享的数据需要在多核处理器上cache进行更新和拷贝的原因。关于多核多线程请参考《利用多核多线程进行程序优化》
消息遗漏
对于pthread_cond_signal或者pthread_cond_broadcast来说,除了需要在pthread_cond_wait()返回的时候,重新对条件进行检查和评估以外,还有一件事情就是需要解决消息遗漏的问题。
根据pthread_cond_wait的定义,需要在pthread_cond_wait调用前后必须进行加锁和解锁操作。原因是因为如果在一个线程调用pthread_cond_wait的过程中但未进入block状态,此时有线程调用了pthread_cond_signal或者pthread_cond_broadcast,那么此次消息将被遗漏掉,因为没有任何线程在pthread_cond_wait的block状态。在pthread_cond_wait的实现内部,首先会解锁,然后进入block状态,解锁和进入block必须合并成一个原子操作,这样就保证了在pthread_cond_wait之后调用的pthread_cond_signal不会被以后掉。
但是对于多线程来说,pthread_cond_wait不能保证一定在pthread_cond_signal之后执行,也就意味着,当pthread_cond_wait进入block之后,已经错过了pthread_cond_signal。因为已经错过了pthread_cond_signal,很有可能会导致该线程永远block下去。通常这类问题的解决办法是设置一个pthread_cond_signal或者pthread_cond_broadcast的计数器count,在调用pthread_cond_wait之前先对这个count进行判断,如果count != 0 则说明已经错过了消息,可以不用等待,直接往下执行即可:
1 if (!count) {
2 pthread_mutex_lock(&lock);
3 while (condition_is_false) {
4 pthread_cond_wait(&cond, &lock);
5 }
6 pthread_mutex_unlock(&lock);
7 }