http://www.yuanma.org/data/2007/1108/article_2883.htm
当解决多线程互斥同步的问题时,经常会有如下几个问题:
1. 在一个给定的问题中,需要多少个Mutex,多少个Semaphore?有什么规律?
2. 在对临界区加锁和等待信号量的顺序上有什么要求和规律?
3. 什么样操作适合放在临界区,什么样的不适合?
下面就生产者和消费者问题来分析一些这几个问题.
下面是一个简单的实现程序:
生产者向数组sharedArray中写入数据,而消费者从该数组中读取数据.
#include <stdio.h>
#include <pthread.h>
#include <semaphore.h>
#include <stdlib.h>
#define MAXSIZE 5 /*共享缓冲区的大小*/
int sharedArray[MAXSIZE]; /*sharedArray是共享缓冲区*/
int curr=-1; /*curr是用来指定sharedArray当前存有数据的最大位置*/
/*注意,sharedArray和curr都属于共享数据*/
int empty=0;
int full=MAXSIZE;
pthread_mutex_t sharedMutex=PTHREAD_MUTEX_INITIALIZER; /*锁定临界区的mutex*/
sem_t waitNonEmpty, waitNonFull; /*等待"非空资源"和等待"非满资源"的semaphor*/
void * readData(void * whichone)
{
int data, position;
while (1){
sem_wait(&waitNonEmpty); /*是否有"非空资源"*/
pthread_mutex_lock(&sharedMutex); /*进入临界区*/
data = sharedArray[curr];
position = curr--;
printf ("%s read from the %dth: %d, /n", (char*)whichone, position, data);
sem_post(&waitNonFull); /*生成一个"非满资源"*/
pthread_mutex_unlock(&sharedMutex); /*离开临界区*/
sleep(2); /*跟同步无关的费时操作*/
}
}
void * writeData(void * whichone)
{
int data, position;
while (1) {
data=(int)(10.0*random()/RAND_MAX); /*生成一个随机数据,注意是10.0而不是10*/
sem_wait(&waitNonFull); /*是否有"非满资源"*/
pthread_mutex_lock(&sharedMutex); /*进入临界区*/
position = ++curr;
sharedArray[curr]=data;
printf ("%s wrote to the %dth: %d, /n", (char*)whichone, position, data);
sem_post(&waitNonEmpty); /*生成一个"非空资源"*/
pthread_mutex_unlock(&sharedMutex); /*离开临界区*/
sleep(1); /*跟同步无关的费时操作*/
}
}
int main (int argc, char** argv)
{
pthread_t consumer1, consumer2, producer1, producer2; /*两个生产者和两个消费者*/
sem_init(&waitNonEmpty, 0, empty); /*初始化信号量*/
sem_init(&waitNonFull, 0, full);
/*注意,本问题中的两种semaphore是有一定关系的,那就是它们的初始值之和应该等于共享缓冲区大小*/
/*即empty+full等于MAXSIZE*/
pthread_create (&consumer1, NULL, &readData, "consumer1");
pthread_create (&consumer2, NULL, &readData, "consumer2");
pthread_create (&producer1, NULL, &writeData, "producer1");
pthread_create (&producer2, NULL, &writeData, "producer2");
pthread_join (consumer1, NULL);
pthread_join (consumer2, NULL);
pthread_join (producer1, NULL);
pthread_join (producer2, NULL);
sem_destroy(&waitNonEmpty);
sem_destroy(&waitNonFull);
}
分析和说明:
1. 在一个给定的问题中,需要多少个Mutex,多少个Semaphore?有什么规律?
在本问题中,共需要一个Mutex和两个Semaphore.
其中,Mutex是用来锁定临界区的,以解决对共享数据的互斥访问问题(无论是对生成者还是对消费者);
我们共需要两个Semaphore,这是因为在本问题中共有两个稀缺资源.
第一种是"非空"这种资源,是在消费者之间进行竞争的.
第二种是"非满"这种资源,是在生产者之间进行竞争的.
所以,一般来说,需要锁定临界区,就需要Mutex;有几种稀缺资源就需要几个Semaphore.
对稀缺资源的分析不能想当然.稀缺资源不一定是指被共享的资源,很多时候是指线程会被阻塞的条件(除了要进临界区被阻塞外).
本例中,消费者会在缓冲区为空时被阻塞,所以"非空"是一种稀缺资源;
生产者会在缓冲区为满时被阻塞,所以"非满"也是一种稀缺资源.
2. 在对临界区加锁和等待信号量的顺序上有什么要求和规律?
这里要说两点:
第一,不要将等待信号量的语句放在被锁定的临界区内,这样会造成死锁.而且这也是很没有必要的.
比如,消费者在缓冲区没有数据的时候进入临界区,这样就会把临界区锁上,由于没有数据,消费者也会被锁上.
这时,任何生产者都会由于临界区被锁上而被block住,这样就造成了死锁.
第二,如果有多个Semaphore需要等待,那么每个线程中,最好对这多个信号量进行等待的顺序一致,
不然的话很容易造成死锁.
3. 什么样操作适合放在临界区,什么样的不适合?
一般来说,临界区中只放对共享数据进行访问的语句,这样会改善程序的性能.
很多时候,取出共享数据的副本后,对副本进行费时的各种操作就不需要放在临界区了.
比如,本例中的sleep语句就根本不需要放入临界区.