本节大量参考:
https://www.cnblogs.com/xiehongfeng100/p/4620852.html
Linux线程同步——条件变量_pthread wait_X-Programer的博客-CSDN博客
在之前的学习中,并没有线程的概念,所以之前所有写的Linux程序都可以看作只有一个控制线程,因为一个进程在同一时刻只做一件事情。有了多个控制线程后,在程序设计时可以把进程设计成在同一时刻做不止一件事,每个线程各自处理独立的任务。
进程是程序执行时的一个实例,是担当分配系统资源(CPU时间、内存等)的基本单位。在面向线程设计的系统中,进程本身不是基本运行单位,而是线程的容器。程序本身只是指令、数据及其组织形式的描述,进程才是程序(那些指令和数据)的真正运行实例。
线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。线程包含了表示进程内执行环境必须的信息,其中包括进程中表示线程的线程ID、一组寄存器值、栈、调度优先级和策略、信号屏蔽字、errno常量以及线程私有数据。进程的所有信息对该进程的所有线程都是共享的,包括可执行的程序文本、程序的全局内存和堆内存、栈以及文件描述符。在Unix和类Unix操作系统中线程也被称为轻量级进程(lightweight processes),但轻量级进程更多指的是内核线程(kernel thread),而把用户线程(user thread)称为线程。
进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径。线程有自己的堆栈和局部变量,但线程没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率要差一些。对于一些要求同时进行并且又要共享某些变量的并发操作,用线程有时会更好。
从上面我们知道了进程与线程的区别,其实这些区别也就是我们使用线程的理由。总的来说就是:进程有独立的地址空间,线程没有单独的地址空间(同一进程内的线程共享进程的地址空间)。
除了以上所说的优点外,不和进程比较,多线程程序作为一种多任务、并发的工作方式,当然有以下的优点:
多线程开发在 Linux 平台上已经有成熟的 pthread 库支持。所以涉及线程的编译需要加上“-lpthread”
多线程开发涉及的多线程开发的最基本概念主要包含三点:线程,互斥锁,条件变量。
对于多线程程序来说,我们往往需要对这些多线程进行同步。同步(synchronization)是指在一定的时间内只允许某一个线程访问某个资源。而在此时间内,不允许其它的线程访问该资源。我们可以通过互斥锁(mutex),条件变量(condition variable)和读写锁(reader-writer lock)来同步资源。
其他的一些线程扩展概念,如信号灯等,都可以通过上面的三个基本元素的基本操作封装出来。
接下来就对上述这些 和 一些常用的API 分别进行讲解:
虽然线程ID在Linux中是无符号的长整型数,可以直接进行比较,但是为了可移植性操作,使用phthread_equal()函数更好也更专业
#include
pthread_t pthread_self(void); //返回线程ID
int pthread_equal(pthread_t tid1, pthread_t tid2); //相等则返回非0值,不相等则返回0
#include
int pthread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(*start_rtn)(void *), void *restrict arg);
在定义指针变量的时候,加上了“restrict” 关键字,就表示“该指针所指向的内存,只有通过该指针访问得到”,从而可以让编译器对代码进行优化,生成更有效率的汇编代码
详见:Restrict关键字_char *restrict_时行居正的博客-CSDN博客
单个线程可以通过以下三种方式退出,在不终止整个进程的情况下停止它的控制流:
- 在线程对应的函数中返回,返回值是线程的退出码
- 被同一进程中的其他线程取消
- 线程调用pthread_exit
#include
int pthread_exit(void *rval_ptr);
- 调用这个函数的线程将一直阻塞,直到指定的线程调用pthread_exit、从启动例程中返回或者被取消。如果例程只是从它的启动例程返回i,rval_ptr将包含返回码。如果线程被取消,由rval_ptr指定的内存单元就置为PTHREAD_CANCELED。
- 可以通过调用pthread_join自动把线程置于分离状态,这样资源就可以恢复。如果线程已经处于分离状态,pthread_join调用就会失败,返回EINVAL。
- 如果对线程的返回值不感兴趣,可以把rval_ptr置为NULL。在这种情况下,调用pthread_join函数将等待指定的线程终止,但并不获得线程的终止状态。
#include
int pthread_join(pthread_t thread, void **rval_ptr);
创建一个名为“XC”的文件夹,关于线程学习的代码都放在这个文件夹下:
#include
#include
void *thread1(void *arg)
{
static int ret = 10;
printf("thread1 is created, id = %ld \n",(unsigned long)pthread_self());
printf("param = %d\n",*((int *)arg));
pthread_exit((void *)&ret);
}
int main()
{
int ret;
int param = 100;
pthread_t t1_id;
int *pret;
printf("main thread id = %ld \n",(unsigned long)pthread_self());
ret = pthread_create(&t1_id,NULL,thread1,(void *)¶m);
if(ret != 0){
printf("thread1 create error\n");
}
pthread_join(t1_id,(void **)&pret);
printf("thread1 quit:%d\n",*pret);
return 0;
}
注意,在thread1函数中,对于exit返回值的定义必须加上“static”,因为如果不是static,变量就和线程存储在同一片区域,线程退出变量值也会丢失,但是static会将变量存放在其他区域,从而调用pthread_join函数的线程就可以通过二级指针访问到这个返回值的具体值。
#include
#include
void *thread1(void *arg)
{
static char *ret = "thread1 exit";
printf("thread1 is created, id = %ld \n",(unsigned long)pthread_self());
printf("param = %d\n",*((int *)arg));
pthread_exit((void *)ret);
}
int main()
{
int ret;
int param = 100;
pthread_t t1_id;
char *pret;
printf("main thread id = %ld \n",(unsigned long)pthread_self());
ret = pthread_create(&t1_id,NULL,thread1,(void *)¶m);
if(ret != 0){
printf("thread1 create error\n");
}
pthread_join(t1_id,(void **)&pret);
printf("thread1 quit:%s\n",pret);
return 0;
}
#include
#include
#include
int share_value = 0;
void *thread1(void *arg)
{
static char *ret = "thread1 exit";
printf("thread1 is created, id = %ld \n",(unsigned long)pthread_self());
while(1){
printf("t1: share_value = %d\n",share_value++);
sleep(1);
}
pthread_exit((void *)ret);
}
void *thread2(void *arg)
{
static char *ret = "thread2 exit";
printf("thread2 is created, id = %ld \n",(unsigned long)pthread_self());
while(1){
printf("t2: share_value = %d\n",share_value++);
sleep(1);
}
pthread_exit((void *)ret);
}
int main()
{
int ret;
int param = 100;
pthread_t t1_id;
pthread_t t2_id;
char *pret;
printf("main thread id = %ld \n",(unsigned long)pthread_self());
ret = pthread_create(&t1_id,NULL,thread1,(void *)¶m);
if(ret != 0){
printf("thread1 create error\n");
}
ret = pthread_create(&t2_id,NULL,thread2,(void *)¶m);
if(ret != 0){
printf("thread2 create error\n");
}
while(1){
printf("main: share_value = %d\n",share_value++);
sleep(1);
}
pthread_join(t1_id,(void **)&pret);
printf("thread1 quit:%s\n",pret);
pthread_join(t2_id,(void **)&pret);
printf("thread2 quit:%s\n",pret);
return 0;
}
可见,不同线程之间是抢占的关系,且所有线程都可以非常轻松的改变全局变量
如果想要指定的进程在指定的条件下修改共享变量,就需要用到接下来互斥量和条件变量的知识点了。
互斥量(mutex)从本质上来说是一把锁,在访问共享资源前对互斥量进行加锁,在访问完成后释放互斥量上的锁。对互斥量进行加锁后,任何其他试图再次对互斥量加锁的线程将会被阻塞直到当前线程释放该互斥锁。如果释放互斥锁时有多个线程阻塞,所有在该互斥锁上的阻塞线程都会变成可运行状态,第一个变为可运行状态的线程可以对互斥量加锁,其他线程将会看到互斥锁依然被锁住,只能回去等待它重新变为可用。在这种方式下,每次只有一个线程可以向前运行。
在设计时需要规定所有的线程必须遵守相同的数据访问规则。只有这样,互斥机制才能正常工作。操作系统并不会做数据访问的串行化。如果允许其中的某个线程在没有得到锁的情况下也可以访问共享资源,那么即使其它的线程在使用共享资源前都获取了锁,也还是会出现数据不一致的问题。
互斥变量用pthread_mutex_t数据类型表示。在使用互斥变量前必须对它进行初始化,可以把它置为常量PTHREAD_MUTEX_INITIALIZER(只对静态分配的互斥量),也可以通过调用pthread_mutex_init函数进行初始化。如果动态地分配互斥量(例如通过调用malloc函数),那么在释放内存前需要调用pthread_mutex_destroy。
静态初始化举例:
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
#include
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);
#include
int pthread_mutex_destroy(pthread_mutex_t *restrict mutex);
#include
int pthread_mutex_lock(pthread_mutex_t *restrict mutex);
#include
int pthread_mutex_unlock(pthread_mutex_t *restrict mutex);
#include
#include
#include
int share_value = 0;
pthread_mutex_t mutex;
void *thread1(void *arg)
{
pthread_mutex_lock(&mutex);
static char *ret = "thread1 exit";
printf("thread1 is created, id = %ld \n",(unsigned long)pthread_self());
for(int i=0; i<5;i++){
printf("t1:param = %d\n",*((int *)arg));
sleep(1);
}
pthread_mutex_unlock(&mutex);
pthread_exit((void *)ret);
}
void *thread2(void *arg)
{
pthread_mutex_lock(&mutex);
static char *ret = "thread2 exit";
printf("thread2 is created, id = %ld \n",(unsigned long)pthread_self());
for(int i=0; i<5;i++){
printf("t2:param = %d\n",*((int *)arg));
sleep(1);
}
pthread_mutex_unlock(&mutex);
pthread_exit((void *)ret);
}
int main()
{
int ret;
int param = 100;
pthread_t t1_id;
pthread_t t2_id;
char *pret;
printf("main thread id = %ld \n",(unsigned long)pthread_self());
ret = pthread_mutex_init(&mutex, NULL);
if(ret != 0){
printf("mutex create error\n");
}
ret = pthread_create(&t1_id,NULL,thread1,(void *)¶m);
if(ret != 0){
printf("thread1 create error\n");
}
ret = pthread_create(&t2_id,NULL,thread2,(void *)¶m);
if(ret != 0){
printf("thread2 create error\n");
}
pthread_join(t1_id,(void **)&pret);
printf("thread1 quit:%s\n",pret);
pthread_join(t2_id,(void **)&pret);
printf("thread2 quit:%s\n",pret);
ret = pthread_mutex_destroy(&mutex);
if(ret != 0){
printf("mutex destroy error\n");
}
return 0;
}
可见,由于线程1和线程2都在运行前加锁,退出前解锁,所以任意一个线程只要先执行,另一个线程就会被阻塞,因此就保证了同一时刻只一个线程在运行。(但是线程退出是在解锁后进行的,所以这种情况下退出的接收顺序不会保证)
而如果将互斥锁相关代码注释掉再运行的话:
可见,如果没有互斥锁的保护,由于线程间的竞争关系,线程1和线程2会抢着打印。
#include
#include
#include
int share_value = 0;
pthread_mutex_t mutex;
pthread_mutex_t mutex2;
void *thread1(void *arg)
{
pthread_mutex_lock(&mutex);
sleep(1);
pthread_mutex_lock(&mutex2);
static char *ret = "thread1 exit";
printf("thread1 is created, id = %ld \n",(unsigned long)pthread_self());
for(int i=0; i<5;i++){
printf("t1:param = %d\n",*((int *)arg));
sleep(1);
}
pthread_mutex_unlock(&mutex);
pthread_exit((void *)ret);
}
void *thread2(void *arg)
{
pthread_mutex_lock(&mutex2);
sleep(1);
pthread_mutex_lock(&mutex);
static char *ret = "thread2 exit";
printf("thread2 is created, id = %ld \n",(unsigned long)pthread_self());
for(int i=0; i<5;i++){
printf("t2:param = %d\n",*((int *)arg));
sleep(1);
}
pthread_mutex_unlock(&mutex);
pthread_exit((void *)ret);
}
int main()
{
int ret;
int param = 100;
pthread_t t1_id;
pthread_t t2_id;
char *pret;
printf("main thread id = %ld \n",(unsigned long)pthread_self());
ret = pthread_mutex_init(&mutex, NULL);
if(ret != 0){
printf("mutex create error\n");
}
ret = pthread_mutex_init(&mutex2, NULL);
if(ret != 0){
printf("mutex2 create error\n");
}
ret = pthread_create(&t1_id,NULL,thread1,(void *)¶m);
if(ret != 0){
printf("thread1 create error\n");
}
ret = pthread_create(&t2_id,NULL,thread2,(void *)¶m);
if(ret != 0){
printf("thread2 create error\n");
}
pthread_join(t1_id,(void **)&pret);
printf("thread1 quit:%s\n",pret);
pthread_join(t2_id,(void **)&pret);
printf("thread2 quit:%s\n",pret);
ret = pthread_mutex_destroy(&mutex);
if(ret != 0){
printf("mutex destroy error\n");
}
ret = pthread_mutex_destroy(&mutex2);
if(ret != 0){
printf("mutex2 destroy error\n");
}
return 0;
}
可见,程序运行直接卡死了,原因是,在上述代码中:
所以,无论是谁先竞争到了CPU,都会卡死,这种情况就叫做“死锁”现象。
条件变量是线程另一可用的同步机制。条件变量给多个线程提供了一个会合的场所。条件变量一般与互斥量一起使用,允许线程以无竞争的方式等待特定的条件发生。
同步概念和竞态条件
- 在保证数据安全的前提下,让线程能够按照某种特定的顺序访问临界资源,从而有效避免饥饿问题,叫做同步
- 竞态条件:因为时序问题,而导致程序异常,我们称之为竞态条件。在线程场景下,这种问题也不难理解
条件本身是由互斥量保护的。线程在改变条件状态前必须首先锁住互斥量,其他线程在获得互斥量之前不会察觉到这种改变,因为必须锁定互斥量以后才能计算条件。
当一个线程申请到锁后,就开始执行pthread_cond_wait进行等待,在等待的过程中,该线程的锁会被释放,等线程被唤醒的时候,该线程的锁又会回到手上。这样就避免了如果一个线程不满足条件就会一直被阻塞的情况(也就是只使用互斥量会发生的情况)。
条件变量使用之前必须首先初始化,pthread_cond_t数据类型代表的条件变量可以用两种方式进行初始化,可以把常量PTHREAD_COND_INITIALIZER赋给静态分配的条件变量,但是如果条件变量是动态分配的,可以使用pthread_cond_destroy函数对条件变量进行去除初始化(deinitialize)
静态初始化举例:
pthread_cond_t cond = PTHREAD_COND_INITIALIZER;
#include
int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);
#include
int pthread_cond_destroy(pthread_cond_t *restrict cond);
用于通知线程条件已经满足。pthread_cond_signal函数将唤醒等待该条件的某个线程
#include
int pthread_cond_signal(pthread_cond_t *restrict cond);
用于通知线程条件已经满足。pthread_cond_signal函数将唤醒等待该条件的所有线程
#include
int pthread_cond_broadcast(pthread_cond_t *restrict cond);
pthread_cond_wait等待条件变为真时,如果在给定的时间内条件不能满足,那么会生成一个代表一个出错码的返回变量。传递给pthread_cond_wait的互斥量对条件进行保护,调用者把锁住的互斥量传给函数。函数把调用线程放到等待条件的线程列表上,然后对互斥量解锁,这两个操作都是原子操作。这样就关闭了条件检查和线程进入休眠状态等待条件改变这两个操作之间的时间通道,这样线程就不会错过条件的任何变化。pthread_cond_wait返回时,互斥量再次被锁住。
pthread_cond_timedwait函数的工作方式与pthread_cond_wait函数类似,只是多了一个timeout。timeout指定了等待的时间,它是通过timespec结构体指定的。
#include
int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);
int pthread_cond_timedwait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex, cond struct timespec *restrict timeout);
typedef struct timespec
{
time_t tv_sec; //秒
long tv_nsec; //纳秒
};
对于上锁;发送siganl;调用wait 的顺序和方法,以下是最推荐的模板:
强烈建议按照这个模板使用条件变量,至于具体的原因,见本节开头的第二个链接。。。
以下的代码就是按照这个模板来实现的。
#include
#include
#include
int share_value = 0;
pthread_mutex_t mutex;
pthread_cond_t cond;
void *thread1(void *arg)
{
static char *ret = "thread1 exit";
printf("thread1 is created, id = %ld \n",(unsigned long)pthread_self());
pthread_mutex_lock(&mutex);
while(share_value < 6){
printf("t1:share_value = %d\n",share_value++);
sleep(1);
}
pthread_cond_signal(&cond);
pthread_mutex_unlock(&mutex);
pthread_exit((void *)ret);
}
void *thread2(void *arg)
{
static char *ret = "thread2 exit";
printf("thread2 is created, id = %ld \n",(unsigned long)pthread_self());
pthread_mutex_lock(&mutex);
while(share_value < 6){
pthread_cond_wait(&cond,&mutex);
}
while(share_value < 11){
printf("t2:share_value = %d\n",share_value++);
sleep(1);
}
pthread_mutex_unlock(&mutex);
pthread_exit((void *)ret);
}
int main()
{
int ret;
int param = 100;
pthread_t t1_id;
pthread_t t2_id;
char *pret;
printf("main thread id = %ld \n",(unsigned long)pthread_self());
ret = pthread_mutex_init(&mutex, NULL);
if(ret != 0){
printf("mutex create error\n");
}
ret = pthread_cond_init(&cond, NULL);
if(ret != 0){
printf("cond create error\n");
}
ret = pthread_create(&t1_id,NULL,thread1,(void *)¶m);
if(ret != 0){
printf("thread1 create error\n");
}
ret = pthread_create(&t2_id,NULL,thread2,(void *)¶m);
if(ret != 0){
printf("thread2 create error\n");
}
pthread_join(t1_id,(void **)&pret);
printf("thread1 quit:%s\n",pret);
pthread_join(t2_id,(void **)&pret);
printf("thread2 quit:%s\n",pret);
ret = pthread_mutex_destroy(&mutex);
if(ret != 0){
printf("mutex destroy error\n");
}
ret = pthread_cond_destroy(&cond);
if(ret != 0){
printf("cond destroy error\n");
}
return 0;
}
可见,通过条件变量和互斥量的结合,实现了让线程按照条件来先后执行,只有线程1数到5的时候,才会触发条件,而线程2一直等待直到共享变量大于5,才会开始继续加它,并在加到10之后退出