线程安全是多个线程访问时,采用了加锁机制,当一个线程访问该类的某个数据时,进行保护,其他线程不能进行访问直到该线程读取结束并且释放了锁,其他线程才可使用,保证了数据的一致性。
与之对应的则是线程不安全,对数据的访问不提供保护机制,导致多个线程先后更改数据造成数据的不一致问题,这是一个非常严重的问题。一般来说,一个函数被称为线程安全的,当且仅当被多个线程反复调用时,它会一直产生正确的结果。
下面我们来看一个多线程的i++操作:
#include
#include
#include
#include
int count = 0;
void *pthread_run(void *arg)
{
int val = 0;
int i = 0;
while(i < 5000)
{
i++;
val = count;
printf("pthread:%lu,count:%d\n",pthread_self(),count);
count = val + 1;
}
return NULL;
}
int main()
{
pthread_t pth1;
pthread_t pth2;
pthread_create(&pth1, NULL, &pthread_run, NULL);
pthread_create(&pth2, NULL, &pthread_run, NULL);
pthread_join(pth1, NULL);
pthread_join(pth2, NULL);
printf("count : %d\n", count);
return 0;
}
i++操作我们只需要三步操作:
(1)读取i到某个寄存器中;
(2)i++;
(3)将寄存器中的内容写回内存;
运行结果如下:
从实验结果可以看出,两个线程并发执行,程序在用户态与内核态之间不断切换,两个线程对其进行访问,就会造成数据的不一致问题。
如果你知道i++的汇编代码你就会发现,i++操作并不是一条指令完成的,即不是原子的。操作系统执行i++的时候可能执行了一部分就被调度去执行另一个代码,而单条指令是不会被打断的。
解决方式:对临界区加锁(二元信号量、互斥锁、多元信号量等)
下面我们使用互斥锁对临界区进行加锁保护:
#include
#include
#include
#include
//互斥锁的初始化
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
int count = 0;
void *pthread_run(void *arg)
{
int val = 0;
int i = 0;
while(i < 5000)
{
//对临界区加锁
pthread_mutex_lock(&mutex);
i++;
val = count;
printf("pthread:%lu,count:%d\n",pthread_self(),count);
count = val + 1;
//解锁操作
pthread_mutex_unlock(&mutex);
}
return NULL;
}
int main()
{
pthread_t pth1;
pthread_t pth2;
pthread_create(&pth1, NULL, &pthread_run, NULL);
pthread_create(&pth2, NULL, &pthread_run, NULL);
pthread_join(pth1, NULL);
pthread_join(pth2, NULL);
printf("count : %d\n", count);
return 0;
}
运行结果如下:
这样一来,就保证了多线程访问时数据的一致性,当然这只是线程安全的冰山一角。
我们能够定义出四个(不相交的)线程不安全函数类:
(1)不保护共享变量的函数。
比如上述操作中的i++操作。
解决方法:对临界区加锁,或者使用PV操作的信号量来保护共享的变量。
(2)保持跨越多个调用的状态函数。
比如一个伪随机数生成器,当调用srand为rand设置一个种子后,如果多线程调用rand函数,就会造成线程的安全隐患。
解决方法:重写rand函数,使得它不再使用任何static数据,而是依靠调用者在参数中传递状态信息。
(3)返回指向静态变量的指针的函数。
比如将一个计算结果放在一个static变量中,然后返回一个指向这个变量的指针。如果多线程调用这些函数,正在被一个线程使用的结构会被另一个线程覆盖掉。
解决方法:① 选择重写函数,使得调用者传递存放结果的变量的地址,消除了所有共享数据。 ② 使用加锁-拷贝(lock-and-copy)技术。将线程不安全函数与互斥锁联系起来,在每一个调用位置,对互斥锁加锁,调用线程不安全函数,将函数返回的结果拷贝到一个私有的存储器位置,然后对互斥锁解锁。
(4)调用线程不安全函数的函数。
我们假设函数A安全,函数B不安全。
情况①:如果函数A调用B,那么A不一定不安全。如果B是第(2)类的函数,即依赖于跨越多次调用的状态,那么A线程肯定不安全。解决方法:对函数B进行重写。
情况②:如果B是第(1)类或者第(3)类。解决方法:需要用互斥锁保护调用位置和任何得到的共享数据,A仍可能是线程安全的。
重入:即重复调用,函数被不同的流调用,有可能会出现第一次调用还没有返回时就再次进入该函数开始下一次调用。
可重入:当程序被多个线程反复执行,结果总是正确的。
不可重入:当程序被多个线程反复调用,产生的结果会出错。
可重入函数:可以重复进入。这个函数不仅可以被中断,而且除了使用自己栈上的变量以外不依赖于任何环境(包括static)。可以允许有多个函数的副本在运行,由于它们使用的是分离的栈,因此不会互相干扰。
不可重入函数:一重入就会出错。由于使用了一些系统资源,比如全局变量区,中断向量表等,如果被中断,是不能在多任务环境下生存的。
可重入的特点:由于可重入函数被多次调用不会出错,因此可重入函数不用担心数据会被破坏。可重入函数任何时候都可以被中断,一段时间后又可以继续运行,而相应的数据不会丢失。可重入函数若只使用局部变量,即保存在CPU寄存器或者堆栈中,如果使用的是全局变量,则要对全局变量予以保护。
不可重入的特点:如果一个函数符合以下条件之一的,则是不可重入的:
(1)调用了 malloc/free 函数,因为 malloc 函数是用全局链表来管理的。
(2)调用了标准I/O库函数,标准I/O库的很多实现都以不可重入的方式适用全局数据结构。
(3)可重入体内使用了静态的数据结构。
很多时候,可重入函数与线程安全被用作同义词,但是它们还是有很明显的区别的,可重入函数仅仅是线程安全函数的一个真子集,如下图所示:
一个函数要想被重入,只有以下两种情况:
(1)多个线程同时执行这个函数;
(2)函数自身(可能是经过多层调用之后)调用本身;
一个函数之所以可重入,则表明了重入对该函数不会造成任何不良的影响。
一个函数称为可重入的充要条件:
(1)不是任何(局部)静态或全局的非const变量;
(2)不返回任何(局部)静态或全局的非const变量的指针;
(3)仅依赖于调用方提供的参数;
(4)不依赖任何单个资源的锁;
(5)不调用任何不可重入函数;
可重入是并发安全的强力保障,一个可重入的函数可以在多线程环境下放心使用。
(1)线程安全不一定是可重入的,而可重入函数一定是线程安全的。
(2)线程安全是多个线程下引起的,但可重入函数可以在只有一个线程的情况下发生。
(3)若一个函数中存在全局变量,那么这个函数既不是线程安全的也不是可重入的。
(4)线程安全函数能够使不同的线程访问同一块地址空间,而可重入函数要求不同的执行流对数据的操作互不影响结果是相同的。