多线程环境下对变量的读写操作的原子性问题(一道百度笔试题引发的思考)

以下多线程对int型变量x的操作,哪几个需要进行同步:( )
A. x=y; B. x++; C. ++x; D. x=1;

从表面看上去实在是看不出什么突破口,我们不妨将这些代码译成汇编语言再来分析。

 

01  x = y; 

02  mov eax,dword ptr [y] 

03  mov dword ptr [x],eax 

04   

05  x++; 

06  mov eax,dword ptr [x] 

07  add eax,1 

08  mov dword ptr [x],eax 

09   

10  ++x; 

11  mov eax,dword ptr [x] 

12  add eax,1 

13  mov dword ptr [x],eax 

14   

15  x = 1; 

16  mov dword ptr [x],1 


 

(1)很显然,x=1是原子操作。

因为x是int类型,32位CPU上int占32位,在X86上由硬件直接提供了原子性支持。实际上不管有多少个线程同时执行类似x=1这样的赋值语句,x的值最终还是被赋的值(而不会出现例如某个线程只更新了x的低16位然后被阻塞,另一个线程紧接着又更新了x的低24位然后又被阻塞,从而出现x的值被损坏了的情况)。

 

(2)再来看x++和++x。
其实类似x++, x+=2, ++x这样的操作在多线程环境下是需要同步的。因为X86会按三条指令的形式来处理这种语句:从内存中读x的值到寄存器中,对寄存器加1,再把新值写回x 所处的内存地址(见上面的反汇编代码)。

例如有两个线程,它们按照如下顺序执行(注意读x和写回x是原子操作,两个线程不能同时执行):

time    Thread 1         Thread 2
0      load eax, x
1                            load eax x
2      add eax, 1        add eax, 1
3      store x, eax
4                            store x, eax

 

我们会发现最终x的值会是1而不是2,因为Thread 1的结果被覆盖掉了。这样情况下我们就需要对x++这样的操作加锁(例如Pthread中的mutex)来保证同步,或者使用一些提供了atomic operations的库(例如Windows API中的atomic 库 ,Linux内核中的atomic.h ,Java concurrent库中的Atomic Integer,C++0x中即将支持的atomic_int等等,这些库会利用CPU提供的硬件机制做一层封装,提供一些保证了原子性的API)。

(3)最后来看看x=y。
在X86上它包含两个操作:读取y至寄存器,再把该值写入x。读y的值这个操作本身是原子的,把值写入x也是原子的,但是两者合起来是不是原子操作呢?我个人认为x=y不是原子操作,因为它不是不可再分的操作。但是它需要不需要同步呢?其实问题的关键在于程序的上下文。

例如有两个线程,线程1要执行{y = 1; x = y;},线程2要执行{y = 2; y = 3;},假设它们按如下时间顺序执行:

time    Thread 1        Thread 2
0        store y, 1
1                            store y, 2
2        load eax, y
3                            store y, 3
4        store x, eax

 

那么最终线程1中x的值为2,而不是它原本想要的1。我们需要加上相应的同步语句确保y = 2不会在线程1的两条语句之间发生。y = 3那条语句尽管在load y和store x之间执行,但是却不影响x=y这条语句本身的语义。所以你可以说x=y需要同步,也可以说x=y不需要同步,看你怎么理解题意了。x=1是否需要同步也是一样的道理,虽然它本身是原子操作,但是如果有另一个线程要读x=1之后的值,那肯定也需要同步,否则另一个线程读到的就是x的旧值而不是1了。

你可能感兴趣的:(操作系统)