Interlocked API的原子性如何保证

前面的文章提到如何利用Interlocked API设计系统级日志。Interlocked API可以对在多线程之间共享的内存变量提供原子性访问。有些CPU在硬件层面上直接支持这些操作,如80386以后的X86架构CPU,xchg、xadd、cmpxchg等指令在进行内存访问时锁住总线。举例来说, InterlockedExchangeAdd在X86上的实现如下:
  1. LONG WINAPI InterlockedExchangeAdd(PLONG Addend, LONG Value)
  2. {
  3.     __asm {
  4.         mov ecx, Addend
  5.         mov eax, Value
  6.         xadd [ecx], eax
  7.     }
  8. }
直接利用了xadd指令完成交换。
问题是,其他架构的CPU没有提供类似的指令可以锁定总线,Interlocked API的原子性如何保证?拿ARM架构来说,在Windows CE上InterlockedExchangeAdd的ARM实现如下:
  1. LEAF_ENTRY InterlockedExchangeAdd
  2.     ldr r12, [r0]
  3.     add r2, r12, r1
  4.     str r2, [r0]
  5.     mov r0, r12 ; (r0) = return original value
  6.     bx lr
  7. ENTRY_END InterlockedExchangeAdd
翻译成C语言就是:
  1. LONG InterlockedExchangeAdd(PLONG Addend, LONG Value)
  2. {
  3.     LONG oldval = *Target; // ldr r12, [r0]
  4.     LONG newval = oldval+Value; // add r2, r12, r1
  5.     *Target = newval; // str r2, [r0]
  6.     return oldval; // mov r0, r12; bx lr
  7. }
完全是一个普通的函数。在多线程环境下,这样的实现是不足以保证原子性的。举个例子,你有一个全局变量g_lVar,线程1和线程2会改变它的值:
  1. LONG g_lVar = 0;
  2. void thread_entry()
  3. {
  4.     LONG oldval = InterlockedExchangeAdd(&g_lVar, 1);
  5. }
在InterlockedExchange不能保证原子性的情况下会出现什么问题?正常情况下,两个线程执行完thread_entry函数后,g_lVar的值为2。现在设想一下这种情况:线程1执行完InterlockedExchangeAdd中的第一句(此时oldval为0),时间片刚好用完,线程调度器唤醒线程2,线程2执行顺利执行完thread_entry,g_lVar为1。线程调度器切换回到线程1执行,由于线程1中本地变量oldval为0,*Target=newval=oldval+Value=0+1=1,因此线程1的thread_entry完成后,g_lVar的值仍然为1!!问题处在InterlockedExchangeAdd的执行可能被别的线程打断,导致操作数有可能被其他线程改变,而InterlockedExchangeAdd本身无法预知这一点,也就是说InterlockedExchangeAdd的原子性无法得到保证。
Windows CE怎么解决这一问题?答案是调度器!在CPU被切换到另外一个context执行前(比如当前任务被中断打断,或者发生一个Data Abort)调度器会检查原先任务是否运行到Interlocked API所在的地址范围,如果是的话,调度器把指令寄存器修正为该Interlocked API的入口地址。在我们的例子中,InterlockedExchangeAdd执行完第一句时间片用完,调度器发现该线程的指令寄存器处于InterlockedExchangeAdd API之间,因此它会把指令寄存器重置回InterlockedExchangeAdd的入口地址,再切换到线程2执行。在线程2完成后线程1运行时,oldval的值重新从*Target(即g_lVar,此时已被线程2改为1)取得,这样,在线程1完成后g_lVar的值变成2。要注意的是,调度器不保证Interlocked API的执行不被打断,它保证的是Interlocked API的一次完整执行不会被其他任务打断!还要注意的是,在多处理器或多核系统上,这种方法是行不通的,必须在硬件层次上提过某种锁定总线的内存访问机制才行。

你可能感兴趣的:(Interlocked API的原子性如何保证)