关于 lockfree 算法

lockfree的本质是乐观锁。也就是说,它假设多数情况下,别人不会改变。一个通用的lockfree算法可描述如下:

lockfree_modify(DataT* data)
{
for (;;)
{
Save old state of data to a local variable;
do modify;
lock {
if (current state == old state)
commit modify & return;
}
}
}

可以看出,lockfree也是锁,只是将锁限制在一个最小的范围内(通常是一个原子操作)。由于仍然有锁,lockfree在多核下并不会比普通的锁高明多少,它也不能随cpu个数增加而获得呈线性scale的性能提升。

不过,lockfree有个最大的好处,就是不可能有死锁。因为对上面算法分析你可以知道,在某个线程modify失败,总意味着有另一个人成功了,整个程序总在一步步前进,而不是出现相互等待而产生饥饿的状况。

我们以stack为例,展示下lockfree的stack是怎样的:

class stack
{
public:
struct Node
{
Node* prev;
};

private:
Node* m_head;

public:
stack()
: m_head(NULL)
{
}

void push(Node* val)
{
for (;;)
{
Node* head = m_head;
val->prev = head;
if (InterlockedCompareExchangePointer((PVOID*)&m_head, val, head) == head)
return;
}
}

Node* pop()
{
for (;;)
{
Node* head = m_head;
if (head == NULL)
return NULL;
if (InterlockedCompareExchangePointer((PVOID*)&m_head, head->prev, head) == head)
return head;
}
}
};

嗯,看起来挺不错,代码还算优雅。。。不过遗憾的是,严谨的说其实上面的lockfree算法是有问题的。问题在哪里?在pop算法上。我们看lock范围内的语义:

if (InterlockedCompareExchangePointer((PVOID*)&m_head, head->prev, head) == head)
return head;

这句话用伪代码描述是:

lock {
if (m_head == head) {
m_head = head->prev;
return head;
}
}

问题在于,m_head指针的值没有发生变化,和整个stack没有发生变化,这两者等价吗?

不等价。完全可以发生一种情况就是,另一个线程执行了这样一段代码:

v1 = pop(); // v1是m_head
v2 = pop();
push(v1);

此时,m_head没有变化,但是m_head->prev不再是v2,而是v2->prev了。

那么怎么办?在说解决方案前,我们先再聊下上例中的stack::push。既然stack::pop有问题,那么stack::push呢?我们说,push算法的并没有什么问题。尽管同样的,m_head指针的值没有发生变化,并不意味着整个stack没有发生变化。但是对于push来说,它只关心m_head,而不关心其他东西,所以stack是否发生变化对其并无影响。

那么,应该如何解决pop算法遇到的问题?一个比较通用的方法,就是版本号。lockfree算法中,有一个术语叫tagged_ptr,其实本质上就是一个打了版本号的pointer:

struct tagged_ptr
{
void* p;
size_t tag;
};

每次要对p进行修改,都++tag。这样,判断是不是modify,只需要判断tag是否变化即可。

lockfree小结:

  • 优点:不发生死锁。性能通常比lock好一些。
  • 缺点:仍然是锁。所以并不能随cpu个数增加而获得呈线性scale的性能提升。
  • 缺点:lockfree算法的实现通常比较复杂,不利于推广到任意算法的lockfree改造。通常只有少量库代码使用lockfree。

你可能感兴趣的:(算法)