C++11 中的线程、锁和条件变量

C++11 中的线程、锁和条件变量

本文由 伯乐在线 - 伯乐在线读者 翻译自 Marius Bancila。转载请参见文章末尾处的要求。


【感谢@_La_Isla_Bonita 的热心翻译。如果其他朋友也有不错的原创或译文,可以尝试推荐给伯乐在线。】

线程

类std::thread代表一个可执行线程,使用时必须包含头文件<thread>。std::thread可以和普通函数,匿名函数和仿函数(一个实现了operator()函数的类)一同使用。另外,它允许向线程函数传递任意数量的参数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <thread>
 
void func()
{
    // do some work
}
 
int main()
{
    std:: thread t(func);
    t.join();
 
    return 0;
}

上例中,t 是一个线程对象,函数func()运行于该线程中。对join()函数的调用将使调用线程(本例是指主线程)一直处于阻塞状态,直到正在执行的线程t执行结束。如果线程函数返回某个值,该值也将被忽略。不过,该函数可以接收任意数量的参数。

1
2
3
4
5
6
7
8
9
10
11
12
void func( int i, double d, const std::string& s)
{
     std::cout << i << ", " << d << ", " << s << std::endl;
}
 
int main()
{
    std:: thread t(func, 1, 12.50, "sample" );
    t.join();
 
    return 0;
}

尽管可以向线程函数传递任意数量的参数,但是所有的参数应当按值传递。如果需要将参数按引用传递,那要向下例所示那样,必须将参数用std::ref 或者std::cref进行封装。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
void func( int & a)
{
    a++;
}
 
int main()
{
    int a = 42;
    std:: thread t(func, std::ref(a));
    t.join();
 
    std::cout << a << std::endl;
 
    return 0;
}
该程序打印结果为43,但是如果不用std::ref把参数a进行封装的话,输出结果将为42.
除了join方法外,该线程类还提供了另外两个方法:
swap:交换两个线程对象的底层句柄。

Detach: 允许执行该方法的线程脱离其线程对象而继续独立执行。脱离后的线程不再是可结合线程(你不能等待它们执行结束)。

1
2
3
4
5
6
7
int main()
{
     std:: thread t(funct);
     t.detach();
 
     return 0;
}

有一点非常重要,如果线程函数抛出异常,使用常规的try-catch语句是捕获不到该异常的。换句话说,以下的做法是不可行的:

1
2
3
4
5
6
7
8
9
10
11
12
try
{
     std:: thread t1(func);
     std:: thread t2(func);
 
     t1.join();
     t2.join();
}
catch ( const std::exception& ex)
{
     std::cout << ex.what() << std::endl;
}

要在线程间传递异常,你需要在线程函数中捕获他们,将其存储在合适的地方,比便于另外的线程可以随后获取到这些异常。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
std::mutex                       g_mutex;
std::vector<std::exception_ptr>  g_exceptions;
 
void throw_function()
{
    throw std::exception( "something wrong happened" );
}
 
void func()
{
    try
    {
       throw_function();
    }
    catch (...)
    {
       std::lock_guard<std::mutex> lock(g_mutex);
       g_exceptions.push_back(std::current_exception());
    }
}
 
int main()
{
    g_exceptions.clear();
 
    std:: thread t(func);
    t.join();
 
    for (auto& e : g_exceptions)
    {
       try
       {
          if (e != nullptr)
          {
             std::rethrow_exception(e);
          }
       }
       catch ( const std::exception& e)
       {
          std::cout << e.what() << std::endl;
       }
    }
 
    return 0;
}

想要知道更多的关于捕获和传递异常的知识,可以阅读这两本书在主线程中处理辅助线程抛出的C++异常怎样在线程间传递异常

在深入学习之前,有一点需要注意 &lt;thread&gt;头文件在命名空间std::this_thread中提供了一些帮助函数:

  • get_id: 返回当前线程的id.
  • yield:在处于等待状态时,可以让调度器先运行其他可用的线程。
  • sleep_for:阻塞当前线程,时间不少于其参数指定的时间。
  • sleep_util:在参数指定的时间到达之前,使当前线程一直处于阻塞状态。

在上面的例子中,我需要对vector g_exceptions进行同步访问,以确保在同一时间只能有一个线程向其中添加新元素。为此,我使用了互斥量,并对该互斥进行加锁。互斥量是一个核心同步原语,C++ 11的<mutex>头文件里包含了四种不同的互斥量。

  • Mutex: 提供了核心函数 lock() 和 unlock(),以及非阻塞方法的try_lock()方法,一旦互斥量不可用,该方法会立即返回。
  • Recursive_mutex:允许在同一个线程中对一个互斥量的多次请求。
  • Timed_mutex:同上面的mutex类似,但它还有另外两个方法 try_lock_for() 和 try_lock_until(),分别用于在某个时间段里或者某个时刻到达之间获取该互斥量。
  • Recursive_timed_mutex: 结合了timed_mutex 和recuseive_mutex的使用。

下面是一个使用了std::mutex的例子(注意前面提到过的帮助函数get_id()和sleep_for()的用法)。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
#include <iostream>
#include <thread>
#include <mutex>
#include <chrono>
 
std::mutex g_lock;
 
void func()
{
     g_lock.lock();
 
     std::cout << "entered thread " << std::this_thread::get_id() << std::endl;
     std::this_thread::sleep_for(std::chrono::seconds( rand () % 10));
     std::cout << "leaving thread " << std::this_thread::get_id() << std::endl;
 
     g_lock.unlock();
}
 
int main()
{
     srand ((unsigned int ) time (0));
 
     std:: thread t1(func);
     std:: thread t2(func);
     std:: thread t3(func);
 
     t1.join();
     t2.join();
     t3.join();
 
     return 0;
}

输出结果如下所示:

1
2
3
4
5
6
entered thread 10144
leaving thread 10144
entered thread 4188
leaving thread 4188
entered thread 3424
leaving thread 3424

lock()和unlock()这两个方法应该一目了然,第一个方法用来对互斥量加锁,如果互斥量不可用,便处于阻塞状态。后者则用来对互斥量解锁。

下面这个例子展示了一个简单的线程安全容器(内部使用std::vector).这个容器带有添加单个元素的add()方法和添加多个元素的addrange()方法,addrange()方法内部仅仅调用了add()方法。

注意:就像下面的评论里所指出的一样,由于某些原因,包括使用了va_args,这不是一个标准的线程安全容器。而且,dump()方法也不是容器的方法,从真正的实现上来说,它只是一个帮助(独立的)函数。这个例子仅仅用来告诉大家一些有关互斥量的概念,而不是实现一个完全成熟的,无任何错误的线程安全容器。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
template < typename T>
class container
{          
     std::mutex _lock;
     std::vector<T> _elements;
public :
     void add(T element)
     {
         _lock.lock();
         _elements.push_back(element);
         _lock.unlock();
     }
 
     void addrange( int num, ...)
     {
         va_list arguments;
 
         va_start (arguments, num);
 
         for ( int i = 0; i < num; i++)
         {
             _lock.lock();
             add( va_arg (arguments, T));
             _lock.unlock();
         }
 
         va_end (arguments);
     }
 
     void dump()
     {
         _lock.lock();
         for (auto e : _elements)
             std::cout << e << std::endl;
         _lock.unlock();
     }
};
 
void func(container< int >& cont)
{
     cont.addrange(3, rand (), rand (), rand ());
}
 
int main()
{
     srand ((unsigned int ) time (0));
 
     container< int > cont;
 
     std:: thread t1(func, std::ref(cont));
     std:: thread t2(func, std::ref(cont));
     std:: thread t3(func, std::ref(cont));
 
     t1.join();
     t2.join();
     t3.join();
 
     cont.dump();
 
     return 0;
}

运行该程序时,会进入死锁状态。原因是该容器试图多次去获取同一个互斥量,却一直没有释放它,这样是不可行的。

在这里,使用std::recursive_mutex就可以很好地解决这个问题,它允许同一个线程多次获取同一个互斥量,可获取的互斥量的最大次数并没有具体说明。但是一旦超过最大次数,再对lock进行调用就会抛出std::system_error错误异常。

要想修改上述代码中的问题(除了修改addrange()方法的实现,使它不去调用lock()和unlock()),还可以将互斥量std::mutex改为std::recursive_mutex

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
template < typename T>
class container
{          
     std::mutex _lock;
     std::vector<T> _elements;
public :
     void add(T element)
     {
         _lock.lock();
         _elements.push_back(element);
         _lock.unlock();
     }
 
     void addrange( int num, ...)
     {
         va_list arguments;
 
         va_start (arguments, num);
 
         for ( int i = 0; i < num; i++)
         {
             _lock.lock();
             add( va_arg (arguments, T));
             _lock.unlock();
         }
 
         va_end (arguments);
     }
 
     void dump()
     {
         _lock.lock();
         for (auto e : _elements)
             std::cout << e << std::endl;
         _lock.unlock();
     }
};
 
void func(container< int >& cont)
{
     cont.addrange(3, rand (), rand (), rand ());
}
 
int main()
{
     srand ((unsigned int ) time (0));
 
     container< int > cont;
 
     std:: thread t1(func, std::ref(cont));
     std:: thread t2(func, std::ref(cont));
     std:: thread t3(func, std::ref(cont));
 
     t1.join();
     t2.join();
     t3.join();
 
     cont.dump();
 
     return 0;
}

修改后,就会得到下面的输出结果。

1
2
3
4
5
6
7
8
9
6334
18467
41
6334
18467
41
6334
18467
41

聪明的读者会注意到每次调用func()都会产生相同的数字序列。这是因为种子数是线程本地化的,仅仅在主线程中调用了srand()对种子进行了初始化,在其他工作线程中并没用进行初始化,所以每次都得到相同的数字序列。

显式的加锁和解锁会导致一些问题,比如忘记解锁或者请求加锁的顺序不正确,进而产生死锁。该标准提供了一些类和函数帮助解决此类问题。这些封装类保证了在RAII风格上互斥量使用的一致性,可以在给定的代码范围内自动加锁和解锁。封装类包括:
Lock_guard:在构造对象时,它试图去获取互斥量的所有权(通过调用lock()),在析构对象时,自动释放互斥量(通过调用unlock()).这是一个不可复制的类。

Unique_lock:这个一通用的互斥量封装类,不同于lock_guard,它还支持延迟加锁,时间加锁和递归加锁以及锁所有权的转移和条件变量的使用。这也是一个不可复制的类,但它是可移动类。

有了这些封装类,我们可以像下面这样改写容器类:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
template < typename T>
class container
{
     std::recursive_mutex _lock;
     std::vector<T> _elements;
public :
     void add(T element)
     {
         std::lock_guard<std::recursive_mutex> locker(_lock);
         _elements.push_back(element);
     }
 
     void addrange( int num, ...)
     {
         va_list arguments;
 
         va_start (arguments, num);
 
         for ( int i = 0; i < num; i++)
         {
             std::lock_guard<std::recursive_mutex> locker(_lock);
             add( va_arg (arguments, T));
         }
 
         va_end (arguments);
     }
 
     void dump()
     {
         std::lock_guard<std::recursive_mutex> locker(_lock);
         for (auto e : _elements)
             std::cout << e << std::endl;
     }
};

有人也许会问,既然dump()方法并没有对容器的状态做任何修改,是不是应该定义为const方法呢?但是你如果将它定义为const,编译器会报出下面的错误:

‘std::lock_guard<_Mutex>::lock_guard(_Mutex &)’ : cannot convert parameter 1 from ‘const std::recursive_mutex’ to ‘std::recursive_mutex &’

一个互斥量(不管使用的哪一种实现)必须要获取和释放,这就意味着要调用非const的lock()和unlock()方法。所以从逻辑上来讲,lock_guard的参数不能使const(因为如果该方法为const,互斥量也必需是const).解决这个问题的办法就是将互斥量定义为可变的mutable,Mutable允许在常函数中修改状态。

不过,这种方法只能用于隐藏或者元状态(就像对计算结果或查询的数据进行缓存,以便下次调用时可以直接使用,不需要进行多次计算和查询。再或者,对在一个对象的实际状态起辅助作用的互斥量进行位的修改)。

1
2
3
4
5
6
7
8
9
10
11
12
13
template < typename T>
class container
{
    mutable std::recursive_mutex _lock;
    std::vector<T> _elements;
public :
    void dump() const
    {
       std::lock_guard<std::recursive_mutex> locker(_lock);
       for (auto e : _elements)
          std::cout << e << std::endl;
    }
};

这些封装类的构造函数可以重载,接受一个参数用来指明加锁策略。可用的策略如下:

  • defer_lock of type defer_lock_t:不获取互斥量的拥有权
  • try_to_lock of type try_to_lock_t:在不阻塞的情况下试图获取互斥量的拥有权
  • adopte_lock of type adopt_lock_t:假设调用线程已经拥有互斥量的所有权

这些策略的声明如下:

1
2
3
4
5
6
7
struct defer_lock_t { };
struct try_to_lock_t { };
struct adopt_lock_t { };
 
constexpr std::defer_lock_t defer_lock = std::defer_lock_t();
constexpr std::try_to_lock_t try_to_lock = std::try_to_lock_t();
constexpr std::adopt_lock_t adopt_lock = std::adopt_lock_t();

除了这些互斥量的封装类,该标准还提供了两个方法,用于对一个或多个互斥量进行加锁。

  • lock:使用一种可以避免死锁的算法对互斥量加锁(通过调用lock(),try_lock()和unlock()).
  • try_lock():按照互斥量被指定的顺序,试着通过调用try_lock()来对多个互斥量加锁。

 

这是一个发生死锁的例子:有一个用来存储元素的容器和一个函数exchange(),该函数用来交换两个容器中的元素。要成为线程安全函数,该函数通过获取每个容器的互斥量,来对两个容器的访问进行同步操作。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
template < typename T>
class container
{
public :
     std::mutex _lock;
     std::set<T> _elements;
 
     void add(T element)
     {
         _elements.insert(element);
     }
 
     void remove (T element)
     {
         _elements.erase(element);
     }
};
 
void exchange(container< int >& cont1, container< int >& cont2, int value)
{
     cont1._lock.lock();
     std::this_thread::sleep_for(std::chrono::seconds(1)); // <-- forces context switch to simulate the deadlock
     cont2._lock.lock();   
 
     cont1. remove (value);
     cont2.add(value);
 
     cont1._lock.unlock();
     cont2._lock.unlock();
}

假设这个函数是由两个不同的线程进行调用的,第一个线程中,一个元素从容器1中移除,添加到容器2中。第二个线程中,该元素又从容器2移除添加到容器1中。这种做法会导致发生死锁(如果在获取第一个锁后,线程上下文刚好从一个线程切换到另一个线程,导致发生死锁)。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
int main()
{
     srand ((unsigned int ) time (NULL));
 
     container< int > cont1;
     cont1.add(1);
     cont1.add(2);
     cont1.add(3);
 
     container< int > cont2;
     cont2.add(4);
     cont2.add(5);
     cont2.add(6);
 
     std:: thread t1(exchange, std::ref(cont1), std::ref(cont2), 3);
     std:: thread t2(exchange, std::ref(cont2), std::ref(cont1), 6)
 
     t1.join();
     t2.join();
 
     return 0;
}

要解决这个问题,可以使用std::lock来确保以避免发生死锁的方式来获取锁。

1
2
3
4
5
6
7
8
9
10
void exchange(container< int >& cont1, container< int >& cont2, int value)
{
     std::lock(cont1._lock, cont2._lock);
 
     cont1. remove (value);
     cont2.add(value);
 
     cont1._lock.unlock();
     cont2._lock.unlock();
}

条件变量C++11 还提供了另外一种同步原语,就是条件变量,它能使一个或多个线程进入阻塞状态,直到接到另一个线程的通知,或者发生超时或虚假唤醒时,才退出阻塞.在头文件<condition_variable> 里对条件变量有两种实现:

condition_variable:要求任何在等待该条件变量的线程必须先获取std::unique_lock锁。

Condition_variable_any:是一种更加通用的实现,可以用于任意满足锁的基本条件的类型(该实现只要提供了lock()和unlock()方法即可)。因为使用它花费的代价比较高(从性能和操作系统资源的角度来讲),所以只有在提供了必不可少的额外的灵活性的条件下才提倡使用它。

下面来讲讲条件变量的工作原理: 至少有一个线程在等待某个条件变为true。等待的线程必须先获取unique_lock 锁。该锁被传递给wait()方法,wait()方法会释放互斥量,并将线程挂起,直到条件变量接收到信号。收到信号后,线程会被唤醒,同时该锁也会被重新获取。

至少有一个线程发送信号使某个条件变为true。可以使用notify_one()来发送信号,同时唤醒一个正在等待该条件收到信号的处于阻塞状态的线程,或者用notify_all()来唤醒在等待该条件的所有线程。

在多处理器系统中,因为一些复杂情况,要想完全预测到条件被唤醒并不容易,还会出现虚假唤醒的情况。就是说,在没人给条件变量发送信号的情况下,线程也可能会被唤醒。所以线程被唤醒后,还需要检测条件是否为true。因为可能会多次发生虚假唤醒,所以需要进行循环检测。

下面代码是一个使用条件变量来同步线程的例子:几个工作线程运行时可能会产生错误并将错误代码放到队列里。记录线程会从队列里取出错误代码并输出它们来处理这些错误。发生错误的时候,工作线程会给记录线程发信号。记录线程一直在等待条件变量接收信号。为了避免发生虚假唤醒,该等待过程在循环检测条件的布尔值。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88

你可能感兴趣的:(C++11 中的线程、锁和条件变量)