一个空列表,用两个函数(只可调用一次)轮流写入值(一个写奇数,一个写偶数), 最终实现列表的值为1-100,有序排列。
简单分析:假设这两个函数分别为A和B,A函数往列表中写奇数,B函数往列表中写偶数。因为要求交替写,若A先写,则在B写一个偶数之前需要等待A先把上一个奇数写完,B写完一个偶数之后需要通知A,A写完一个奇数之后要通知B,这就存在同步关系了,自然就想到了使用条件变量。而两个函数只可调用一次,那自然想到了使用线程,让两个函数独立运行,并使用条件变量来同步写操作。
来看看使用标准库提供的并发API如何实现上述功能,代码示例如下:
#include
#include
#include
#include
#include
#include
std::mutex mtx;
std::condition_variable cv;
const int NUM = 100;
int current_tid = 0; // 通过id来控制线程之间的同步顺序
std::vector<int> nums(NUM);
// 通过参数 tid 来标识线程
void work_odd(int tid) {
for (int i = 1; i <= NUM; i++) {
std::unique_lock<std::mutex> locker(mtx);
cv.wait(locker, [=](){ return current_tid == tid; });
if (i % 2 == 1) {
nums[i - 1] = i;
}
current_tid = (current_tid + 1) % 2;
cv.notify_one(); // 唤醒阻塞在条件变量上的一个线程
}
}
void work_even(int tid) {
for (int i = 1; i <= NUM; i++) {
std::unique_lock<std::mutex> locker(mtx);
cv.wait(locker, [=](){ return current_tid == tid; });
if (i % 2 == 0) {
nums[i - 1] = i;
}
current_tid = (current_tid + 1) % 2;
cv.notify_one();
}
}
int main()
{
std::thread t1(work_odd, 0);
std::thread t2(work_even, 1);
t1.join();
t2.join();
std::for_each(nums.begin(), nums.end(), [](auto e){ std::cout << e << ' '; });
std::cout << std::endl;
}
以上面的代码为例,先来快速上手一下,在标准库中,如何使用 thread
开启一个新的线程,如何使用互斥量 mutex
来互斥的访问临界区,以及如何使用条件变量 condition_variable
来实现线程之间的同步。
thread 的声明如下所示,第一个参数为一个可调用对象,第二参数表示一个可变参数。
template <class Fn, class... Args>
explicit thread (Fn&& fn, Args&&... args);
按照如上函数声明初始化一个 thread 对象后,即开启了一个新的线程。在使用 thread 创建线程进行并发编程时,需要注意以下几点:
这里对上述注意事项中的第三点进行一个补充,代码示例如下:
void func()
{
std::cout << "start func" << std::endl;
// 运行过程中有异常产生,没有进行捕获
throw std::runtime_error("runtime error");
std::cout << "end func" << std::endl;
}
int main()
{
std::cout << "start main" << std::endl;
// 尝试捕获异常,但是无效!
try {
std::thread t1(func);
t1.join(); // 这样写是不对的,《Effective Modern C++》Item35 和 Item37 有解释
} catch(const std::exception& e) {
std::cout << e.what() << std::endl;
}
std::cout << "end main" << std::endl;
}
/*
运行结果为:
start main
start func
terminate called after throwing an instance of 'std::runtime_error'
what(): runtime error
Aborted
*/
thread 的其他 API 使用方法,文档中已有详细介绍,这里不再赘述。对于上述列的三点注意事项,展开说来又是一篇文章了。
使用 thread 开启一个新的线程非常简单,一行代码就搞定。接下来介绍互斥量 (mutex) 的基本使用。
在C++标准库中,提供了好几种互斥量类型,mutex、recursive_mutex、timed_mutex、recursive_timed_mutex,C++14增加了shared_timed_mutex,C++17增加了shared_mutex。本文只介绍 mutex 的基本使用。
mutex 是一种排他的互斥量,在并发环境中,进入临界区前先对互斥量进行加锁操作,临界区访问结束后对互斥量进行解锁操作。mutex 的使用也很简单,如下代码示例所示:
std::mutex mtx; // 创建了一个互斥量
// 进入临界区前先加锁,若加锁失败(当前线程之前,已有其他线程加锁),当前线程会被阻塞在该处
mtx.lock();
// 临界区
// ......
// 临界区
mtx.unlock();
如上示例所示,使用C++标准库提供的 mutex 非常方便。但是上述形式的用法可能存在以下两个问题,在并发编程中要尽量避免。
为避免上述两种的情况,C++标准库提供了非常方便的 mutex 管理类,lock_guard 和 unique_lock(基于C++11),C++14增加了shared_lock,C++17增加了scoped_lock。本文只介绍 unique_lock,若要全面介绍这四种 mutex 管理类及其使用场景,又是另一篇文章了。
使用基于 unique_lock 解决使用原始 mutex 可能产生的两个问题,代码示例如下:
std::mutex mtx; // 创建了一个互斥量
// 使用花括号限定 unique_lock 的作用域
{
std::unique_lock<std::mutex> locker(mtx);
// 临界区
// ......
// 临界区
}
unique_lock 类定义等价于如下代码:
class unique_lock {
public:
explicit unique_lock(std::mutex& m):mtx(m) {
mtx.lock();
}
unique_lock(const unique_lock&) = delete;
~unique_lock() {
mtx.unlock();
}
private:
std::mutex& mtx;
};
因此,使用 unique_lock 来管理 mutex 是一种资源获取即初始化(Resource Acquisition Is Initialization;RAII)的思想。
在多线程环境中,线程的执行过程在某个时间段内可能存在先后关系,比如B线程运行到某个时刻点时,需要等待A线程的某个特定事件发生后才能继续往下执行,这种关系又称为同步。解决这种线程通信的问题的一种方案为 条件变量。
在C++标准库中,条件变量 std::condition_variable 的使用和 thread、mutex 一样简单,C++标准库提供了非常简洁的接口。接下来先来看看条件变量的基本用法长什么样,然后结合上述的面试题,来尝试总结如何使用条件变量解决线程间的同步关系。
条件变量的基本用法如下所示:
std::condition_variable cv; //事件的条件变量
std::mutex mtx; //配合cv使用的mutex
// 关键代码部分
{
std::unique_lock<std::mutex> locker(mtx);
cv.wait(mtx, [](){ /* 等待事件是否发生的条件判断 */ });
// 对事件进行反应,执行相关操作。此时 mtx 已经上锁
// ...
// 可选的操作,通知一个或所有等待该事件的线程
// cv.notify_one();
// cv.notify_all();
} // 退出该作用域,unique_lock执行析构函数,调用mtx.unlock()
以上述的面试题为例,看看 std::condition_variable 如何使用。简化的代码示例如下:
std::condition_variable cv; //事件的条件变量
std::mutex m; //配合cv使用的mutex
// 用来控制事件变化的变量
int current_tid = 0;
void func(int tid)
{
std::unique_lock<std::mutex> locker(mtx);
cv.wait(locker, [=](){ return current_tid == tid; });
// ...
// 相关操作
// ...
current_tid = (current_tid + 1) % 2; // 改变条件
cv.notify_one(); // 唤醒阻塞在条件变量上的一个线程
}
int main()
{
std::thread t1(func, 0);
std::thread t2(func, 1);
// 省略一些代码...
}
解释一下上述代码:
std::unique_lock locker(mtx);
语句将 mtx 锁住之后,调用 cv.wait() 语句;因为cv.wait() 语句的第二个参数返回 false (在上面示例中,等价于 current_tid != tid
),cv.wait() 该语句将当前线程阻塞,在阻塞前会调用 mtx.unlock() 释放互斥锁;然后当前被阻塞,等待其他线程调用 cv.notify_one() 或 cv.notify_all() 将该线程唤醒。小结:
使用条件变量控制线程之间的同步关系时,关键在如何将事件变化的关系抽象出来,用一个合适的变量(数据结构)来表示该事件的状态,通过改变变量的值(事件的状态)来控制线程之间的同步关系。