在C++11之前,涉及到多线程问题,都是和平台相关的,比如windows和linux下各有自己的接口,这使得代码的可移植性比较差。
//在C++98标准下,实现可移植的多线程程序 —— 条件编译
#ifdef _WIN32
CreateThread(); //在windows系统下,调用windows多线程接口
//......
#elif __linux__
pthread_create(); //在linux系统下,调用pthread线程库接口
//......
#endif
C++11中最重要的特性就是对多线程编程进行了支持,而且还引入了原子操作和原子类。
注意:要使用C++11标准库中的多线程接口,必须包含< thread >
头文件。
thread线程对象可以关联一个线程,用来控制线程以及获取线程的状态。
thread类成员函数 | 对应的pthread库函数 | 函数功能 | 使用方法 |
---|---|---|---|
thread(); | —— | 构造一个线程对象,没有关联任何线程函数,即没有启动任何线程 | thread类的默认构造,并没有创建出子线程。 |
template |
pthread_create(); | 构造一个线程对象,并关联线程函数fn;args1,args2,…为线程函数的参数 | 万能应用和可变参数模板:线程函数fn可以传函数指针,函数对象,lambda表达式;线程函数的参数可以传任意类型,任意数量。 |
get_id(); | pthread_self(); | 获取线程id | get_id的返回值是自定义类型thread::id,id类重载了所有的关系运算符和流插入运算符(<<),用于比较和输出线程id。如果不想通过thread类成员函数获取线程id,可以调用全局函数this_thread::get_id() |
join(); | pthread_join(); | 阻塞等待子线程 | —— |
joinable(); | —— | 检查线程是否可以被join:如果线程已经被join或者已经被detach,则该函数返回false,否则返回true。 | 如果该函数返回true,那么我们可以安全地调用join()函数来等待线程结束。如果该函数返回false,那么我们应该避免调用join()函数,否则会导致程序崩溃。 |
detach(); | pthread_detach(); | 分离子线程,它的资源将在线程结束时自动释放,无需其他线程调用join 函数来等待它的结束。 |
—— |
线程对象的创建
当创建一个线程对象后,没有提供线程函数,该对象实际没有对应任何线程。
当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。
线程函数一般情况下可按照以下三种方式提供:
线程对象的移动
thread类是防拷贝的,不允许拷贝构造以及拷贝赋值,因为拷贝线程是没有实际意义的。但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不影响线程的执行。
移动构造和移动赋值的意义:分离线程的创建和启动,可以先使用默认构造创建一个空线程对象,再在合适的时候使用移动赋值关联线程函数,启动线程。
测试程序:
// 创建多个线程求1~n的和:
int main()
{
int m = 0;
cin >> m;创建一个空线程对象
vector<thread> vthds(m); // 调用thread类的默认构造,创建m个空线程对象
vector<int> nums(m, 0);
for (auto &e : nums)
{
cin >> e;
}
for (int i = 0; i < m; ++i)
{
// 调用thread类的移动赋值关联线程函数,启动线程
// 这里用lambda表达式充当线程函数
vthds[i] = thread([](int num){
int sum = 0;
for(int j = 1; j <= num; ++j)
{
sum += j;
}
//调用全局函数this_thread::get_id获取线程id
cout << "[" << this_thread::get_id() << "]: " << sum << endl; },
nums[i]);
}
for (auto &t : vthds) // thread类禁用拷贝构造,所以必须加引用
{
t.join();
}
}
运行结果:
判断线程对象是否有效
可以通过jionable()函数判断线程是否是有效的,如果是以下任意情况,则线程无效
线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,因此:即使线程参数为引用类型,在线程中修改后也不能修改外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参。
// 线程函数的参数
#include
int k = 0;
void ThreadFunc1(int *x)
{
*x += 10;
}
void ThreadFunc2(int &x)
{
x += 10;
}
class A
{
public:
int i = 10;
static void ThreadFunc3()
{
k += 10;
}
void ThreadFunc4()
{
i += 101;
}
};
int main()
{
// 线程函数的参数可以传外部变量的地址(将地址拷贝到线程独立栈)
thread t1(ThreadFunc1, &k);
t1.join();
cout << k << endl;
// 线程函数的参数不能直接传外部变量的引用(实际引用的是线程栈中的拷贝)
// thread t2(ThreadFunc2, k); // 在线程函数中对k修改,不会影响外部实参,有些编译器可能直接编译报错
thread t2(ThreadFunc2, std::ref(k)); // 如果想要通过形参改变外部实参,必须借助std::ref()函数传引用
t2.join();
cout << k << endl;
// 静态成员函数和普通函数类似,只是需要注明类域
thread t3(A::ThreadFunc3); // 取静态成员函数的地址可以不加&
t3.join();
cout << k << endl;
// 非静态成员函数作线程函数时,必须将this指针(调用对象的地址)作为线程函数的参数。
A a;
thread t4(&A::ThreadFunc4, &a); // 取非静态成员函数的地址必须加&
t4.join();
cout << a.i << endl;
return 0;
}
运行结果:
std::ref()函数模板,用于保存变量的引用
this_thread是一个访问当前线程的函数集合
get_id
:返回当前线程的线程ID
sleep_until
:该线程休眠到某个时间点(绝对时间)
参数:chrono::time_point类模板的实例化类型
用法:sleep_until - C++ Reference (cplusplus.com)
sleep_for
:该线程休眠持续某个时间段(相对时间)
参数:chrono::duration类模板的实例化类型
用法:std::this_thread::sleep_for (std::chrono::seconds(1)); // 调用线程休眠1秒
提示:chrono既是头文件,又是命名空间
yield
:主动出让线程的时间片
在C++11中,Mutex总共包了四个互斥量的种类:
// mutex
int main()
{
mutex mtx;
int x = 0;
int n = 100000;
auto threadfunc = [&, n]()
{
mtx.lock();
for (int i = 0; i < n; ++i)
{
++x;
}
mtx.unlock();
};
thread t1(threadfunc);
thread t2(threadfunc);
t1.join();
t2.join();
cout << x << endl;
return 0;
}
注意,线程函数调用lock()时,可能会发生以下三种情况:
如果该互斥量当前没有被锁住,则调用线程将该互斥量锁住,直到调用 unlock之前,该线程一直拥有该锁
如果当前互斥量被其他线程锁住,则当前的调用线程被阻塞住
如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
线程函数调用try_lock()时,可能会发生以下三种情况:
测试程序:
// recursize_mutex
int x = 0;
void threadfunc(int n, recursive_mutex *mtx)
{
if(n == 0)
return;
mtx->lock();
++x;
threadfunc(n-1, mtx); //允许同一个线程对互斥量多次上锁(即递归上锁)
mtx->unlock(); //释放互斥量时需要调用与该锁层次深度相同次数的 unlock()
}
int main()
{
recursive_mutex mtx; //定义一个递归互斥锁
thread t1(threadfunc, 100000, &mtx);
thread t2(threadfunc, 200000, &mtx);
t1.join();
t2.join();
cout << x << endl;
return 0;
}
std::recursive_timed_mutex
结合recursive_mutex和timed_mutex的特点,不做介绍。
手动加锁,解锁的缺陷:锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁的范围内抛异常。因此:C++11采用RAII的方式对锁进行了封装,即lock_guard和unique_lock。
std::lock_gurad 是 C++11 中定义的模板类。定义如下:
template<class _Mutex>
class lock_guard
{
public:
// 在构造lock_gard时加锁
explicit lock_guard(_Mutex& _Mtx)
: _MyMutex(_Mtx)
{
_MyMutex.lock();
}
// 在构造lock_gard时,_Mtx已经被上锁,此处不需要再上锁
lock_guard(_Mutex& _Mtx, adopt_lock_t)
: _MyMutex(_Mtx)
{}
// 在析构lock_guard时解锁
~lock_guard() _NOEXCEPT
{
_MyMutex.unlock();
}
// lock_guard不允许拷贝
lock_guard(const lock_guard&) = delete;
lock_guard& operator=(const lock_guard&) = delete;
private:
_Mutex& _MyMutex; //注意:互斥锁不支持拷贝,所以成员变量是互斥锁的引用
};
与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装,并且也是以独占所有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。
在构造(或移动(move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,新创建的unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。使用以上类型互斥量实例化unique_lock的对象时,自动调用构造函数上锁,unique_lock对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。
// lock_guard && unique_lock
int x = 0;
mutex mtx;
void threadfunc(int n)
{
for (int i = 0; i < n; ++i)
{
try
{
// mtx.lock();
// lock_guard和unique_lock会在构造时加锁,析构时解锁
// lock_guard lock(mtx);
unique_lock<mutex> lock(mtx);
++x;
// 抛异常,会跳过unlock函数使程序不能继续执行
if (rand() % 3 == 0)
{
throw exception();
}
// mtx.unlock();
}
catch (const exception &e)
{
cerr << "抛异常" << endl;
}
};
}
int main()
{
srand((unsigned int)time(nullptr));
thread t1(threadfunc, 10);
thread t2(threadfunc, 20);
t1.join();
t2.join();
cout << x << endl;
return 0;
}
与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:
本节主要演示了condition_variable的使用,condition_variable熟悉我们linux课程已经讲过了,他们用来进行线程之间的互相通知。condition_variable和Linux posix的条件变量并没有什么大的区别,主要还是面向对象实现的。
测试程序:
// 1~100,t1打印奇数,t2打印偶数
int main()
{
mutex mtx;
int x = 1;
int n = 12345;
// 1个共享资源,相同条件(奇或偶),定义1个条件变量
condition_variable cv;
// 创建并启动2个子线程
thread t1([&, n]()
{
while (x<=n)
{
unique_lock<mutex> lock(mtx);
// if(x > n) break; // 错误
// wait参数:unique_lock, 通关条件
cv.wait(lock, [&x](){return x%2 == 1;});
// 等效的实现方法:
// while (!(x % 2 == 1)) // 防止伪唤醒
// {
// cv.wait(lock);
// }
if(x > n) break; // 条件判断必须放在wait之后
cout << "[t1]" << ":" << x << endl;
++x;
cv.notify_one();
} });
thread t2([&, n]()
{
while(x<=n)
{
unique_lock<mutex> lock(mtx);
cv.wait(lock, [&x](){return x%2 == 0;});
// 等效的实现方法:
// while(!(x%2 == 0)) // 阻塞条件
// {
// cv.wait(lock);
// }
if(x > n) break;
cout << "[t2]" << ":" << x << endl;
++x;
cv.notify_one();
} });
t1.join();
t2.join();
return 0;
}
运行结果:
如何确定条件变量的数量?
对于确定条件变量的数量,一般是根据要控制的共享资源或者线程的数量来确定的。如果有多个共享资源或者多个线程需要等待不同的条件来执行,就需要相应数量的条件变量。
如果要控制多个线程对同一个共享资源的访问,可以使用一个条件变量来控制所有线程的等待和唤醒。如果需要不同的条件来控制不同的线程,就需要针对不同的条件使用不同的条件变量。
总结:1个共享资源 + 相同条件 = 1个条件变量
多线程最主要的问题是共享数据带来的问题(即线程安全)。如果共享数据都是只读的,那么没问题,因为只读操作不会影响到数据,更不会涉及对数据的修改,所以所有线程都会获得同样的数据。但是,当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。
对此,C++98中传统的解决方式:可以对共享修改的数据可以加锁保护。虽然加锁可以解决,但是加锁有一个缺陷就是:临界区代码必须串行执行,只要一个线程在执行临界区代码时,其他线程就会被阻塞,会影响程序运行的效率,而且锁如果控制不好,还容易造成死锁。
因此C++11中引入了原子操作(CAS)。所谓原子操作:即不可被中断的一个或一系列操作,C++11引入的原子操作类型,使得线程间数据的同步变得非常高效。
在C++11中,程序员不需要对原子类型变量进行加锁解锁操作,线程能够对原子类型变量互斥的访问。
#include
using namespace std;
#include
#include
atomic_long sum{ 0 }; //定义原子类型
void fun(size_t num)
{
for (size_t i = 0; i < num; ++i)
sum ++; // 原子操作,不需要进行加锁解锁操作
}
int main()
{
cout << "Before joining, sum = " << sum << std::endl;
thread t1(fun, 1000000);
thread t2(fun, 1000000);
t1.join();
t2.join();
cout << "After joining, sum = " << sum << std::endl;
return 0;
}
atomic库中的内置原子类型实际上是atomic类模板的实例化类型。
注意:需要使用以上原子操作变量时,必须添加头文件
更为普遍的,程序员可以使用atomic类模板,定义出需要的任意原子类型。
注意:原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了。
#include
int main()
{
atomic<int> a1(0);
//atomic a2(a1); // 编译失败
atomic<int> a2(0);
//a2 = a1; // 编译失败
return 0;
}
CAS(Compare and Swap)操作是一种原子操作,用于实现并发控制。它的原理是:
CAS操作的关键在于比较共享变量的值与期望值是否相等,如果相等则说明共享变量没有被其他线程修改,可以执行写入操作。如果不相等则说明共享变量已经被其他线程修改,需要重新读取共享变量的值并再次比较。这样就可以保证对共享变量的操作是原子的,避免了并发问题。
详细内容请阅读陈浩老师的文章:无锁队列的实现 {CAS操作的原理,无锁队列的链表实现,CAS的ABA问题,无锁队列的数组实现}-CSDN博客
加锁和原子操作都是用于处理多线程并发访问共享资源的工具,它们各自有一些优势和适用场景。
加锁的优点:
原子操作的优点:
在实际应用中,应根据具体的需求和场景来选择使用加锁还是原子操作。通常情况下,如果需要实现简单的原子操作,比如自增、自减等操作,原子操作是更好的选择;而如果需要复杂的线程同步逻辑或者需要精确控制临界区的范围,加锁是更合适的选择。