C++11 并发编程教程 - Part 1 : thread 初探

注:文中凡遇通用的术语及行话,均不予以翻译。译文有不当之处还望悉心指正。

原文:C++11 Concurrency - Part 1 : Start Threads


   C++11 引入了一个新的线程库,包含了用于启动、管理线程的诸多工具,与此同时,该库还提供了包括互斥量、锁、原子量等在内的同步机制。在这个系列的教程中,我将尝试向大家展示这个新库提供的大部分特性。

   为了能够编译本文的示例代码,你需要有一个支持 C++11 的编译器,笔者使用的是 GCC4.6.1(你需要添加 "-std=c++11" 或 "-std=c++0x" 编译选项以启动 GCCC++11 的支持)[译注:bill 的编译环境为 GCC4.6.3 + codeblocks 10.05 + Ubuntu 12.04,所使用的编译选项为 "-std=gnu++0x"]。


启动线程

   启动一个新的线程非常简单,当你创建一个 std::thread 的实例时,它便会自行启动。创建线程实例时,必须提供该线程将要执行的函数,方法之一是传递一个函数指针,让我们以经典的 "Hello world" 来阐释这一方法:


#include 
#include 
void hello(){
    std::cout << "Hello from thread " << std::endl;
}
int main(){
    std::thread t1(hello);
    t1.join();
    return 0;
}


   所有的线程工具均置于头文件 中。这个例子中值得注意的是对函数 join() 的调用。该调用将导致当前线程等待被 join 的线程结束(在本例中即线程 main 必须等待线程 t1 结束后方可继续执行)。如果你忽略掉对 join() 的调用,其结果是未定义的 —— 程序可能打印出 "Hello from thread" 以及一个换行,或者只打印出 "Hello from thread" 却没有换行,甚至什么都不做,那是因为线程 main 可能在线程 t1 结束之前就返回了。


区分线程

   每个线程都有唯一的 ID 以便我们加以区分。使用 std::thread 类的 get_id() 便可获取标识对应线程的唯一 ID。我们可以使用 std::this_thread 来获取当前线程的引用。下面的例子将创建一些线程并使它们打印自己的 ID


#include 
#include 
#include 
void hello(){
    std::cout << "Hello from thread " << std::this_thread::get_id() << std::endl;
}
int main(){
    std::vector threads;
    for(int i = 0; i < 5; ++i){
        threads.push_back(std::thread(hello));
    }
    for(auto& thread : threads){
        thread.join();
    }
    return 0;
}

   依次启动线程并将他们存入 vector 是管理多个线程的常用伎俩,这样你便可以轻松地改变线程的数量。回到正题,就算是上面这样短小简单的例子,也不能断定其输出结果。理论情况是:


Hello from thread 140276650997504
Hello from thread 140276667782912
Hello from thread 140276659390208
Hello from thread 140276642604800
Hello from thread 140276676175616


   但实际上(至少在我这里)上述情况并不常见,你很可能得到的是如下结果:


Hello from thread Hello from thread Hello from thread 139810974787328Hello from thread 139810983180032Hello from thread
139810966394624
139810991572736
139810958001920


   或者更多其他的结果。这是因为线程之间存在 interleaving 。你没办法控制线程的执行顺序,某个线程可能随时被抢占,又因为输出到 ostream 分几个步骤(首先输出一个 string,然后是 ID,最后输出换行),因此一个线程可能执行了第一个步骤后就被其他线程抢占了,直到其他所有线程打印完之后才能进行后面的步骤。


使用 Lambda 表达式启动线程

   当线程所要执行的代码非常短小时,你没有必要专门为之创建一个函数,取而代之的是使用 Lambda 表达式。我们可以很轻易地将上述例子改写为使用 Lambda 表达式的形式:


#include 
#include 
#include 
int main(){
    std::vector threads;
    for(int i = 0; i < 5; ++i){
        threads.push_back(std::thread([](){
            std::cout << "Hello from thread " << std::this_thread::get_id() << std::endl;
        }));
    }
    for(auto& thread : threads){
        thread.join();
    }
    return 0;
}


   如上,我们使用了 Lambda 表达式替换掉原来的函数指针。毋庸置疑,这段代码和之前使用函数指针的代码实现了完全相同的功能。


下篇

   在本系列的下一篇文章中,我们将看到如何使用锁机制保护我们的并发代码。