可连接和分离的线程 | Joinable and Detached Threads

本文是对《Joinable And Detached Threads -- by Loïc》的简体中文的翻译版本。

介绍

默认情况下,创建的线程即是可连接的(或可结合的,joinable)。这意味着我们可以使用pthread_join()函数在任何其它线程中等待它(可连接线程)的终止:

#include 
int pthread_join(
    pthread_t thread,  //thread to join
    void **value_ptr   //store value returned by thread
);

这个函数将阻塞调用线程,直到目标线程thread终止。当value_ptr非空时,其中将包含着由thread线程返回的信息。在我们的文章POSIX线程参数传递 | Pthreads argument passing中看到了如何使用pthread_join()函数。

可连接的线程及其结果

一个线程在我们连接(join)它之前可能就已经终止了。结果是,当一个线程是可连接时,POSIX线程系统必须保持、维护某些信息:至少是该线程的ID和返回值(the returned value)[1]。的确,正在等待连接该线程的线程是需要这些信息的。
实际上,POSIX线程系统也可保持和可连接线程相关的其它资源信息,比如线程的栈。从POSIX的角度来看,这是完全合法的。事实上,pthread_join()保证回收与已连接线程的任何存储空间。

Pthreads的内部实现

维护整个线程的栈可能仅仅几个字节被确切需要,这看起来像是对系统资源的极大浪费(在一个64位的架构上,线程ID和返回值信息加起来一般也只需要16个字节)。然而,一些Pthreads实现使用这种可能性来简化和优化线程管理。实际上,线程实现需要存储和管理每个线程特有的属性,比如:

  • 线程ID,线程属性,起始入口函数,参数及返回值;
  • 线程的调度策略和优先级;
  • 信号掩码,备用信号栈;
  • 用于取消、清理缓存的标志;
  • 用于线程私有数据的键;
  • 错误编号;
  • ... ...

让我们称线程的这种管理存储为线程控制块(the Thread Control Block, TCB)。一种常见的技术是一次性分配堆栈和TCB(比如使用单次mmap()调用),并把TCB放在栈的开始位置处[2]。

在这样类似的架构上,我们不能在没有回收TCB的情况下回收整个栈。这就是问题的关键所在:对于连接操作所需要的信息是TCB的一部分,因此整个栈空间都需要被维持。众所周知,在Linux、AIX、Sloaris等的Pthreads的实现中都采用这种技术。

分离线程

那当我的线程不返回任何有用的信息,并且我不必等待它的完成时,我该怎么办?仅仅为了清理的意图,无论如何还是得必须调用pthrad_join()吗?
幸运的是,不必这样做。Pthreads提供了一种机制告诉管理系统:我正在开启这个线程,但我对连接它并没有兴趣;一旦该线程结束,请为我执行清理动作。这个操作叫做分离一个线程。我们可以按照如下方法分离一个线程:

  • 在线程的创建期间,采用detachstate线程属性
  • 在任何线程处调用pthread_detach()函数

让我们先看一下第二种形式,也是最简单的:

#include 
int pthread_detach(
    pthread_t thread  //thread to detach
);

函数pthread_detach()可以被任何线程调用,特别是从线程内分离(即自家线程调用,通过pthread_self() API可以获得它自己的线程ID)。
要想以分离状态创建一个线程,我们可以通过pthread_attr_setdetachstate()函数设置detachstate线程属性为PTHREAD_CREATE_DETACHED。如下所示:

#include 
#
pthread_t      tid;  // thread ID
pthread_attr_t attr; // thread attribute
#
// set thread detachstate attribute to DETACHED
pthread_attr_init(&attr);
pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
#
// create the thread 
pthread_create(&tid, &attr, start_routine, arg);
...

下述程序阐明了分离一个线程的两种方法。

/*------------------------------- join_01.c --------------------------------*
On Linux, compile with: 
cc -std=c99 -pthread join_01.c -o join_01 
 #
Check your system documentation how to enable C99 and POSIX threads on 
other Un*x systems.
 #
Copyright Loic Domaigne. 
Licensed under the Apache License, Version 2.0.
*--------------------------------------------------------------------------*/
 #
#include   // sleep()
#include  
#include    
#include   // EXIT_SUCCESS
#include   // strerror() 
#include 
 #
/***************************************************************************/
/* our macro for errors checking                                           */
/***************************************************************************/
#define COND_CHECK(func, cond, retv, errv) \
if ( (cond) ) \
{ \
   fprintf(stderr, "\n[CHECK FAILED at %s:%d]\n| %s(...)=%d (%s)\n\n",\
              __FILE__,__LINE__,func,retv,strerror(errv)); \
   exit(EXIT_FAILURE); \
}
 #
#define ErrnoCheck(func,cond,retv)  COND_CHECK(func, cond, retv, errno)
#define PthreadCheck(func,rc) COND_CHECK(func,(rc!=0), rc, rc)
 #
/*****************************************************************************/
/* thread- dummy thread                                                      */
/*****************************************************************************/
void*
thread(void* ignore)
{
   sleep(1);
   return NULL;
}
 #
/*****************************************************************************/
/* detach_state. Print detachstate of a thread.                              */
/*****************************************************************************/
/* 
 * We find out indirectly if a thread is detached using pthread_join().  
 * If a thread is detached, then pthread_join() fails with EINVAL. 
 * Otherwise the thread is joined, and hence was joinable. 
 *
 */
void
detach_state(
   pthread_t   tid,  // thread to check detach status
   const char *tname // thread name
   )
{
   int rc; // return code
 #
   rc = pthread_join(tid, NULL);
   if ( rc==EINVAL ) 
   {
      printf("%s is detached\n", tname);
   }
   else if ( rc==0 )  
   {  
      printf("%s was joinable\n", tname);
   }
   else 
   {
      printf("%s: pthread_join() = %d (%s)\n", 
             tname, rc, strerror(rc)
            );
   }
}
 #
/*****************************************************************************/
/* main- main thread                                                         */
/*****************************************************************************/
int
main()
{
   pthread_t tid1, tid2, tid3; // thread 1,2 and 3.
   pthread_attr_t attr;        // thread's attribute
   int rc;  // return code
 #
   /*--------------------------------------------------------*/
   /* 1st test: normal thread creation                       */
   /*--------------------------------------------------------*/
   rc = pthread_create(&tid1, NULL, thread, NULL);
   PthreadCheck("pthread_create", rc);
   detach_state(tid1, "thread1"); // expect: joinable 
 #
   /*--------------------------------------------------------*/
   /* 2nd test: detach thread from main thread               */
   /*--------------------------------------------------------*/
   rc = pthread_create(&tid2, NULL, thread, NULL);
   PthreadCheck("pthread_create", rc);
   rc = pthread_detach(tid2);
   PthreadCheck("pthread_detach", rc);
   detach_state(tid2, "thread2"); // expect: detached
 #
   /*--------------------------------------------------------*/
   /* 3rd test: create detached thread                       */
   /*--------------------------------------------------------*/
 #
   // set detachstate attribute to DETACHED
   //
   rc=pthread_attr_init(&attr);
   PthreadCheck("pthread_attr_init", rc);
   rc=pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
   PthreadCheck("pthread_attr_setdetachstate", rc);
 #
   // create thread now 
   //
   rc = pthread_create(&tid3, &attr, thread, NULL);
   PthreadCheck("pthread_create", rc);
   detach_state(tid3, "thread3");
 #
   /*--------------------------------------------------------*/
   /* that's all folks!                                      */
   /*--------------------------------------------------------*/
   return EXIT_SUCCESS;
}

对于连接或分离最重要的规则就是:

  • 不要连接一个已经被连接的线程;(注:已连接的线程栈空间已被收回,再次连接将得不到可连接线程的信息)
  • 不要连接一个分离线程;(注:连接操作只可用于可连接的线程,因为分离线程栈空间的收回是由系统内部来做的)
  • 如果你分离一个线程,你不能“重连接”它;(注:调用pthread_detach()后,可连接线程的栈空间已被收回,无法再恢复)

Notes and further Reading

  • [1] pthread & detach. A post on c.p.t. where Patrick TJ MacPhee explains that (in theory) only the thread ID and returned value should be retained.
  • [2] pthread_join and thread stack. A post on c.p.t. where Paul Pluzhnikov explains why the stack is held until the thread is joined.
  • The main thread. Article where we discuss the special semantic of the main thread.
  • Pthreads argument passing. Article where we discuss how to pass arguments between threads.
  • David R. Butenhof: Programming with POSIX Threads, Addison-Wesley, ISBN-13 978-0-201-63392-4. See in particular Section 2.1, pp 35-39 and section 5.2.3, pp 138-141.

你可能感兴趣的:(可连接和分离的线程 | Joinable and Detached Threads)