Posix 多线程编程—线程基础

一.什么是线程
  在一个程序里的多个执行路线就叫做线程。更准确的定义是:线程是“一个进程内部的一个控制序列”。
典型的unix进程可以看成只有一个控制线程:一个进程在同一时刻只做一件事情。有了多个控制线程以后,在程序设计时可以把进程设计成在同一时刻能够做不止一件事,每个线程处理各只独立的任务。
二.线程的优点
(1) 通过为每种事件类型的处理分配单独的线程,能够简化处理异步时间的代码。
(2) 多个线程可以自动共享相同的存储地址空间和文件描述符。
(3) 有些问题可以通过将其分解从而改善整个程序的吞吐量。
(4) 交互的程序可以通过使用多线程实现相应时间的改善,多线程可以把程序中处理用户输入输出的部分与其它部分分开。
三.线程的缺点
    线程也有不足之处。编写多线程程序需要更全面更深入的思考。在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的。调试一个多线程程序也比调试一个单线程程序困难得多。
四.线程的结构
    线程包含了表示进程内执行环境必需的信息,其中包括进程中标识线程的线程ID,一组寄存器值、栈、调度优先级和策略、信号屏蔽子,errno变量以及线程私有数据。进程的所有信息对该进程的所有线程都是共享的,包括可执行的程序文本,程序的全局内存和堆内存、栈以及文件描述符。
五.线程标识
    就像每个进程有一个进程ID一样,每个线程也有一个线程ID,进程ID在整个系统中是唯一的,但线程不同,线程ID只在它所属的进程环境中有效。线程ID用pthread_t数据类型来表示,实现的时候可以用一个结构来代表pthread_t数据类型,所以可以移植的操作系统不能把它作为整数处理。因此必须使用函数来对来对两个线程ID进行比较。
1.名称:pthread_equal
功能:比较两个线程ID
头文件:#include
函数原形:int pthread_equal(pthread_t tid1,pthread_t tid2);
参数:tid1 进程1id, tid2 进程2id
返回值:若相等返回非0值,否则返回0
2.名称:pthread_self
功能:获取自身线程的id
头文件:#include
函数原形:pthread_t pthread_self(void);
参数:无
返回值:调用线程的线程id
六.线程的创建  
3.名称:pthread_create
功能:创建线程
头文件:#include
函数原形:int pthread_create(pthread_t *restrict tidp,const pthread _attr_t *restrict attr,void *(*start_rtn)(void),void *restrict arg);
参数:
返回值:若成功返回则返回0,否则返回错误编号
    当pthread_creat成功返回时, tidp指向的内存单元被设置为新创建线程的线程ID。attr参数用于定制各种不同的线程属性。可以把它设置为NULL,创建默认的线程属性。新创建的线程从start_rtn函数的地址开始运行,该函数只有一个无类型指针参数arg,如果需要向start_rtn函数传递的参数不止一个,那么需要把这些参数放到一个结构中,然后把这个结构的地址作为arg参数传入。
#include
void printids(const char *s)
{
printf(“%s pid:%u tid:%u \n“, getpid(),pthread_self());
}
void *thr_fn(void *arg)
{
printf (“new thread: “);
}
int main()
{
int err;
pthread_t tid;
err=pthread_create(&tid,NULL,thr_fn,NULL);
if(err=0)
printf(“can’t create thread:%s\n”,strerror(err));
printids(“main thread: “);
sleep(1);
exit(0);
}
关于进程的编译我们都要加上参数 –lpthread 否则提示找不到函数的错误
具体编译方法是 cc –lpthread –o gettid gettid.c
运行结果为
main thread: pid 14954 tid 134529024
new thread: pid 14954 tid 134530048
七.线程的终止
    线程是依进程而存在的,当进程终止时,线程也就终止了。当然也有在不终止整个进程的情况下停止它的控制流。
(1)线程只是从启动例程中返回,返回值是线程的退出码。
(2)线程可以被同一进程中的其他线程取消。
(3)线程调用pthread_exit.
4.名称:pthread_exit
功能:终止一个线程 
头文件:#include
函数原形:void pthread_exit(void *rval_ptr);
参数:rval_prt是一个无类型指针,与传给启动例程的单个参数类似。进程中的其他线程可以调用pthread_join函数访问到这个指针。
返回值:无 
5.名称:pthread_join
功能:获得进程的终止状态
头文件:#include
函数原形:int pthread_join(pthread_t thread,void **rval_ptr);
参数:
返回值:若成功返回0,否则返回错误编号。
    当一个线程通过调用pthread_exit退出或者简单地从启动历程中返回时,进程中的其他线程可以通过调用pthread_join函数获得进程的退出状态调用pthread_join进程将一直阻塞,直到指定的线程调用pthread_exit,从启动例程中或者被取消。
如果线程只是从它的启动历程返回,rval_ptr将包含返回码。
#include
#include
void *thr_fn1(void *arg)
{
printf(“thread 1 returning\n”);
return((void *)1);
}
void *thr_fn2(void *arg)
{
printf(“thread 2 exiting\n”);
return((void *)2);
}
int main()
{
pthread_t tid1,tid2;
void *tret;
pthread_create(&tid1,NULL,thr_fn1,NULL);
pthread_create(&tid2,NULL,thr_fn2,NULL);
pthread_join(tid1,&tret);
printf(“thread 1 exit code %d\n”,(int)tret);
pthread_join(tid2,&tret);
printf(“thread 2 exit code %d\n”,(int)tret);
exit(0);
}
结果是:
thread 1 returning
thread 2 exiting
thread 1 exit code 1
thread 2 exit code 2

附:注意点

(1) pthread_join 使一个线程等待另一个线程结束。
代码中如果没有pthread_join主线程会很快结束从而使整个进程结束,从而使创建的线程没有机会开始执行就结束了。加入pthread_join后,主线程会一直等待直到等待的线程结束自己才结束,使创建的线程有机会执行。
(2) 在编译的时候需要注意,由于线程创建函数在libpthread.so库中,所以在编译命令中需要将该库导入。命令如下:

gcc –o createthread –lpthread createthread.c
(3) 如果想传递参数给线程函数,可以通过其参数arg,其类型是void *。如果你需要传递多个参数的话,可以考虑将这些参数组成一个结构体来传递。另外,由于类型是void *,所以你的参数不可以被提前释放掉。
下面一个例子结合上面的内容:
int main ()
{
pthread_t thread1_id;
pthread_t thread2_id;
struct char_print_parms thread1_args;
struct char_print_parms thread2_args;
/* Create a new thread to print 30,000 x’s. */
thread1_args.character = ’x’;
thread1_args.count = 30000;
pthread_create (&thread1_id, NULL, &char_print, &thread1_args);
/* Create a new thread to print 20,000 o’s. */
thread2_args.character = ’o’;
thread2_args.count = 20000;
pthread_create (&thread2_id, NULL, &char_print, &thread2_args);
/* Make sure the first thread has finished. */
pthread_join (thread1_id, NULL);
/* Make sure the second thread has finished. */
pthread_join (thread2_id, NULL);
/* Now we can safely return. */
return 0;

}

(4)  线程属性
    在我们前面提到,可以通过pthread_join()函数来使主线程阻塞等待其他线程退出,这样主线程可以清理其他线程的环境。但是还有一些线程,更喜欢自己来清理退出的状态,他们也不愿意主线程调用pthread_join来等待他们。我 们将这一类线程的属性称为detached。如果我们在调用pthread_create()函数的时候将属性设置为NULL,则表明我们希望所创建的线 程采用默认的属性,也就是joinable。如果需要将属性设置为detached,则参考下面的例子:
#include
#include
void * start_run(void * arg)
{
//do some work
}
int main()
{
pthread_t thread_id;
pthread_attr_t attr;
pthread_attr_init(&attr);
pthread_attr_setdetachstate(&attr,PTHREAD_CREATE_DETACHED);
pthread_create(&thread_id,&attr,start_run,NULL);
pthread_attr_destroy(&attr);
sleep(5);
exit(0);
}
   在线程设置为joinable后,可以调用pthread_detach()使之成为detached。但是相反的操作则不可以。还有,如果线程已经调用pthread_join()后,则再调用pthread_detach()则不会有任何效果。
(5) 前面提到线程可以通过自身执行结束来结束,也可以通过调用pthread_exit()来结束线程的执行。另外,线程甲可以被线程乙被动结束。这个通过调用pthread_cancel()来达到目的。当然,线程也不是被动的被别人结束。它可以通过设置自身的属性来决定如何结束
    线程的被动结束分为两种,一种是异步终结,另外一种是同步终结。异步终结就是当其他线程调用 pthread_cancel的时候,线程就立刻被结束。而同步终结则不会立刻终结,它会继续运行,直到到达下一个结束点(cancellation point)。当一个线程被按照默认的创建方式创建,那么它的属性是同步终结。
通过调用pthread_setcanceltype()来设置终结状态。
int pthread_setcanceltype(int type, int *oldtype);
state:要设置的状态,可以为PTHREAD_CANCEL_DEFERRED或者为PTHREAD_CANCEL_ASYNCHRONOUS
    那么前面提到的结束点又如何设置?最常用的创建终结点就是调用pthread_testcancel()的地方。该函数除了检查同步终结时的状态,其他什么也不做。     上面一个函数是用来设置终结状态的。还可以通过下面的函数来设置终结类型,即该线程可不可以被终结:
int pthread_setcancelstate(int state, int *oldstate);
state:终结状态,可以为PTHREAD_CANCEL_DISABLE或者PTHREAD_CANCEL_ENABLE。
(6) 线程的本质。

    在Linux中,新建的线程并不是在原先的进程中,而是系统通过 一个系统调用clone()。该系统copy了一个和原先进程完全一样的进程,并在这个进程中执行线程函数。不过这个copy过程和fork不一样。 copy后的进程和原先的进程共享了所有的变量,运行环境。这样,原先进程中的变量变动在copy后的进程中便能体现出来。

6.名称:pthread_detach
功能:使线程进入分离状态。
头文件:#include
函数原形:int pthread_detach(pthread_t tid);
参数:
返回值:若成功则返回0,否则返回错误编号。 
    在默认情况下,线程的终止状态会保存到对该线程调用pthread_join,如果线程已经处于分离状态,线程的底层存储资源可以在线程终止时立即被收回。当线程被分离时,并不能用pthread_join函数等待它的终止状态。对分离状态的线程进行pthread_join的调用会产生失败,返回EINVAL.pthread_detach调用可以用于使线程进入分离状态。
7.名称:pthread_cancel
功能:取消同一进程中的其他线程
头文件:#include
函数原形:int pthread_cancel(pthread_t tid);
参数:tid 线程id 
返回值:若成功返回0,否则返回错误编号。
    在默认的情况下,pthread_cancel函数会使由tid标识的线程的行为表现为如同调用了参数为PTHEAD_CANCELED的pthread_exit函数,但是,线程可以选择忽略取消方式和控制取消方式。pthread_cancel并不等待线程终止,它仅仅提出请求
8.名称:pthread_cancel_push/ pthread_cancel_push_pop
功能:线程清理处理程序
头文件:#include
函数原形:void pthread_cancel_push(void (*rtn)(void *),void *arg);
              void pthread_cancel_pop(int execute);
参数:rtn 处理程序入口地址, arg 传递给处理函数的参数
返回值:无 
    线程可以安排它退出时需要调用的函数,这样的函数称为线程清理处理程序,线程可以建立多个清理处理程序。处理程序记录在栈中,也就是说它们的执行顺序与它们注册时的顺序相反。
    要注意如果线程是通过从他的启动例程中返回而终止的,它的处理程序就不会调用。还要注意清理处理程序是按照与它们安装时相反的顺序调用的。
#include
#include
void cleanup(void *arg)
{
printf(“cleanup: %s\n”,(char *)arg);
}
void *thr_fn(void *arg) /*线程入口地址*/
{
printf(“thread start\n”);
pthread_cleanup_push(cleanup,”thread first handler”);/*设置第一个线程处理程序*/
pthread_cleanup_push(cleanup,”thread second handler”); /*设置第二个线程处理程序*/
printf(“thread push complete\n”);
pthread_cleanup_pop(0); /*取消第一个线程处理程序*/
pthread_cleanup_pop(0); /*取消第二个线程处理程序*/
}
int main()
{
pthread_t tid;
void *tret;
pthread_creat(&tid,NULL,thr_fn,(void *)1); /*创建一个线程*/
pthread_join(tid,&tret); /*获得线程终止状态*/
printf(“thread exit code %d\n”,(int)tret);
}
八、一次性初始化
    有时候我们需要对一些posix变量只进行一次初始化,如线程键(我下面会讲到)。如果我们进行多次初始化程序就会出现错误。
    在传统的顺序编程中,一次性初始化经常通过使用布尔变量来管理。控制变量被静态初始化为0,而任何依赖于初始化的代码都能测试该变量。如果变量值仍然为0,则它能实行初始化,然后将变量置为1。以后检查的代码将跳过初始化。
    但是在多线程程序设计中,事情就变的复杂的多。如果多个线程并发地执行初始化序列代码,2个线程可能发现控制变量为0,并且都实行初始话,而该过程本该仅仅执行一次。初始化的状态必须由互斥量保护。
    如果我们需要对一个posix变量静态的初始化,可使用的方法是用一个互斥量对该变量的初始话进行控制。但有时候我们需要对该变量进行动态初始化,pthread_once就会方便的多
9.名称:pthread_once
功能:一次性初始化
头文件:#include
函数原形:pthread_once_t once_control=PTHREAD_ONCE_INIT;
              int pthread_once(pthread_once_t *once_control,void(*init_routine)(void));
参数:once_control 控制变量, init_routine 初始化函数
返回值:若成功返回0,若失败返回错误编号。
    类型为pthread_once_t的变量是一个控制变量。控制变量必须使用PTHREAD_ONCE_INIT宏静态地初始化
    pthread_once函数首先检查控制变量,判断是否已经完成初始化,如果完成就简单地返回;否则,pthread_once调用初始化函数,并且记录下初始化被完成。如果在一个线程初始时,另外的线程调用pthread_once,则调用线程等待,直到那个现成完成初始话返回。
    下面就是该函数的程序例子:
#include
pthread_once_t once=PTHREAD_ONCE_INIT;
pthread_mutex_t mutex; /*互斥量,我们后面会讲到*/
void once_init_routine(void) /*一次初始化函数*/
{
int status;
status=pthread_mutex_init(&mutex,NULL);/*初始化互斥量*/
if(status==0)
printf(“Init success!,My id is %u”,pthread_self());
}
void *child_thread(void *arg)
{
printf(“I’m child ,My id is %u”,pthread_self());
pthread_once(&once,once_init_routine); /*子线程调用一次性初始化函数*/
}
int main(int argc,char *argv[ ])
{
pthread_t child_thread_id;
pthread_create(&child_thread_id,NULL,child_thread,NULL);/*创建子线程*/
printf(“I’m father,my id is %u”,pthread_self());
pthread_once(&once_block,once_init_routine);/*父线程调用一次性初始化函数*/
pthread_join(child_thread_id,NULL);
}
程序运行结果如下:
./once
I’m father,My id is 3086874304
Init success!,My id is 3086874304
I’m child, My id is 3086871472  
从上面的结果可以看到当主函数初始化成功后,子函数初始化失败
九、线程的私有数据
    在进程内的所有线程共享相同的地址空间,任何声明为静态或外部的变量,或在进程堆声明的变量,都可以被进程所有的线程读写。那怎样才能使线程序拥有自己的私有数据呢。posix提供了一种方法,创建线程键
10.名称:pthread_key_create
功能:建立线程私有数据键
头文件:#include
函数原形:int pthread_key_create(pthread_key *key,void(*destructor)(void *));
参数:key 私有数据键, destructor 清理函数
返回值:若成功返回0,若失败返回错误编号。
    第一个参数为指向一个键值的指针,第二个参数指明了一个destructor函数(清理函数)如果这个参数不为空,那么当每个线程结束时,系统将调用这个函数来释放绑定在这个键上的内存块这个函数常和函数pthread_once一起使用,为了让这个键只被创建一次。函数pthread_once声明一个初始化函数,第一次调用pthread_once时它执行这个函数,以后的调用将被它忽略。
下面是程序例子:
#include
pthread_key_t tsd_key;
pthread_once_t key_once=PTHREAD_ONCE_INIT;
void once_routine(void)
{
int status;
status=pthread_key_create(&tsd_key,NULL);/*初始化线程私有数据键*/
if(status=0)
printf(“Key create success! My id is %u\n”,pthread_self());
}
void *child_thread(void *arg)
{
printf(“I’m child,My id is %u\n”,pthread_self());
pthread_once(&key_once,once_routine);/* 调用一次性初始化函数*/
}
int main(int argc,char *argv[ ])
{
pthread_t child_thread_id;
pthread_create(&child_thread_id,NULL,child_thread,NULL);
printf(“I’m father,my id is%u\n”,pthread_self());
pthread_once(&key_once,once_routine);
}
程序运行结果如下:
I’m father,My id is 3086231232
Key create success! My id is 3086231232
I’m child,My id is 2086228400

11.名称:pthread_getspecific
功能:读取或设置线程特定数据
头文件:#include
函数原形:void *pthread_getspecific(pthread_key_t key);
              int pthread_setspecific(pthread_key_t key, const void *value); 
参数:key 私有数据键
返回值:pthread_setspecific() 在成功完成之后返回零,其他任何返回值都表示出现了错误;pthread_getspecific 不返回任何错误。

#include
#include
#include
pthread_key_t key;
struct test_struct {
int i;
float k;
};
void *child1 (void *arg)
{
struct test_struct struct_data;
struct_data.i = 10;
struct_data.k = 3.1415;
pthread_setspecific (key, &struct_data);
printf ("结构体struct_data的地址为 0x%p\n", &(struct_data));
printf ("child1 中 pthread_getspecific(key)返回的指针为:0x%p\n", (struct test_struct *)pthread_getspecific(key));
printf ("利用 pthread_getspecific(key)打印 child1 线程中与key关联的结构体中成员值:\nstruct_data.i:%d\nstruct_data.k: %f\n", ((struct test_struct *)pthread_getspecific (key))->i, ((struct test_struct *)pthread_getspecific(key))->k);
printf ("------------------------------------------------------\n");
}
void *child2 (void *arg)
{
int temp = 20;
sleep (2);
printf ("child2 中变量 temp 的地址为 0x%p\n", &temp);
pthread_setspecific (key, &temp);
printf ("child2 中 pthread_getspecific(key)返回的指针为:0x%p\n", (int *)pthread_getspecific(key));
printf ("利用 pthread_getspecific(key)打印 child2 线程中与key关联的整型变量temp 值:%d\n", *((int *)pthread_getspecific(key)));
}
int main (void)
{
pthread_t tid1, tid2;
pthread_key_create (&key, NULL);
pthread_create (&tid1, NULL, (void *)child1, NULL);
pthread_create (&tid2, NULL, (void *)child2, NULL);
pthread_join (tid1, NULL);
pthread_join (tid2, NULL);
pthread_key_delete (key);
return (0);
}
运行与输出:./pthread_key 
结构体struct_data的地址为 0x0xb7699388
child1 中 pthread_getspecific(key)返回的指针为:0x0xb7699388
利用 pthread_getspecific(key)打印 child1 线程中与key关联的结构体中成员值:
struct_data.i:10
struct_data.k: 3.141500
------------------------------------------------------
child2 中变量 temp 的地址为 0x0xb6e9838c
child2 中 pthread_getspecific(key)返回的指针为:0x0xb6e9838c
    由输出可见,pthread_getspecific() 返回的是与key 相关联数据的指针。需要注意的是,在利用这个返回的指针时,它首先是 void 类型的,它虽然指向关联的数据地址处,但并不知道指向的数据类型,所以在具体使用时,要对其进行强制类型转换。
    其次,两个线程对自己的私有数据操作是互相不影响的。也就是说哦,虽然 key 是同名且全局,但访问的内存空间并不是相同的一个。key 就像是一个数据管理员,线程的私有数据只是到他那去注册,让它知道你这个数据的存在。

原文:http://www.cnblogs.com/yc_sunniwell/archive/2010/06/23/1763273.html

你可能感兴趣的:(Linux,Thread)