Linux的线程实现是在内核以外来实现的,内核本身并不提供线程创建。但是内核为提供线程【也就是轻量级进程】提供了两个系统调用__clone()和fork (),这两个系统调用都为准备一些参数,最终都用不同的参数调用do_fork()核内API。do_fork()提供了很多参数,包括CLONE_VM(共享内存空间)、CLONE_FS(共享文件系统信息)、CLONE_FILES(共享文件描述符表)、CLONE_SIGHAND(共享信号句柄表)和CLONE_PID(共享进程ID,仅对核内进程,即0号进程有效)。当直接使用fork系统调用时,内核调用do_fork()不使用任何共享属性,进程拥有独立的运行环境,而使用pthread_create()来创建线程时,则最终设置了所有这些属性来调用__clone(),而这些参数又全部传给核内的do_fork(),从而创建的"进程"拥有共享的运行环境,只有栈是独立的,由 __clone()传入。
我们知道Linux线程在核内是以轻量级进程的形式存在的,拥有独立的进程表项,而所有的创建、同步、删除等操作都在内核以外的pthread库中进行。pthread 库使用一个管理线程(__pthread_manager(),每个进程独立且唯一)来管理线程的创建和终止,为线程分配线程ID,发送线程相关的信号(比如Cancel),而主线程(pthread_create())的调用者则通过管道将请求信息传给管理线程。
上面一段话,一般的内核介绍书籍都会有说到,在开篇之前,我想先说明一下内核关于进程的主线程设计想法:
每个进程都有自己的PID,这是一定唯一的,除此之外,每个进程还有其它的ID标识,比如处于某个线程组中的所有进程都有一个统一的线程组ID(TGID),如果进程没有使用线程,PID和TGID是相同的,其实主线程的PID和TGID就是相同的。另外,独立进程可以合并成为进程组。还有几个进程组可以合并成一个会话,会话中的所有进程都有同样的会话ID。和我们这里讨论相关的主要是task_struct的两个成员
struct task_struct{
pid_t pid;
pid_t tgid;
}
位于同一个进程的所有线程,tgid是相同的,都指向“线程”组第一个进程的PID值,这也就是主线程。可以分别通过getpid(), syscall(SYS_gettid)获取其值。
一,创建线程
在创建进程时,操作系统会为其创建一个主线程,之后由这个线程创建的线程都是从线程,创建主线程的方法如下:
int pthread_create(pthread_t *threadId,pthread_attr_t *attr, void*(start_routine)(void*),void *args).
参数解释如下:
threadId : 用于返回创建的线程的ID;每个线程都有自己的ID,在线程内可以调用pthread_self()函数获取ID值,该函数原型是这样的:pthread_t pthread_self()。
arr : 用于指定将要被创建的线程的属性;该值可以为NULL,表示默认的属性。等下专门说下这个属性,暂时知道这个参数表示用于创建线程的方式就可以了;
start_routine : 这是一个函数的指针,指定线程被调度时的入口;
args : 用于线程入口函数的参数;
如下调用就可以了:
先定义一个入口函数:
void * start_thread(void *){
printf("this will be printed by the new thread");
}
那么创建 一个线程的代码可以如下,当然这很简单,实际过程中不可能是这样的:
int main(int argc,char **argv){
pthread_t threadId;
pthread_create(&threadId,NULL,start_thread,NULL);
}
注意传递的参数:线程返回ID为引用类型,线程创建属性和参数都是NULL;线程入口地址为start_thread所指向的地址;
二,线程属性
线程属性由数据结构pthread_attr_t结构表示,其定义如下所示:
typedef struct
{
int detachstate; 线程的分离状态
int schedpolicy; 线程调度策略
struct sched_param schedparam; 线程的调度参数
int inheritsched; 线程的继承性
int scope; 线程的作用域
size_t guardsize; 线程栈末尾的警戒缓冲区大小
int stackaddr_set;
void * stackaddr; 线程栈的位置
size_t stacksize; 线程栈的大小
}pthread_attr_t;
这个结构体在使用过程中由pthread_attr_init和pthread_attr_destory负责数据的初始化和销毁;schepolicy : 表示线程被调度的策略。主要包括SCHED_OTHER(正常、非实时)、SCHED_RR(实时、轮转法)和 SCHED_FIFO(实时、先入先出)三种,缺省为SCHED_OTHER,后两种调度策略仅对超级用户有效。运行时可以用过 pthread_setschedparam()来改变,该函数原型是这样的:int pthread_setschedparam(pthread_t target_thread, int policy, const struct sched_param *param)。这个调用可以动态的改变调度策略和线程的优先级。
scheparam:一个struct sched_param结构,结构体包含一个sched_priority整型变量表示线程的运行优先级。这个参数仅当调度策略为实时(即SCHED_RR 或SCHED_FIFO)时才有效,并可以在运行时通过pthread_setschedparam()函数来改变,缺省为0。
inheritshed : 表示线程创建的继承;调用函数pthread_attr_setinheritsched和pthread_attr_getinheritsched用来设置和得到线程的继承属性。有两种值可供选择:PTHREAD_EXPLICIT_SCHED和PTHREAD_INHERIT_SCHED,前者表示新线程使用显式指定调度策略和调度参数(即attr中的值),而后者表示继承调用者线程的值。缺省为PTHREAD_EXPLICIT_SCHED。
scope :表示线程间竞争CPU的范围,也就是说线程优先级的有效范围。POSIX的标准中定义了两个值: PTHREAD_SCOPE_SYSTEM和PTHREAD_SCOPE_PROCESS,前者表示与系统中所有线程一起竞争CPU时间,后者表示仅与同进程中的线程竞争CPU。可以通过调用pthread_attr_getscope(), pthread_attr_setscope(),用于获取属性中的线程的作用域。
stacksize,stackaddr : 表示线程堆栈的大小和地址。也有四个函数用于设置和获取相应的值。pthread_attr_getstatcksize(),pthread_attr_setstatcksize(),pthread_attr_setstackaddr(),pthread_attr_getstatckaddr()。
guardsize :控制着线程栈末尾之后以避免栈溢出的扩展内存大小。同样可以调用pthread_attr_setguardsize()和pthread_attr_getguardsize()。