【Linux系统编程学习】Linux线程控制原语

此为牛客Linux C++课程笔记。

0. 关于线程

【Linux系统编程学习】Linux线程控制原语_第1张图片
注意:LWP号和线程id不同, LWP号是CPU分配时间片的依据,线程id是用于在进程内部区分线程的。

1. 线程与进程的区别

【Linux系统编程学习】Linux线程控制原语_第2张图片
【Linux系统编程学习】Linux线程控制原语_第3张图片
对于进程来说,相同的地址(同一个虚拟地址)在不同的进程中,反复使用而不冲突。原因是他们虽虚拟址一样,但,页目录、页表、物理页面各不相同。相同的虚拟址,映射到不同的物理页面内存单元,最终访问不同的物理页面。

但!线程不同!两个线程具有各自独立的PCB,但共享同一个页目录,也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。

实际上,无论是创建进程的fork,还是创建线程的pthread_create,底层实现都是调用同一个内核函数clone。
如果复制对方的地址空间,那么就产出一个“进程”;如果共享对方的地址空间,就产生一个“线程”。

因此:Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以,线程所有操作函数 pthread_* 是库函数,而非系统调用。

优点: 1. 提高程序并发性 2. 开销小 3. 数据通信、共享数据方便
缺点: 1. 库函数,不稳定 2. 调试、编写困难、gdb不支持 3. 对信号支持不好
优点相对突出,缺点均不是硬伤。Linux下由于实现方法导致进程、线程差别不是很大。

2. 线程相关操作函数

【Linux系统编程学习】Linux线程控制原语_第4张图片

2.1 获取线程id

#include 
pthread_t pthread_self(void);

功能:获取线程ID。其作用对应进程中 getpid() 函数。

2.2 创建线程: pthread_create

#include 
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

功能:创建一个子线程

参数:

  • thread:传出参数,线程创建成功后,子线程的线程ID被写到该变量中。
  • attr : 设置线程的属性,一般使用默认属性,即NULL
  • start_routine : 函数指针,这个函数是子线程需要处理的逻辑代码
  • arg : 给第三个参数(回调函数)使用,是回调函数的参数

返回值:

  • 成功:0
  • 失败:返回错误号。这个错误号和之前errno不太一样,获取错误号的信息使用:
#include 
char * strerror(int errnum);

创建线程示例代码如下:

#include 
#include 
#include 
#include 

void* callback(void* arg) {
     
    printf("its child thread, thread id is %lu\n", pthread_self());
    printf("arg = %d\n", *(int *)arg);
}

int main()
{
     
    pthread_t pid;
    int a = 5;
    int ret = pthread_create(&pid, NULL, callback, &a);
    if(ret != 0) {
     
        // 说明创建失败
        char * errstr = strerror(ret);
        printf("error: %s\n", errstr);
    }

    printf("its main thread, thread id is %lu\n", pthread_self());

    sleep(1);

    return 0;
}

发现无法编译
在这里插入图片描述
查阅文档发现:
【Linux系统编程学习】Linux线程控制原语_第5张图片
编译时加-pthread即可,运行结果如下:
在这里插入图片描述

2.3 终止线程: pthread_exit

注意,不能使用exit函数终止当前线程,exit将终止当前进程,进程中的所有线程将一并终止。

#include 
void pthread_exit(void *retval);

参数:retval表示线程退出状态,通常传NULL

多线程环境中,应尽量少用,或者不使用exit函数,取而代之使用pthread_exit函数,将单个线程退出。任何线程里exit导致进程退出,其他线程未工作结束,主控线程退出时不能return或exit。

2.4 连接已终止的线程(回收线程):pthread_join

#include 
int pthread_join(pthread_t thread, void **retval);

功能:和一个已经终止的线程进行连接(回收子线程的资源)

注意:这个函数是阻塞函数,调用一次只能回收一个子线程,一般在主线程中使用

参数:

  • thread:需要回收的子线程的ID
  • retval: 接收子线程退出时的返回值(即pthread_exit的void *retval参数), 而且是传出参数。

返回值:0 : 成功;非0 : 失败,返回的错误号

不使用传出参数的一个简单使用如下:

#include 
#include 
#include 
#include 

void* callback(void* arg) {
     
    printf("子线程运行中...\n");
    sleep(2);
}

int main()
{
     
    pthread_t pid;
    int ret = pthread_create(&pid, NULL, callback, NULL);
    if(ret != 0) {
     
        // 说明创建失败
        char * errstr = strerror(ret);
        printf("error: %s\n", errstr);
    }

    pthread_join(pid, NULL);
    printf("子线程已回收\n");

    return 0;
}

子线程执行2秒后,主进程才输出“子线程已回收”,说明pthread_join函数是阻塞的。

pthread_join函数比较难以理解的地方是他的第二个参数:void **retval,是void二级指针类型,这是因为:

首先这个参数是想接收pthread_exit所传出的void *retval, 这个参数本身是void *的一级指针类型,而pthread_join函数的void **retval在设计时是设计成一个传出参数的,以便把pthread_exit传出的void *retval带回主线程,所以要想把 void * 类型变量设计成传出参数,即是 void **。

示例程序如下:

#include 
#include 
#include 
#include 

int value = 10;

void* callback(void* arg) {
     
    printf("子线程运行中...\n");
    pthread_exit((void *)&value);
}

int main()
{
     
    pthread_t pid;
    int ret = pthread_create(&pid, NULL, callback, NULL);
    if(ret != 0) {
     
        // 说明创建失败
        char * errstr = strerror(ret);
        printf("error: %s\n", errstr);
    }

    int *thread_retval;  // 给pthread_join调用,接收pthread_exit的传出参数
    pthread_join(pid, (void **)&thread_retval);

    printf("exit data : %d\n", *thread_retval);

    return 0;
}

运行结果如下:
在这里插入图片描述

2.5 线程分离:pthread_detach

#include 
int pthread_detach(pthread_t thread);

功能:使进程处于分离状态。被分离的线程在终止的时候,会自动释放资源返回给系统,避免产生僵尸线程。

线程分离状态:指定该状态,线程主动与主控线程断开关系。线程结束后,其退出状态不由其他线程获取,而直接自己自动释放。网络、多线程服务器常用。

参数:需要分离的线程的ID

返回值:成功:0,失败:返回错误号

注意:

  1. 线程不能多次分离,会产生不可预料的行为。
  2. 不能去连接(pthread_join)一个已经分离的线程,会报错:一般情况下,线程终止后,其终止状态一直保留到其它线程调用pthread_join获取它的状态为止。但是线程也可以被置为detach状态,这样的线程一旦终止就立刻回收它占用的所有资源,而不保留终止状态。不能对一个已经处于detach状态的线程调用pthread_join,这样的调用将返回EINVAL错误。也就是说,如果已经对一个线程调用了pthread_detach就不能再调用pthread_join了。

2.6 线程取消:pthread_cancel

#include 
int pthread_cancel(pthread_t thread);

功能:取消线程(让线程终止)

【注意】:线程的取消并不是实时的,而有一定的延时。需要等待线程到达某个取消点(检查点)。
类似于玩游戏存档,必须到达指定的场所(存档点,如:客栈、仓库、城里等)才能存储进度。杀死线程也不是立刻就能完成,必须要到达取消点。
取消点:是线程检查是否被取消,并按请求进行动作的一个位置。通常是一些系统调用creat,open,pause,close,read,write…
执行命令man 7 pthreads可以查看具备这些取消点的系统调用列表。也可参阅 APUE.12.7 取消选项小节。
可粗略认为一个系统调用(进入内核)即为一个取消点。如线程中没有取消点,可以通过调用pthreestcancel函数自行设置一个取消点。

看下面这个代码示例,子线程无限循环:

#include 
#include 
#include 
#include 

void* callback(void* arg) {
     
    while(1) {
     
        printf("子线程运行中...\n");
        sleep(1);
    }
    return NULL;
}

int main()
{
     
    pthread_t pid;
    int ret = pthread_create(&pid, NULL, callback, NULL);
    if(ret != 0) {
     
        char * errstr = strerror(ret);
        printf("error: %s\n", errstr);
    }

    pthread_cancel(pid);
    ret = pthread_join(pid, NULL);
    if(ret != 0) {
     
        char * errstr = strerror(ret);
        printf("error: %s\n", errstr);
    }
    printf("线程已回收\n");
    return 0;
}

运行后成功输出”线程已回收“, 这是因为pthread_cancel终止了子线程的运行,故pthread_join得以执行。

但是如果将子进程中循环语句中的内容去掉:

#include 
#include 
#include 
#include 

void* callback(void* arg) {
     
    while(1) {
     
        // printf("子线程运行中...\n");
        // sleep(1);
    }
    return NULL;
}

int main()
{
     
    pthread_t pid;
    int ret = pthread_create(&pid, NULL, callback, NULL);
    if(ret != 0) {
     
        char * errstr = strerror(ret);
        printf("error: %s\n", errstr);
    }

    pthread_cancel(pid);
    ret = pthread_join(pid, NULL);
    if(ret != 0) {
     
        char * errstr = strerror(ret);
        printf("error: %s\n", errstr);
    }
    printf("线程已回收\n");
    return 0;
}

运行以后发现没有输出,主线程阻塞。这是因为子线程的while(1)死循环中没有任何语句,也就不会执行任何系统调用,也就不会到达任何一个“取消点”,所以子线程并没有被终止,主线程被阻塞在pthread_join处。而之前的代码循环语句中的printf会调用系统调用write,所以会到达“取消点”,pthread_join将已经结束的子线程回收。

你可能感兴趣的:(Linux,C++学习笔记,#,Linux系统编程篇,linux)