【lesson53】线程控制

文章目录

  • 线程控制

线程控制

线程创建
代码:
【lesson53】线程控制_第1张图片
运行代码:
【lesson53】线程控制_第2张图片
强调一点,线程和进程不一样,进程有父进程的概念,但在线程组里面,所有的线程都是对等关系。
【lesson53】线程控制_第3张图片
错误检查:

  • 传统的一些函数是,成功返回0,失败返回-1,并且对全局变量errno赋值以指示错误。
  • pthreads函数出错时不会设置全局变量errno(而大部分其他POSIX函数会这样做)。而是将错误代码通过返回值返回
  • pthreads同样也提供了线程内的errno变量,以支持其它使用errno的代码。对于pthreads函数的错误,建议通过返回值业判定,因为读取返回值要比读取线程内的errno变量的开销更小

进程ID和线程ID
在Linux中,目前的线程实现是Native POSIX Thread Libaray,简称NPTL。在这种实现下,线程又被称为轻量级进程(Light Weighted Process),每一个用户态的线程,在内核中都对应一个调度实体,也拥有自己的进程描述符(task_struct结构体)。
没有线程之前,一个进程对应内核里的一个进程描述符,对应一个进程ID。但是引入线程概念之后,情况发生了变化,一个用户进程下管辖N个用户态线程,每个线程作为一个独立的调度实体在内核态都有自己的进程描述符,进程和内核的描述符一下子就变成了1:N关系,POSIX标准又要求进程内的所有线程调用
getpid函数时返回相同的进程ID,如何解决上述问题呢?
Linux内核引入了线程组的概念。
【lesson53】线程控制_第4张图片
多线程的进程,又被称为线程组,线程组内的每一个线程在内核之中都存在一个进程描述符(task_struct)与之对应。进程描述符结构体中的pid,表面上看对应的是进程ID,其实不然,它对应的是线程ID;进程描述
符中的tgid,含义是Thread Group ID,该值对应的是用户层面的进程ID
【lesson53】线程控制_第5张图片

线程异常
我们之前学到线程一旦异常那么整个进程都会退出,那么真的是如此吗?
演示:
代码

#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    while (true)
    {
        std::cout << name << " pid:" << getpid() << "\n"
                  << std::endl;
        
        int a = 100;
        a /= 0;//除0错误
        sleep(1);
    }

    return nullptr;
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    while (true)
    {
        std::cout << "main thread pid:" << getpid() << std::endl;
        sleep(3);
    }
    return 0;
}

运行代码:
【lesson53】线程控制_第6张图片
我们发现线程一旦异常确实会影响到整个进程。

结论:
1.线程谁先运行与调度器相关
2.随便哪个线程一旦异常,都可能导致整个进程整体退出
3.线程在创建并执行的时候,线程也需要进行等待的,如果主线程不等待,也会引起类似于僵尸进程问题,导致内存泄漏。

线程等待
已经退出的线程,其空间没有被释放,仍然在进程的地址空间内。
创建新的线程不会复用刚才退出线程的地址空间。
【lesson53】线程控制_第7张图片
调用该函数的线程将挂起等待,直到id为thread的线程终止。thread线程以不同的方法终止,通过pthread_join得到的终止状态是不同的,总结如下:

  1. 如果thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。
  2. 如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数PTHREAD_CANCELED。
  3. 如果thread线程是自己调用pthread_exit终止的,value_ptr所指向的单元存放的是传给pthread_exit的参数。
  4. 如果对thread线程的终止状态不感兴趣,可以传NULL给value_ ptr参数。

【lesson53】线程控制_第8张图片

【lesson53】线程控制_第9张图片
参数解释:
thread:线程id
retval:输出型参数,下面再解释用处
pthread_join默认阻塞等待。
代码:

#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    int i = 0;
    while (true)
    {
        std::cout << name << "runing....." << std::endl;
        sleep(1);

        if(i++ == 10)
        {
            break;
        }
    }

    std::cout << "new thread quit....." << std::endl;
    return nullptr;
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    pthread_join(tid,nullptr);
    std::cout << "main thread wait done .... main quit!" << std::endl;

    return 0;
}

运行代码:
【lesson53】线程控制_第10张图片
我们知道pthread_create里面有一个回调函数,而回调函数里面有一个返回值我们之前一直返回nullptr
【lesson53】线程控制_第11张图片
这个返回值,一般是给主线程的,那么主线程该如何获取到?用pthread_join。
【lesson53】线程控制_第12张图片
pthread_join的第二个参数,是输出型参数,用来获取放回值的。
代码:

#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    int i = 0;
    while (true)
    {
        std::cout << name << "runing....." << std::endl;
        sleep(1);

        if (i++ == 10)
        {
            break;
        }
    }

    std::cout << "new thread quit....." << std::endl;
    return (void *)10;
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    void *ret = nullptr;
    pthread_join(tid, &ret);
    std::cout << "ret: " << (long long)ret << std::endl;
    std::cout << "main thread wait done .... main quit!" << std::endl;

    return 0;
}

我们运行的时候会这样
我们只要在g++后面加-fpermissive即可

g++ -o mythread mythread.cc -std=c++11 -lpthread -fpermissive

【lesson53】线程控制_第13张图片
再运行代码:
【lesson53】线程控制_第14张图片
可以看到,我们成功获取到了返回值。
我们不仅仅只能返回变量,我们还能返回其它内容。
代码:

#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    int i = 0;
    int *data = new int[10];
    while (true)
    {
        std::cout << name << "runing....." << std::endl;
        sleep(1);

        data[i] = i;
        if (i++ == 10)
        {
            break;
        }
    }

    std::cout << "new thread quit....." << std::endl;
    return (void *)data;
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    void *ret = nullptr;
    pthread_join(tid, &ret);

    int *data = (int *)ret;

    for (int i = 0; i < 10; i++)
    {
        std::cout << data[i] << " ";
    }
    std::cout << std::endl;
    std::cout << "main thread wait done .... main quit!" << std::endl;
    return 0;
}

运行结果:
【lesson53】线程控制_第15张图片
线程终止
如果需要只终止某个线程而不终止整个进程,可以有三种方法:

  1. 从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit。
  2. 线程可以调用pthread_ exit终止自己。
  3. 一个线程可以调用pthread_ cancel终止同一进程中的另一个线程。
    能不能用exit终止线程呢?

代码:

#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    int i = 0;
    int *data = new int[10];
    while (true)
    {
        std::cout << name << "runing....." << std::endl;
        sleep(1);

        data[i] = i;
        if (i++ == 10)
        {
            break;
        }
    }

    std::cout << "new thread quit....." << std::endl;
    exit(10);
    return (void *)data;
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    void *ret = nullptr;
    pthread_join(tid, &ret);

    int *data = (int *)ret;

    for (int i = 0; i < 10; i++)
    {
        std::cout << data[i] << " ";
    }
    std::cout << std::endl;
    std::cout << "main thread wait done .... main quit!" << std::endl;

    return 0;
}

运行结果:
【lesson53】线程控制_第16张图片
我们发现整个进程都被终止了,因为exit是终止进程的,绝对不要用exit终止线程。
那么我们如何终止新线程而不影响main线程呢?
pthread_exit()OS提供的终止线程的函数
【lesson53】线程控制_第17张图片
【lesson53】线程控制_第18张图片
参数retval就是之前的返回值。
代码

#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    int i = 0;
    int *data = new int[10];
    while (true)
    {
        std::cout << name << "runing....." << std::endl;
        sleep(1);

        data[i] = i;
        if (i++ == 10)
        {
            break;
        }
    }

    std::cout << "new thread quit....." << std::endl;
    pthread_exit((void*)data);
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    void *ret = nullptr;
    pthread_join(tid, &ret);

    int *data = (int *)ret;

    for (int i = 0; i < 10; i++)
    {
        std::cout << data[i] << " ";
    }
    std::cout << std::endl;
    std::cout << "main thread wait done .... main quit!" << std::endl;
    return 0;
}

运行结果:
【lesson53】线程控制_第19张图片
我们看到线程终止成功。

线程取消
【lesson53】线程控制_第20张图片

【lesson53】线程控制_第21张图片
在这里插入图片描述
代码:

#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    while (true)
    {
        std::cout << name << "runing....." << std::endl;
        sleep(1);
    }

    std::cout << "new thread quit....." << std::endl;
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    int count = 3;
    while (true)
    {
        std::cout << "main thread pid:" << getpid() << std::endl;
        if(count++ > 5) break;
        sleep(2);
    }

    pthread_cancel(tid);
    std::cout << "pthread cancle tid: " << tid << std::endl; 

    void *ret = nullptr;
    pthread_join(tid, &ret);

    std::cout << "ret: " << (long long)ret << std::endl;
    std::cout << "main thread wait done .... main quit!" << std::endl;
    sleep(5);

    return 0;
}

运行结果:
【lesson53】线程控制_第22张图片
我们看到最后main线程确实等待了5秒
【lesson53】线程控制_第23张图片
然后退出了。
我们看到其中tid为啥这么大呢?之后再讲解。
而我们看到线程被取消,我们join的时候,退出码是-1.
而-1其实是:
【lesson53】线程控制_第24张图片

线程ID的探索
我们之前看到线程ID是一个很大的值
格式化输出线程ID:
代码:

#include 
#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    while (true)
    {
        std::cout << name << "runing....." << std::endl;
        sleep(1);
    }

    std::cout << "new thread quit....." << std::endl;
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    printf("%u,%p\n",tid,tid);
    int count = 3;
    while (true)
    {
        std::cout << "main thread pid:" << getpid() << std::endl;
        if(count++ > 5) break;
        sleep(2);
    }

    pthread_cancel(tid);
    std::cout << "pthread cancle tid: " << tid << std::endl; 

    void *ret = nullptr;
    pthread_join(tid, &ret);

    std::cout << "ret: " << (long long)ret << std::endl;
    std::cout << "main thread wait done .... main quit!" << std::endl;
    sleep(5);
    return 0;
}

运行结果:
【lesson53】线程控制_第25张图片
我们看到线程ID值很大,tid的本质是一个地址
为什么tid不用Linux中的LWP呢?
因为目前用的不是Linux自带的创建线程的接口,我们用的是pthread库中的接口。
我们知道线程共享进程的地址空间
【lesson53】线程控制_第26张图片
但是线程有自己独立的栈结构,那么如何保证栈区是每一个线程独占的呢?---->原本的栈给main线程使用,而其余线程把共享区当做栈区。所以每个线程的tid就是自己栈区的起始地址
【lesson53】线程控制_第27张图片
见一见
【lesson53】线程控制_第28张图片
pthread库时通过clone做到上面的那点。
在这里插入图片描述
那么我们如何获取线程的id呢?
【lesson53】线程控制_第29张图片
代码:

#include 
#include 
#include 
#include 

void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;
    while (true)
    {
        std::cout << name << "runing..... id: " << pthread_self() << std::endl;
        sleep(1);

    }

    std::cout << "new thread quit....." << std::endl;
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    int count = 3;
    while (true)
    {
        std::cout << "main thread id:" << pthread_self() << std::endl;
        if(count++ > 5) break;
        sleep(2);
    }

    void *ret = nullptr;
    pthread_join(tid, &ret);

    std::cout << "ret: " << (long long)ret << std::endl;
    std::cout << "main thread wait done .... main quit!" << std::endl;
    sleep(5);

    return 0;
}

运行代码:
【lesson53】线程控制_第30张图片
我们看到我们获取到了不同的线程id

大部分线程的代码是共享的!
一个小实验:
代码:

#include 
#include 
#include 
#include 

int g_val = 0;
void *threadRoutine(void *arg)
{
    const std::string name = (char *)arg;

    while(true)
    {
        std::cout << name << " g_val: " << g_val << " &g_val" << &g_val << std::endl;
        g_val++;
        sleep(1);
    }

}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    while(true)
    {
        std::cout << "main thread g_val: " << g_val << " &g_val" << &g_val << std::endl;
        sleep(1);
    }

    return 0;
}

运行结果:
【lesson53】线程控制_第31张图片
我们看到g_val被大家所共享,大家都可以看到g_val,一个线程对其进程改变,其它线程都看的到。
那么如果线程想要自己是私有的变量呢?该如何?
只要在变量前加__thread即可。
代码:

#include 
#include 
#include 
#include 

__thread int g_val = 0;
void *threadRoutine(void *arg)
{

    while(true)
    {
        std::cout << (char*)arg << ": "<< g_val << " &: " << &g_val << std::endl;
        g_val++;
        sleep(1);
    }
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    while(true)
    {
        std::cout << "main thread: " << g_val << " &: " << &g_val << std::endl;
        sleep(1);
    }

    return 0;
}

运行代码:
【lesson53】线程控制_第32张图片
这里运行的时候是并行执行的所以会看不清,但是我们也能看到,两个变量的地址不一样的。

__thread:修饰全局变量,带来的结果就是让每一个线程各自拥有一个全局变量---->线程的就不存储。

我们之前学过进程替换,如果线程进行进程替换会如何?
代码:

#include 
#include 
#include 
#include 

__thread int g_val = 0;
void *threadRoutine(void *arg)
{
    execl("/bin/ls","ls",nullptr);
    while(true)
    {
        std::cout << (char*)arg << ": "<< g_val << " &: " << &g_val << std::endl;
        g_val++;
        sleep(1);
    }

}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    while(true)
    {
        std::cout << "main thread: " << g_val << " &: " << &g_val << std::endl;
        sleep(1);
    }
    return 0;
}

运行结果:
【lesson53】线程控制_第33张图片
我们看到ls确实被执行了,但是整个进程的代码都被替换掉了。

分离线程
默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_join操作,否则无法释放资源,从而造成系统泄漏
如果不关心线程的返回值,join是一种负担,这个时候,我们可以告诉系统,当线程退出时,自动释放线程资源。

测试代码:

#include 
#include 
#include 
#include 
#include 
#include 

__thread int g_val = 0;
void *threadRoutine(void *arg)
{
    pthread_detach(pthread_self());
    while(true)
    {
        std::cout << (char*)arg << ": "<< g_val << " &: " << &g_val << std::endl;
        g_val++;
        sleep(1);
    }
}
int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void *)"thread 1");

    while(true)
    {
        std::cout << "main thread: " << g_val << " &: " << &g_val << std::endl;
        sleep(1);
        break;
    }

    int n = pthread_join(tid,nullptr);
    std::cout << "n:" << n << " errstring: " << strerror(n) << std::endl;
    return 0;
}

运行结果:
【lesson53】线程控制_第34张图片
我们看到join异常进程直接退出。

所以线程分离后线程异常也会影响整个进程

C++语言提供的线程,而语言级别的线程库必须调用原生线程库---->本质是对原生线程库的封装
代码:
【lesson53】线程控制_第35张图片
运行:
【lesson53】线程控制_第36张图片
进程线程间的互斥相关背景概念
临界资源:多线程执行流共享的资源就叫做临界资源
临界区:每个线程内部,访问临界自娱的代码,就叫做临界区
互斥:任何时刻,互斥保证有且只有一个执行流进入临界区,访问临界资源,通常对临界资源起保护作用
原子性(后面讨论如何实现):不会被任何调度机制打断的操作,该操作只有两态,要么完成,要么未完成

如果多个线程访问同一个全局变量,并对它进行数据计算,多线程会互相影响吗?
测试代码:
抢票代码

#include 
#include 
#include 
#include 
#include 
#include 
#include 

int tickets = 10000;
void *GetTickets(void *args)
{
    while (true)
    {
        if (tickets > 0)
        {
            usleep(1000);
            printf("%p : %d\n", pthread_self(), tickets);
            tickets--;
        }
        else
        {
            break;
        }
    }

    return nullptr;
}

int main()
{
    pthread_t t1;
    pthread_t t2;
    pthread_t t3;

    pthread_create(&t1, nullptr, GetTickets, nullptr);
    pthread_create(&t2, nullptr, GetTickets, nullptr);
    pthread_create(&t3, nullptr, GetTickets, nullptr);

    pthread_join(t1, nullptr);
    pthread_join(t2, nullptr);
    pthread_join(t3, nullptr);

    return 0;
}

运行结果:
【lesson53】线程控制_第37张图片
我们发现票抢到-1了,这肯定是错的!
每次运行的结果都不一定一样:
【lesson53】线程控制_第38张图片
所以tickets在并发访问的时候,导致了我们数据不一致的问题。之后再解决这个歌问题。

你可能感兴趣的:(linux,Linux,线程控制,C++)