sy'ty

【Linux】多线程

Linux线程概念

1. 什么是线程

2. 重新定义线程和进程

3. 重讲地址空间

4. 线程的优点

5. 线程的缺点

6. 线程异常

7. 线程用途

Linux进程VS线程

1. 进程和线程

2. 进程的多个线程共享

3. 线程为什么进程要更加轻量化？

Linux线程控制

1. POSIX线程库

2. 创建线程

3. 线程等待

4. 线程终止

5. 重谈线程的参数和返回值

6. C++11多线程vs原生线程库

7. 创建多个线程

8. 线程分离

9. 线程ID及进程地址空间布局

Linux线程概念

1. 什么是线程

在一个程序里的一个执行路线就叫做线程（thread）。更准确的定义是：线程是 “ 一个进程内部的控制序列 ”
一切进程至少都有一个执行线程。
线程在进程内部运行，本质是在进程地址空间内运行。
在Linux系统中，在CPU眼中，看到的PCB都要比传统的进程更加轻量化。
透过进程虚拟地址空间，可以看到进程的大部分资源，将进程资源合理分配给每个执行流，就形成了线程执行流。

一般在Linux教材里面线程是这样定义的：

线程是在进程内部运行的一个执行分支，线程的执行粒度，要比进程更加细。

也就是一个进程内可能存在多个线程。所以进程和线程的比例关系是进程:线程 = 1:n

在OS中存在这么多的线程，那么OS要不要管理线程呢？如何管理呢？—— 先描述，再组织。

因此我们就可以得出一个推论：线程也应该要有线程控制块TCB。我们window下的多线程就是这样子做的。但是操作系统管理进程已经非常复杂，同样的方式管理线程会更复杂。

所以Linux下的多线程并没有像上面说的那样通过创建数据结构，然后通过管理数据结构从而达到管理线程的目的。那我们Linux下的多线程是怎么做的呢？

Linux管理线程采用的是复用进程数据结构和管理算法。

我们知道创建一个进程，我们需要为它创建一些列的数据结构，例如：PCB(进程控制块)、mm_struct(进程地址空间)、页表和file_struct等

那如果我们在创建进程时，只创建task_struct，将那个创建出来的进程的task_struct和父进程的task_struct共享虚拟地址空间和页表，并将父进程的资源（代码+数据），划分为若干份，让每个task_struct使用会是怎么样的呢？

我们来看下面这个图：

CPU此时看到的PCB是<=我们之前讲的PCB的概念的，CPU只有调度执行流的概念，在CPU看来一个PCB就是一个需要被调度的执行流。（如果进程只有一个线程，线程 = 执行流 = 进程，如果进程有多个线程，线程 = 执行流 < 进程）

这就是我们Linux下的线程，Linux中并没有像windows下为线程专门设计TCP，而是使用进程PCB来模拟线程。

Linux管理线程的方法比Windows的方法好在哪里呢？

不用维护复杂的进程和线程的关系，不用单独为线程实现管理算法，直接使用进程的一套相关的方法，OS只需要关注在线程间的资源分配上就可以了。

2. 重新定义线程和进程

什么叫线程？

我们认为，线程就是操作系统调度的基本单位！！

我们上面说线程是在进程内部运行的一个执行分支，这里的内部是什么意思呢？那什么又叫做一个执行分支呢？

这里的内部指的是线程是在进程的虚拟地址空间中运行的。执行分支指的是CPU调度的时候只看PCB，每一个PCB曾经被指派过指向方法和数据，CPU是可以直接调度的。

什么叫进程？

我们之前认为的进程：进程 = 内核数据结构(task struct) + 代码和数据

了解了Linux下的线程之后，我们又该如何理解我们之前讲的进程呢？

学习了线程后，我们把下面用红色方框圈起来的内容，我们将这个整体叫做进程！！

我们从内核视角来看进程就是承担分配系统资源的基本实体！！

之前我们讲的进程，内部只有一个执行流。学习了线程之后，我们重新定义的进程，内部可以具有多个执行流。创建进程的 "成本非常高"，成本：时间+空间，创建一个进程要使用的资源是非常多的。

小结：我们从内核视角来看进程就是承担分配系统资源的基本实体！！而线程就是CPU调度的基本单位，承担进程资源的一部分的基本实体，进程划分资源给线程。总得来说 Linux下的线程就是轻量级进程。

3. 重讲地址空间

前面我们说线程就是CPU调度的基本单位，承担进程资源的一部分的基本实体，进程划分资源给线程，那么如何理解资源分配各个线层呢？下面我们通过重谈地址空间来解决这个问题。

我们先来解决下面这个问题——虚拟地址是如何转换到物理地址的? ? ? 32位虚拟地址为例
虚拟地址是多少位的? 32位

我们先来解释下面几个概念：

页目录：页目录是虚拟内存到物理内存映射的索引表，它包含了1024个页目录表项(PDE)。每个PDE指向一个二级页表。
二级页表：二级页表是实际映射表，包含了1024个页表表项(PTE)。每个PTE指向物理内存中的一个页框。
物理内存：物理内存是实际存储数据的内存空间，以页框为单位进行管理，每个页框为4kb。

虚拟地址的32位地址划分成三部分：10+10+12，他们从全0到全1进行穷举，并且转化成10进制数

虚拟地址是如何转换到物理地址的过程：

根据虚拟地址的高位部分，在页目录中找到相应的页目录表项。虚拟地址前10位转化成10进制数就是页目录的下标，通过前10位虚拟地址找到页目录对应的表项。
根据页目录表项中的地址，在二级页表中查找相应的二级页表。页目录表项存放的是二级页表的地址，我们就可以找到对应的二级目录。
根据二级页表表项中的地址，在物理内存中找到对应的页框。中间10位虚拟地址转换成10进制数就是二级页表的下标，二级目录的表项存放的是物理内存当中的页框起始地址，找到对应的页框的地址。
最终，通过页框中的偏移量，确定虚拟地址在物理内存中的具体位置。虚拟地址的最后12位是我们要访问物理内存在页框中的偏移量！！也就是说最后我们通过虚拟地址的最后12位地址+加上页框地址的起始地址就是=我们要访问的物理地址！！

访问任何变量都是：起始地址+类型 = 起始地址 + 偏移量（X86的特点）

举个例子：

一个整型有4个字节，每个字节一个地址，我们&a只拿到了最低位地址，然后根据整型是4个字节，我们往后取4个地址就可以取到整个整型了。

也就是说，我们c语言中变量取到的地址都是他众多字节当中的最低位地址，然后CPU可以根据变量的类型，通过起始地址加偏移量的方式就可以知道每次我们要读取多少字节，加载多少字节。

类也一样，编译完之后就没有类的概念了。也就是说类也是内置类型的集合。

我们来看下面这个图加深理解：

缺页中断：当软件试图访问已映射在虚拟地址空间中，但是并未被加载在物理内存中的一个分页时，由中央处理器的内存管理单元所发出的中断，称为缺页中断。（中间10位得到的地址找不到对应的二级页表表项，或者二级页表表项存放的页框的起始地址根本就没有建立映射关系。）

我们CPU当中还有CR2寄存器，当我们缺页中断时，CR2寄存器可以保存最后一次出现缺页中断的全32位线性地址。在缺页中断发生时，CPU会通过读取CR2来获取导致缺页中断的线性地址，以便进行错误处理和恢复操作。因此，CR2寄存器对于CPU的错误处理和内存管理具有重要的意义。

4. 线程的优点

创建一个新线程的代价要比创建一个新进程小得多
与进程之间的切换相比，线程之间的切换需要操作系统做的工作要少很多
线程占用的资源要比进程少很多
能充分利用多处理器的可并行数量
在等待慢速I/O操作结束的同时，程序可执行其他的计算任务
计算密集型应用，为了能在多处理器系统上运行，将计算分解到多个线程中实现
I/O密集型应用，为了提高性能，将I/O操作重叠。线程可以同时等待不同的I/O操作。

5. 线程的缺点

性能损失

一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多，那么可能会有较大的性能损失，这里的性能损失指的是增加了额外的同步和调度开销，而可用的资源不变。

健壮性降低

编写多线程需要更全面更深入的考虑，在一个多线程程序里，因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的，换句话说线程之间是缺乏保护的。

缺乏访问控制

进程是访问控制的基本粒度，在一个线程中调用某些OS函数会对整个进程造成影响。

编程难度提高

编写与调试一个多线程程序比单线程程序困难得多

6. 线程异常

单个线程如果出现除零，野指针问题导致线程崩溃，进程也会随着崩溃。
线程是进程的执行分支，线程出异常，就类似进程出异常，进而触发信号机制，终止进程，进程终止，该进程内的所有线程也就随即退出。

7. 线程用途

合理的使用多线程，能提高CPU密集型程序的执行效率。
合理的使用多线程，能提高IO密集型程序的用户体验（如生活中我们一边写代码一边下载开发工具，就是多线程运行的一种表现）。

Linux进程VS线程

1. 进程和线程

进程是资源分配的基本单位

线程是调度的基本单位

线程共享进程数据，但也拥有自己的一部分数据：

线程ID
一组寄存器(也就是线程的上下文，独立的上下文保证线程是被独立的调度的，保护CPU调度时存放在寄存器中的临时数据)
栈(保护线程运行时所形成的临时数据，独立的栈结构保证线程调度的过程中不会出现线程错乱的问题)
errno
信号屏蔽字
调度优先级

2. 进程的多个线程共享

同一地址空间，因此Text Segment、Data Segment都是共享的，如果定义一个函数，在各线程
中都可以调用，如果定义一个全局变量，在各线程中都可以访问到，除此之外，各线程还共享以下进程资源和环境:

文件描述符表
每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
当前工作目录
用户id和组id

进程和线程的关系如下图:

3. 线程为什么进程要更加轻量化？

创建和释放更加轻量化(生死)
切换更加轻量化 (运行)

资源消耗：线程是进程内的一部分，因此线程的创建、切换和销毁等操作相对于进程更加轻量级。在操作系统中，创建新的进程需要分配独立的地址空间和虚拟地址空间，并且建立众多的数据表来维护其代码段、堆栈段和数据段，开销较大。而线程则共享进程的资源，所以线程的创建、切换和销毁等操作对系统资源的消耗较小。

并发性：线程可以共享进程的资源，使得多个线程之间可以直接通信和协作，而无需通过操作系统进行复杂的切换和通信操作。这种并发性使得线程在处理大量任务时更加高效。

CPU的cache存放的是CPU刚用过或循环使用的一部分数据，如果CPU需要再次使用该部分数据时可从Cache中直接调用，这样就避免了重复存取数据。对于进程和线程，CPU的cache对它们的执行效率有重要影响。线程的切换不需要重新cache数据，大大提高了效率。

Linux线程控制

1. POSIX线程库

与线程有关的函数构成了一个完整的系列，绝大多数函数的名字都是以“pthread_”打头的
要使用这些函数库，要通过引入头文
链接这些线程函数库时要使用编译器命令的“-lpthread”选项

2. 创建线程

创建线程函数原型如下：

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *
(*start_routine)(void*), void *arg);

功能：创建一个新的线程

参数：

thread:返回线程ID
attr:设置线程的属性，attr为NULL表示使用默认属性
start_routine:是个函数地址，线程启动后要执行的函数
arg:传给线程启动函数的参数

返回值：成功返回0；失败返回错误码

错误检查：

传统的一些函数是，成功返回0，失败返回-1，并且对全局变量errno赋值以指示错误。
pthreads函数出错时不会设置全局变量errno（而大部分其他POSIX函数会这样做）。而是将错误代码通过返回值返回。
pthreads同样也提供了线程内的errno变量，以支持其它使用errno的代码。对于pthreads函数的错误，建议通过返回值业判定，因为读取返回值要比读取线程内的errno变量的开销更小。

下面我们来使用一下这个函数创建线程：

void *threadRoutine(void *args)
{
    while (true)
    {
        cout << "new thread, pid: " << getpid() << endl;
        sleep(1);
    }

    return nullptr //走到这里默认线程退出了！   
}

int main()
{
    // PTHREAD_CANCELED;
    // 是一个很大的数字
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void*)"Thread 1"); // 不是系统调用

    while (true)
    {
        cout << "main thread, pid: " << getpid() << endl;
        sleep(1);   
    }

    return 0;
}

makefile文件：

mythread:mythread.cc
	g++ -o $@ $^ -lpthread
clean:
	rm -f mythread

注意要加上-lpthread选项

运行结果：

线程id跟进程id一样的线程是主线程。我们看到每个线程的id不一样，说明线程是操作系统调度的基本单位。

我们再来做几个实验验证一下上面讲的理论：

1.线程的健壮性差：一个线程被kill整个进程就被kill

我们看到，不管是kill新线程还是主线程，都会把整个进程给kill掉。验证了线程健壮性差的缺点。

一个线程出现异常，整个进程都退出：

#include 
#include 
#include 

using namespace std;

// new thread
void *threadRoutine(void *args)
{
    while (true)
    {
        cout << "new thread, pid: " << getpid() << endl;
        sleep(1);
        int a = 10;
        a /= 0;
    }
}

int main()
{
    // PTHREAD_CANCELED;
    // 是一个很大的数字
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void*)"Thread 1"); // 不是系统调用

    sleep(1); // 只是为了保证新线程已经启动

    while (true)
    {
        cout << "main thread, pid: " << getpid() << endl;
        sleep(1);
    }

    return 0;
}

可以看到只要其中一个线程出现除零错误，整个进程都退出了，这也说明了线程的健壮性差。

2. 进程的多个线程共享

同一地址空间，因此Text Segment、Data Segment都是共享的，如果定义一个函数，在各线程
中都可以调用，如果定义一个全局变量

#include 
#include 
#include 

using namespace std;

int g_val = 100;

void show(const string &name)
{
    cout << name << "say# "
    << "hello thread" << endl;
}

// new thread
void *threadRoutine(void *args)
{
    const char *name = (const char*)args;
    while (true)
    {
        printf("%s, pid: %d, g_val: %d, &g_val: 0x%p\n", name, getpid(), g_val, &g_val);
        show("[new thread]");
        sleep(1);
    }
}

int main()
{
    // PTHREAD_CANCELED;
    // 是一个很大的数字
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void*)"Thread 1"); // 不是系统调用

    sleep(1); // 只是为了保证新线程已经启动

    while (true)
    {
        printf("main thread pid: %d, g_val: %d, &g_val: 0x%p, create new thread tid: %p\n", getpid(), g_val, &g_val, tid);

        show("[main thread]");
        sleep(1);
        g_val++;    
    }

    return 0;
}

运行结果：

我们看到两个线程都可以调用show函数和使用g_val全局变量，且主线程对g_val进行修改，新线程也可以看到修改后的值。

3. 线程等待

为什么需要线程等待？

已经退出的线程，其空间没有被释放，仍然在进程的地址空间内。
创建新的线程不会复用刚才退出线程的地址空间。

线程也是需要被等待的，如果不等待，可能会导致类似于“僵尸进程”的问题。

下面来给大家介绍一个线程等待的函数——pthread_join()

功能： 等待线程结束

pthread_join函数的函数原型如下：

参数：

thread:线程ID
value_ptr:它指向一个指针，后者指向线程的返回值

返回值：成功返回0；失败返回错误码

下面我们就来使用一下这个函数：

#include 
#include 
#include 

using namespace std;

// new thread
void *threadRoutine(void *args)
{
    // const char *name = (const char*)args;
    int cnt = 5;
    while (true)
    {
        cout << "new thread, pid: " << getpid() << endl;
        sleep(1);

        cnt--;
        if(cnt == 0) break;
    }

    return (void*)100; //走到这里默认线程退出了！
}

int main()
{
    // PTHREAD_CANCELED;
    // 是一个很大的数字
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void*)"Thread 1"); // 不是系统调用

    sleep(7);
    void *retval;
    pthread_join(tid, &retval);// main thread等待的时候，默认是阻塞等待的！为什么我们在这里join的时候不考虑异常呢？？做不到！

    cout << "main thread quit ..., ret: " << (long long int)retval << endl;
    return 0;
}

运行结果：

我们通过监控脚本查看线程的运行状态：

while :; do ps -aL | head -1 && ps -aL | grep mythread; sleep 1; done

我们看到主线程成功等待另一个线程退出，通过retval指针收到函数的返回值。通过监控脚本我们看到新线程退出后对主线程没有影响，说明线程等待的时候，默认是阻塞等待的！（不关心线程的退出码，将join函数的第二个参数设置为nullptr即可。）

我们之前学习进程等待的时候，我们可以通过wait函数或者是waitpid函数的输出型参数status，获取到进程的退出码、退出信号以及core dump标志。

我们的线程和进程一样，退出有以下三种情况：

代码跑完，结果正确
代码跑完，结果不正确
代码异常了

我们可以通过join的第二个参数拿到线程的返回值，从而知道线程跑完，结果正确还是不正确。那我们的pthread_join能或者需要处理代码异常的情况嘛？根本就不需要，因为线程是进程的一个执行分支，如果进程中的某个线程崩溃了，会导致整个进程都崩溃，因此这根本就不是我们线程该管的事情，要管也是交给进程去管。

4. 线程终止

如果需要只终止某个线程而不终止整个进程，有以下三种办法：

从线程函数return。这种方法对主线程不适用，从main函数return相当于调用线程函数直接exit，整个进程退出。
线程可以调用pthread_ exit函数终止自己。
一个线程可以调用pthread_ cancel终止同一进程中的另一个线程。

下面我们就来介绍一下上面的三种方法

return退出

在线程函数中使用return表示当前线程退出，如果在main函数中使用return则代表进程退出，也就是说只要主线程退出了就相当于整个进程也就退出了，此时我们进程曾经申请的那些资源都会被释放，然后它缩创建的那些线程也会自动退出。

上面线程等待我们就用了return退出线程，这里就不再进行演示，可以看一下上面线程等待的代码和运行结果。

pthread_exit函数终止线程

除了上面return可以终止线程外，下面我们再来介绍一个函数——pthread_exit()

功能： 终止一个线程

函数原型如下：

void pthread_exit(void *retval);

参数：

retval：不要指向一个局部变量

返回值：

无返回值，跟进程一样，线程结束的时候无法返回到它的调用者（自身）

注意：

pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的，不能在线程函数的栈上分配，因为当其他线程得到这个返回指针时线程函数已经退出了。

#include 
#include 
#include 

using namespace std;


// new thread
void *threadRoutine(void *args)
{
    // const char *name = (const char*)args;
    int cnt = 5;
    while (true)
    {
        cout << "new thread, pid: " << getpid() << endl;
        sleep(1);

        cnt--;
        if(cnt == 0) break;
    }

    pthread_exit((void*)100);
}

int main()
{
    // PTHREAD_CANCELED;
    // 是一个很大的数字
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void*)"Thread 1"); // 不是系统调用

    sleep(7);
    void *retval;
    pthread_join(tid, &retval);// main thread等待的时候，默认是阻塞等待的！为什么我们在这里join的时候不考虑异常呢？？做不到！

    cout << "main thread quit ..., ret: " << (long long int)retval << endl;
    return 0;
}

运行结果：

pthread_cancel函数

功能： 取消一个正在执行中的线程

函数原型如下：

int pthread_cancel(pthread_t thread);

参数：

thread：线程ID

返回值：

成功返回0，失败返回错误码

下面我们来使用一下这个函数：

#include 
#include 
#include 
#include 

using namespace std;

// new thread
void *threadRoutine(void *args)
{
    while (true)
    {
        cout << "new thread, pid: " << getpid() << endl;
        sleep(1);
    }
 
    pthread_exit((void*)100);
}

int main()
{
    // PTHREAD_CANCELED;
    // 是一个很大的数字
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRoutine, (void*)"Thread 1"); // 不是系统调用

    sleep(1); // 只是为了保证新线程已经启动
    pthread_cancel(tid); // 不常见

    void *retval;
    pthread_join(tid, &retval);    // main thread等待的时候，默认是阻塞等待的！为什么我们在这里join的时候不考虑异常呢？？做不到！

    cout << "main thread quit ..., ret: " << (long long int)retval << endl;
    return 0;
}

运行结果：

可以看到线程被退出了，且收到的退出码为-1.

既然主线程可以取消新线程，那我们的新线程能不能取消我们的主线程呢？其实是可以的，但是并不建议这么做。因为主线程会出现类似于“僵尸进程”的问题。

注意：

线程之间地位都是对等的，因此我们既可以使用主线程去取消新线程，也可以使用新线程去取消主线程。我们使用主线程去取消新线程，只会导致新线程终止，其他线程还会正常执行。但是如果我们使用新线程去终止主线程，会导致主线程不再执行后续代码，并且出现类似于僵尸进程的问题。因此即使我们可以使用新线程去终止主线程，但是不建议这么做。

5. 重谈线程的参数和返回值

上面我们创建线程的时候，给线程函数传递的参数只是传递一些一般参数。其实线程的参数和返回值，不仅仅可以用来进行传递一般参数，也可以传递对象！！

我们来看下面这段代码：

#include 
#include 
#include 
#include 

using namespace std;

class Request
{
public:
    Request(int start,int end,string threadname)
    :_start(start),_end(end),_threadname(threadname)
    {}
public:
    int _start;
    int _end;
    string _threadname;
};

class Response
{
public:
    Response(int result,int exitcode)
    :_result(result),_exitcode(exitcode)
    {}
public:
    int _result;
    int _exitcode;
};

void* SumCount(void* args)
{
    Request* rq = static_cast(args);
    Response* rsp = new Response(0,0);

    for(int i = rq->_start; i <= rq->_end; ++i)
    {
        cout << rq->_threadname << "is running calling... " << i <_result+=i;
        usleep(100000);
    }
    delete rq;
    return rsp;
}

int main()
{
    pthread_t tid;
    Request* rq = new Request(1,100,"thread 1");
    pthread_create(&tid,nullptr,SumCount,rq);

    void *ret;
    pthread_join(tid,&ret);
    Response* rsp = static_cast(ret);

    cout << "rsp->result: " << rsp->_result << ", exitcode: " <_exitcode << endl;
    delete(rsp);
    
    return 0;
}

运行结果：

通过上面的例子我们验证了线程的参数和返回值，不仅仅可以用来进行传递一般参数，也可以传递对象！！我们还看到我们在主线程和新线程都申请了堆空间的变量，而且作为参数传递和使用。说明堆空间也是线程共享的！

6. C++11多线程vs原生线程库

我们上面讲的都是原生线程，pthread库，也叫原生线程库

其实C++11本身也支持多线程了，使用起来也比原生线程库要方便，下面我们来简单使用一下C++11的多线程：

void threadrun()
{
    while(true)
    {
        cout << "I am a new thead for C++" << endl;
        sleep(1);
    }
}

int main()
{
    thread t1(threadrun);
    t1.join();
    return 0;
}

makefile文件：

mythread:mythread.cc
	g++ -o $@ $^ -g -std=c++11 -lpthread
clean:
	rm -f mythread

注意要加上c++11和lpthread选项。

运行结果：

可以看到我们成功创建出新线程。我们还发现主线程的id和进程的pid是一致的，和我们原生线程库是一样的。这是因为其实C++11多线程库就是用原生线程库进行封装的。

C++11多线程vs原生线程库：

C++11多线程：

简洁的语法：C++11多线程提供了简洁的语法，使得线程的创建、同步和通信变得更加简单。
跨平台：C++11多线程是标准库的一部分，可以在不同的操作系统上使用。原生线程库则依赖于特定的操作系统
异常安全：C++11多线程库提供了异常安全机制，可以避免在多线程环境中出现异常时的数据竞争和其他问题。

原生线程库：

直接与操作系统线程交互，具有更高的性能和更低的延迟。
需要处理许多底层细节，如线程创建、同步、通信等，编程难度较高。
不同的操作系统提供了不同的原生线程库，跨平台兼容性较差。

总结：原生线程库具有较高的性能和灵活性，但需要处理底层细节，且跨平台兼容性较差。而C++11线程库的跨平台性较好，如果我们需要跨平台编程，建议使用C++11线程库。

7. 创建多个线程

（1）前面如何创建一个线程我已经学会了，那我们应该一次如何创建多个线程呢？

下面我们来尝试创建多个线程：

#include 
#include 
#include 
#include 
using namespace std;

#define NUM 10

struct threadData
{
    string threadname;
};

string toHex(pthread_t tid)
{
    char buffer[128];
    snprintf(buffer, sizeof(buffer), "0x%x", tid);
    return buffer;
}

void InitThreadData(threadData* td,int number)
{
    td->threadname = "thread-" + to_string(number);
}

void* threadRountine(void* args)
{
    int test_i = 0;
    threadData* td = static_cast(args);
    string tid = toHex(pthread_self());
    int pid = getpid();

    int i = 0;
    while (i < 10)
    {
        // cout << "tid:" << tid << ",pid:" << pid << endl;
        cout << "pid: " << getpid() << ", tid : " << tid 
        << ", threadname: " << td->threadname < tids;
    for(int i = 0; i < NUM; i++)
    {
        pthread_t tid;
        threadData* td = new threadData;//这里要用new在堆上创建。如果直接定义，这里是在主线程的栈上创建，而且是在for循环，循环结束其它线程就没办法访问了
        InitThreadData(td,i);

        pthread_create(&tid,nullptr,threadRountine,td);
        tids.push_back(tid);
        // sleep(1);
    }
    sleep(1); // 确保复制成功

    for (int i = 0; i < tids.size(); i++)
    {
        int n = pthread_join(tids[i],nullptr);
    }
    
    return 0;
}

运行结果：

可以看到我们成功创建出来十个线程。

（2）前面我们说过每一个线程都有自己的栈结构，保护各个线程运行时所形成的临时数据，独立的栈结构保证线程调度的过程中不会出现线程错乱的问题

下面我们利用多线程来进行验证：

#include 
#include 
#include 
#include 
using namespace std;

#define NUM 3

struct threadData
{
    string threadname;
};

string toHex(pthread_t tid)
{
    char buffer[128];
    snprintf(buffer, sizeof(buffer), "0x%x", tid);
    return buffer;
}

void InitThreadData(threadData* td,int number)
{
    td->threadname = "thread-" + to_string(number);
}

void* threadRountine(void* args)
{
    int test_i = 0;
    threadData* td = static_cast(args);
    string tid = toHex(pthread_self());
    int pid = getpid();

    int i = 0;
    while (i < 10)
    {
        cout << "pid: " << getpid() << ", tid : " << tid 
        << ", threadname: " << td->threadname 
        << " test_i: " << test_i << " &test_i: " << &test_i << endl;
        sleep(1);
        i++; test_i++;
    }

    delete td;
    return nullptr;
}

int main()
{
    //创建多线程
    vector tids;
    for(int i = 0; i < NUM; i++)
    {
        pthread_t tid;
        threadData* td = new threadData;//这里要用new在堆上创建。如果直接定义，这里是在主线程的栈上创建，而且是在for循环，循环结束其它线程就没办法访问了
        InitThreadData(td,i);

        pthread_create(&tid,nullptr,threadRountine,td);
        tids.push_back(tid);
        // sleep(1);
    }
    sleep(1); // 确保复制成功

    for (int i = 0; i < tids.size(); i++)
    {
        int n = pthread_join(tids[i],nullptr);
    }
    
    return 0;
}

运行结果：

我们看到虽然每个线程调用的是同一个函数，且test_i的值都是依次从0开始增长。但是我们看到每个线程的test_i的地址却是不一样的。

这是因为每个线程都有自己独立的栈结构，各个线程调用这个函数时都要在自己独立的栈结构开辟栈帧，各自在自己的栈上创建了一个test_i。

其实线程和线程之间，几乎没有秘密，线程的栈上的数据，也是可以被其他线程看到并访问的。

下面我们来进行验证：

#include 
#include 
#include 
#include 
using namespace std;

#define NUM 3

int *p = NULL;
int g_val = 100;

struct threadData
{
    string threadname;
};

string toHex(pthread_t tid)
{
    char buffer[128];
    snprintf(buffer, sizeof(buffer), "0x%x", tid);
    return buffer;
}

void InitThreadData(threadData* td,int number)
{
    td->threadname = "thread-" + to_string(number);
}

void* threadRountine(void* args)
{
    int test_i = 0;
    threadData* td = static_cast(args);
    if(td->threadname == "thread-2") p = &test_i;
    string tid = toHex(pthread_self());
    int pid = getpid();

    int i = 0;
    while (i < 10)
    {
        cout << "pid: " << getpid() << ", tid : " << tid 
        << ", threadname: " << td->threadname 
        << " test_i: " << test_i << " &test_i: " << &test_i << endl;
        sleep(1);
        i++; test_i++;
    }

    delete td;
    return nullptr;
}

int main()
{
    //创建多线程
    vector tids;
    for(int i = 0; i < NUM; i++)
    {
        pthread_t tid;
        threadData* td = new threadData;//这里要用new在堆上创建。如果直接定义，这里是在主线程的栈上创建，而且是在for循环，循环结束其它线程就没办法访问了
        InitThreadData(td,i);

        pthread_create(&tid,nullptr,threadRountine,td);
        tids.push_back(tid);
    }
    sleep(1); // 确保复制成功

    cout << "main thread get a thread local value, val: " << *p << ", &val: " << p << endl;

    for (int i = 0; i < tids.size(); i++)
    {
        int n = pthread_join(tids[i],nullptr);
    }
    
    return 0;
}

运行结果：

（3）我们前面验证过全局变量是可以被所有线程同时看到并访问的，那如果我们想要私有一个全局变量呢？

我们只需要在全局变量的前面加上__thread就可以完成对全局变量进行线程的局部存储了：

#include 
#include 
#include 
#include 
using namespace std;

#define NUM 3

int *p = NULL;
__thread int g_val = 100;

struct threadData
{
    string threadname;
};

string toHex(pthread_t tid)
{
    char buffer[128];
    snprintf(buffer, sizeof(buffer), "0x%x", tid);
    return buffer;
}

void InitThreadData(threadData* td,int number)
{
    td->threadname = "thread-" + to_string(number);
}

void* threadRountine(void* args)
{
    int test_i = 0;
    threadData* td = static_cast(args);
    string tid = toHex(pthread_self());
    int pid = getpid();

    int i = 0;
    while (i < 10)
    {
        cout << "pid: " << getpid() << ", tid : " << tid 
        << ", threadname: " << td->threadname 
        << ", g_val: " << g_val << " ,&g_val: " << &g_val < tids;
    for(int i = 0; i < NUM; i++)
    {
        pthread_t tid;
        threadData* td = new threadData;//这里要用new在堆上创建。如果直接定义，这里是在主线程的栈上创建，而且是在for循环，循环结束其它线程就没办法访问了
        InitThreadData(td,i);

        pthread_create(&tid,nullptr,threadRountine,td);
        tids.push_back(tid);
    }
    sleep(1); // 确保复制成功

    for (int i = 0; i < tids.size(); i++)
    {
        int n = pthread_join(tids[i],nullptr);
    }
    
    return 0;
}

运行结果：

可以看到在全局变量加上__thread之后每个线程的g_val地址都不一样了。

这样定义有什么作用呢？

减少系统调用和实现线程的局部存储。如果我们要用一个变量保存进程的pid或者线程的id，只需要用__thread在全局定义一个变量，然后再调用一次系统调用进行保存。后面我们就只需要调用这个变量就可以了，不需要再调用系统调用了

有人会问线程不是有独立的栈结构吗？那我们在线程函数直接定义局部变量不是一样的吗？

其实这种方法也可以，但是如果我们还要在线程函数里面再调用其他函数，还需要使用到这些变量，就需要将这些变量传进去，就会非常麻烦。

注意：__thread这个方法只能定义内置类型，不用用来修饰类等自定义类型。

8. 线程分离

默认情况下，新创建的线程是joinable的，线程退出后，需要对其进行pthread_join操作，否则无法释放资源，从而造成内存泄漏。
如果不关心线程的返回值，join是一种负担，这个时候，我们可以告诉系统，当线程退出时，自动释放线程资源。

所以我们如果不想等待该线程并且也不想造成内存泄漏，我们可以采用线程分离，分离之后的线程不需要被join，运行完毕之后，会自动释放该线程的资源。

下面来为大家介绍一个函数——pthread_detach()

int pthread_detach(pthread_t thread);

参数：

thread：被分离线程的ID

返回值：

线程分离成功返回0，失败返回错误码

可以是线程组内其他线程对目标线程进行分离，也可以是线程自己分离：

pthread_detach(pthread_self());

我们下面首先来使用线程组内其他线程对目标线程进行分离：

#include 
#include 
#include 
#include 
#include 
using namespace std;

#define NUM 3

int *p = NULL;
__thread int g_val = 100;

struct threadData
{
    string threadname;
};

string toHex(pthread_t tid)
{
    char buffer[128];
    snprintf(buffer, sizeof(buffer), "0x%x", tid);
    return buffer;
}

void InitThreadData(threadData* td,int number)
{
    td->threadname = "thread-" + to_string(number);
}

void* threadRountine(void* args)
{
    int test_i = 0;
    threadData* td = static_cast(args);
    string tid = toHex(pthread_self());
    int pid = getpid();

    int i = 0;
    while (i < 10)
    {
        cout << "pid: " << getpid() << ", tid : " << tid 
        << ", threadname: " << td->threadname 
        << ", g_val: " << g_val << " ,&g_val: " << &g_val < tids;
    for(int i = 0; i < NUM; i++)
    {
        pthread_t tid;
        threadData* td = new threadData;//这里要用new在堆上创建。如果直接定义，这里是在主线程的栈上创建，而且是在for循环，循环结束其它线程就没办法访问了
        InitThreadData(td,i);

        pthread_create(&tid,nullptr,threadRountine,td);
        tids.push_back(tid);
    }
    sleep(1); // 确保复制成功

    for(auto i : tids)
    {
        pthread_detach(i);
    }

    for (int i = 0; i < tids.size(); i++)
    {
        int n = pthread_join(tids[i],nullptr);
        printf("n = %d, who = 0x%x, why: %s\n", n, tids[i], strerror(n));
    }
    
    return 0;
}

运行结果：

我们可以看到这次三个线程只执行了一次。我们还可以看到join的返回值是22，不是0，此时证明我们的join是失败的。这是为什么？

因为joinable和分离是冲突的，一个线程不能既是joinable又是分离的。所以我们三个线程就只执行了一次。

我们也可以使用线程自己分离：

运行结果：

9. 线程ID及进程地址空间布局

pthread_ create函数会产生一个线程ID，存放在第一个参数指向的地址中。该线程ID和前面说的线程ID不是一回事。
前面讲的线程ID属于进程调度的范畴。因为线程是轻量级进程，是操作系统调度器的最小单位，所以需要一个数值来唯一表示该线程。
pthread_ create函数第一个参数指向一个虚拟内存单元，该内存单元的地址即为新创建线程的线程ID，属于NPTL线程库（原生线程库）的范畴。线程库的后续操作，就是根据该线程ID来操作线程的。
线程库NPTL提供了pthread_ self函数，可以获得线程自身的ID：

下面我们来使用一下pthread_ self函数：

#include 
#include 
#include 
#include 
#include 

using namespace std;

string toHex(pthread_t tid)
{
    char Hex[64];
    snprintf(Hex,sizeof(Hex),"%p",tid);
    return Hex;
}

void* threadRountine(void* args)
{
    while (true)
    {
        cout << "thread id:" << toHex(pthread_self()) << endl;
        sleep(1);
    }
}

int main()
{
    pthread_t tid;
    pthread_create(&tid,nullptr,threadRountine,(void*)"thread 1");

    cout << "main thread id : " << toHex(pthread_self()) << endl;
    cout << "main thread create thead done, new thread id : " << toHex(tid) << endl;
    pthread_join(tid,nullptr);
    return 0;
}

运行结果：

我们查看到的线程id是pthread库的线程id，不是Linux内核中的LWP，pthread库的线程id是一个内存地址。

我们通过ldd命令可以看到，我们采用的线程库实际上是一个动态库：

我们知道要想创建线程，首先你得要有一个进程，创建进程就需要创建一堆数据结构，进程创建好了之后我们还需要使用pthread动态库。而pthread动态库在磁盘上面是一个文件，那既然是文件如果我们想使用它，我们就需要把它加载到内存中才行。

进程运行时动态库被加载到内存，然后通过页表映射到进程地址空间中的共享区，此时我们进程内部的所有线程就都可以看到这个动态库。

线程库注定了要维护多个线程属性集合。每个线程都要有运行时的临时数据，这也就意味着每个线程都要有自己的私有栈结构。那我们创建了这么多的用户级线程，线程库如何管理这些线程呢？先描述再组织。

因此我们还需要有描述线程的用户级控制块，这个控制块叫做struct pthread，其中包含了对应线程的各种属性，每个线程还有自己的线程局部存储，当中包含了线程被切换时的上下文数据。

那这个用户级控制块具体是怎么样的呢，我们如何快速找到一个用户级线程呢？

每个线程在共享区都有这样的一块区域对其进行描述，因此我们要找到一个用户级线程我们只需要找到该线程的用户级控制块的起始地址，就可以获取到该线程的各种信息了。

pthread_t 到底是什么类型呢？取决于实现。对于Linux目前实现的NPTL实现而言，pthread_t类型的线程ID，本质就是一个进程地址空间上的一个地址。

主线程使用的栈是进程地址空间中原生的栈。新线程采用的栈是在共享区中开辟的，具体来说是在pthread库中的，tid指向的用户tcb中！

我们上面使用的各种线程函数，本质都是在线程内部对线程属性进行的各种操作，最后将要执行的代码交给对应的内核级LWP去执行就行了，也就是说线程数据的管理是在共享区的。

你可能感兴趣的:(Linux,linux,服务器,开发语言,c++)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
C++菜鸟教程 - 从入门到精通第二节 DreamByte c++
一.上节课的补充(数据类型)1.前言继上节课,我们主要讲解了输入,输出和运算符,我们现在来补充一下数据类型的知识上节课遗漏了这个知识点,非常的抱歉顺便说一下,博主要上高中了,更新会慢,2-4周更新一次对了,正好赶上中秋节,小编跟大家说一句:中秋节快乐!2.int类型上节课,我们其实只用了int类型int类型,是整数类型,它们存贮的是整数,不能存小数(浮点数)定义变量的方式很简单inta;//定义一
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
2021 CCF 非专业级别软件能力认证第一轮（CSP-J1）入门级C++语言试题（第三大题：完善程序代码） mmz1207 c++csp
最近有一段时间没更新了，在准备CSP考试，请大家见谅。（1）有n个人围成一个圈，依次标号0到n-1。从0号开始，依次0，1，0，1...交替报数，报到一的人离开，直至圈中剩最后一个人。求最后剩下的人的编号。#includeusingnamespacestd;intf[1000010];intmain(){intn;cin>>n;inti=0,cnt=0,p=0;while(cnt#includeu
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag