1. 底层逻辑:
1. 一个芯片上通常会运行多个独立的逻辑流,于是就有了并发。
2. 为了解决并发所带来的上下文切换问题,所以引入了进程。
3. 进程就这样抽象出一个概念,搭配虚拟内存、进程表之类的东西,用来管理独立的程序运行、切换。
4. 程序的运行涉及大量的计算机资源配置,出于安全性考虑,这些资源的分配,需要陷入内核,切换到操作系统,由操作系统来进行资源的配置。
5. 由于进程的切换需要反复进入内核,置换掉一大堆的状态,进程数一高,大部分的系统资源都被进程切换吃掉了。
6. 为了解决这个问题,搞出线程,这个地方阻塞了,但还有其它地方的逻辑流可以计算,这些逻辑流是共享一个地址空间的,不需要特别麻烦的切换页表、刷新TLB,只需要将寄存器刷新一遍就行,比进程切换开销少。
7. 如果连时钟阻塞、 线程切换这些功能我们都不需要了,自己在进程里面写一个逻辑流调度的东西。那么我们即可以利用到并发优势,又可以避免反复系统调用,还有进程切换造成的开销,分分钟给你上几千个逻辑流不费力。这就是用户态线程。
8. 实现一个用户态线程有两个必须要处理的问题:一是碰着阻塞式I\O会导致整个进程被挂起;二是由于缺乏时钟阻塞,进程需要自己拥有调度线程的能力。如果一种实现使得每个线程需要自己通过调用某个方法,主动交出控制权。那么我们就称这种用户态线程是协作式的,即是协程。
9. 本质上,协程就是用户空间下的线程。协程的优点是,让原来要使用异步+回掉的方式写的代码,可以用看似同步的方式写出来。
总结:
1. 由于并发的关系引入了进程,让不同的逻辑流可以并行执行。但是进程的切换需要陷入内核态,置换状态信息,造成极大的系统开销。
2. 为了减少这种系统开销,从而引入线程,线程可以解决并发的问题,同时也减少了系统的开销资源,由于线程间可以共享地址空间,所以在线程切换的时候,可以不用切换页表全局目录。
3. 自己在进程里面写一个逻辑流调度的东西。那么我们即可以利用到并发优势,又可以避免反复系统调用,还有进程切换造成的开销,分分钟给你上几千个逻辑流不费力。这就是用户态线程。(协程)
2. 进程切换在切换什么
1. 切换内核态堆栈(由于进程切换需要陷入内核态,用户态到内核态的切换,必然会涉及到内核态堆栈的切换)
2. PCB的切换(重新引起调度时,操作系统会找到新的进程的PCB,并完成该进程与新进程PCB的切换,寄存器的值,硬件上下文)
—ip(instruction pointer):指向当前执行指令的下一条指令
—bp(base pointer): 用于存放执行中的函数对应的栈帧的栈底地址
—sp(stack poinger): 用于存放执行中的函数对应的栈帧的栈顶地址
—cr3:页目录基址寄存器,保存页目录表的物理地址
3. 切换页表全局目录(由于进程是独享内存空间的,进程对内存的操作涉及到虚拟内存,页表是实现方式,所以切进程内存,就是切换页表)
4、刷新TLB(TLB本质是一种cache,用于完成虚拟地址和物理地址间的转换)
总结:
1. 进程切换必然陷入内核态,那就必然涉及到内核态堆栈切换。
2. 每一个进程都有一个PCB用于描述控制进程的运行。进程切换必然切换PCB.
3. 每个进程独享内存空间,虚拟内存到物理内存的映射,通过页表实现,所以要切换页表。
4. 虚拟地址和物理地址间的转换,还涉及到TLB(cache),所以需要刷TLB.
3. 进程切换和线程切换
其实进程和线程之间本质的区别在于对内存资源的占有
—进程独享资源,所以切进程需要切页表(虚拟地址空间的切换)
—线程共享资源,所以不需要切页表(虚拟地址空间的切换)
线程的切换本质上还是进程的切换,只要进程切换,必然会进入内核态,只有内核才有权力进行进程调度,而进程的调度也会涉及到一些数据结构,比如调度进程的红黑树,或者是阻塞进程的队列集,也只有内核才有资格访问。