目录
一、地址空间&内存空间&页表
1.1 进程的视角看待地址空间和页表
1.2 页表映射内存空间原理
二、线程概念
2.1 线程是CPU调度的基本单位
2.2 轻量级进程标识号LWP(线程)
2.3 线程共享进程数据
2.4 线程私有资源(线程独立栈)
三、线程优缺点
3.1 线程的优点
3.2 线程的缺点
3.3. 线程异常
3.4 线程的应用
3.5 线程与进程比较
在前面进程的学习中,我们知道了每个进程都有自己的地址空间,然后通过页表映射内存地址空间!通过二者的算法匹配,我们得以存储获取内存空间资源!
所以如何从进程角度看待二者?
1.地址空间是进程能看到的资源窗口
2.页表决定了,进程真正拥有的资源情况
3.合理的对地址空间和页表进行资源划分,我们就可以对一个进程所有的资源进行区域划分!
操作系统对内存空间资源以4KB为单位划分,通过结构体Page进行描述,结构体数组组织。每一个4KB空间称为页框,在磁盘中磁盘也会以4KB为单位读入CPU中,此时4KB资源称为页帧!
这里我们可以引入一个问题:32位下地址空间有2^32=4GB个,所以页表需要有4GB * 6 = 24GB空间大小,显然内存空间存不下这么多资源!
那页表是如何完美映射内存空间呢?原来页表有页目录,目录下有许多页表!不同页表映射的内存地址不同,我们一个进程需要找的页表不是所有目录下的页表,而是选择性的!下面我们来具体说明如何找页表以及之后页表如何映射具体地址?
32位地址空间下,OS会将32位地址以10+10+12分割成三份!通过前十个bit位,我们可以找到页目录下的具体页表,然后通过后十个bit位,获取数据具体在内存空间的起始位置!最后12个比特位大小刚好是4KB,他们决定了起始地址往后的具体偏移量!这样就可以获取完整的数据!
线程是进程的一个执行流,它具有进程的部分资源!进程向内存要资源,线程向进程要资源!一个进程至少有一个线程!
在Linux中,没有真正意义的线程,Linux是用进程PCB模拟线程的,是一种完全属于自己的一套线程方案!所以线程在Linux中称为轻量级进程!
需要注意的是在Linux系统中,没有线程这个名词概念!所以默认没有线程库!所以我们这里的pthread.h是用户级别的线程库!需要我们在编译时-lpthread来找到这个库!
#include
#include
#include
#include
#include
#include
using namespace std;
string func()
{
return "我是一个独立的方法";
}
void* thread_route(void* args)
{
while(true)
{
const char* name = (const char*)args;
cout<<"我是新进程,我正在进行! name: "<
通过指定指令查看轻量级进程:
观察发现线程的PID相同,但是LWP却不同,所以LWP标识一个线程!CPU内通过LWP区分一个基本调度! main函数内代码称为主线程, 其他为非主线程!主线程LWP与进程PID相同!
#include
#include
#include
#include
#include
#include
using namespace std;
int global_val = 0;
void* thread_route(void* args)
{
while(true)
{
const char* name = (const char*)args;
cout<<"我是新进程,我正在进行! name: "<
void* thread_route(void* args)
{
int global_val = 0;
while(true)
{
const char* name = (const char*)args;
cout<<"我是新进程,我正在进行! name: "<
1.创建一个新线程的代价要比创建一个新进程小得多
2.与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多
CPU进程切换:PCB属性&上下文内容&虚拟地址空间&页表
线程切换:PCB属性&上下文内容
切换的差异核心:cache缓存,计算机有附近数据读取策略,简单讲就是你访问的数据附近的数据,计算机也会将其存入缓存cache中,CPU从cache中读取数据!线程切换不会切换cache内数据,而进程切换会!
3.线程占用的资源要比进程少很多
4.能充分利用多处理器的可并行数量
5.在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
6.计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
7.I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。
1. 性能损失
一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型
线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的
同步和调度开销,而可用的资源不变。
2.健壮性降低
编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。
3.缺乏访问控制
进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。
4.编程难度提高
编写与调试一个多线程程序比单线程程序困难得多
·单个线程如果出现除零,野指针问题导致线程崩溃,进程也会随着崩溃
·线程是进程的执行分支,线程出异常,就类似进程出异常,进而触发信号机制,终止进程,进程终止,该进程内的所有线程也就随即退出
合理的使用多线程,能提高CPU密集型程序的执行效率
合理的使用多线程,能提高IO密集型程序的用户体验
线程是进程的一个执行流,一个进程可以有多个线程并发的执行程序!例如如果我用迅雷想边看电影便下载电影,迅雷这个进程有两个动作需要同时进行!
进程是资源的分配的基本单位,线程是调度的基本单位
线程共享进程数据,但也拥有自己的一部分数据:
线程ID、一组寄存器、栈、errno、信号屏蔽字、调度优先级
线程共享进程的同一地址空间,因此代码区、数据区都是共享的!还共享:
文件描述符表、每种信号的处理方式、当前工作目录、用户ID和组ID