前言
本文是结合《现代操作系统》(Andrew S. Tanenbaum著)的摘要与上课ppt的笔记,自用。
进程:计算机上所有可运行的软件,通常也包括操作系统,被组织成若干顺序进程。所以一个进程就是一个正在运行的程序的实例,包括程序计数器,寄存器和变量的当前值。
多道程序设计:从概念上说,每个进程有一个自己的虚拟cpu,实际上真正的CPU
在这些进程之间来回切换造成一种伪并行的感觉,这种快速切换就叫做多道程序设计。
作业运行的标志——被分配了内存,所以进程被创建的标志就是拥有内存使用权。进程是分配内存资源的单位。
进程的特点:
线程依赖于进程,线程会共享进程申请的资源。
线程是动态的,任务结束后会被撤销,执行途中可能会被暂停,所以它具有状态值。
进程包含两个板块:
1)进程控制
2)进程存储区:存储代码、数据、用户栈
进程是串行的;
进程创建的方式(以分配内存作为标识):
守护进程:停留在后台处理诸多电子邮件、web页面、新闻、打印之类活动的进程。
可写的内存是不可以共享的;不可写的内存可以共享。
进程终止的方式(将内存占用变为空闲状态):
进程只有一个父进程,但父进程可以有0个或多个子进程。
进程的状态:
进程状态的管理:
系统初始化时有一个进程控制信息表(PCB:进程的系统空间;P区:系统相关的内容;U区:用户存储相关的内容),进程相关的控制信息会进入这个表保持就绪状态,进程相关的存储内容被调入进程的用户空间,该进程编号即为当前的PCB表的下标编号,编号大小与创建时间无关,但可以唯一区别进程,因为这个表是线性更新的,前进程结束后该编号就直接给当前的新进程。
如果将进程看作链表形的就绪队列,那么每个节点的数据域只保存进程的控制信息,控制信息中有进程在PCB表中对应的下标编号,从而方便cpu从PCB表找到对应进程,访问其详细的控制信息(PCB表每一个会留出一定区域保存该进程的存储区数据,比如用户栈等信息,这样一体化存储可以减少分隔存储带来的查找不利);同时PCB表格(类似一个数组线性结构),其空间大小时是强制写死的,当用户请求的进程数超过PCB编号允许的最大数值,会报错拒绝用户的进程申请。·
进程被中断后,被中断的进程总是返回到中断发生前完全相同的状态。
windows分时系统:优先级更新
每一级优先级相同的序列进行轮换执行,执行过后该进程优先级降低,而等待时间长的进程相应调高其优先级
Linux:加了一个优先位标记,优先级执行固定,但是限制使用次数。
运行状态的进程描述:
进程的控制信息中有个标志位用以描述状态
进程入口时运行状态、进程出口时运行状态,在就绪进程(主程就绪,候选就绪,在就绪周期中查找下一个优先级最高的进程,更新候选进程),所以就绪进程会有状态的不一致
底层 = 中断 + 寻找最高优先级
进程空间受保护,只有子进程可以共享父进程的空间
进程的控制信息
中断信息保存的位置:系统栈,用户栈(现场信息),pcb(cpu从中调取要恢复的进程信息)
进程之间的关系:
线程——轻量级进程。
线程是相对独立的一段代码段。线程依赖于进程,线程虽然各自有各自的堆栈存储现场信息(现场信息量不大,所以不同线程之间的通信容易实现,线程使用效率高),同时他们可以共享支配的进程空间。
线程状态:
守候机制:初始化时根据系统的能力创建若干个线程。
用户级的线程:对于操作系统而言是不可支配,透明的。
系统级的线程(轻量级进程):与进程类似,由操作系统提供系统调用,所以对于操作系统而言是已知,可支配的。并由于中断的支持,可以调整就绪任务,但系统开销变大。
举例一:
某个用户在共800页的文件中修改第一页的第一个语句后,接着打算在第600页进行另一个修改。
多线程处理步骤,假设字处理软件被编写成含有三个线程的程序:
由于线程可以可以共享公共内存,,所以三个线程可以通过切换而完成对同一个文件的操作。当第一页的语句被删除掉,交互线程就立即通知格式化线程对整本书进行排版处理。同时交互线程继续监控键盘和鼠标,并相应诸如滚动页面等简单命令。同时后台线程进行运算,希望能够在用户提出新的查询请求前完成格式修改,进程三每隔若干分钟自动在磁盘保存整个文件。
举例二:
万维网服务器:
高速缓存:web服务器将获得的大量访问的页面集合保存在内存中,避免到磁盘去调用这些页面。
问题:对页面的请求发给服务器,而所请求的页面发回给客户机,这是一个两个线程的处理过程:
举例三:
处理极大量数据的应用:
读入一快数据,对其处理,然后再写出数据。
进程模型基于:资源分组处理与执行。
进程中的内容有:
线程中的内容有:
进程用于资源的集中,而线程则是在cpu上被调度的执行的实体。
传统进程:
每个进程有自己的地址空间和单个控制线程,cpu在系统中运行时通过线程间的切换从而制造进程并行的假象。
现有进程:
所有线程都有完全一样的地址空间,共享进程的全局变量,可以访问进程地址空间中的每一个内存地址。一个线程可以读、写、清除另一个线程的堆栈,线程之间是合作关系,故没有保护。
定义的线程包叫做pthread,每个线程都含有一个标识符、一组寄存器(包括程序计数器)、一组存储在结构中的属性(堆栈大小、调度参数以及其他线程需要的项目)
单线程的多线程化需要注意:
实现线程包的两种方式:①用户空间;②内核。
混合实现=用户级线程+内核级线程
调度程序激活工作的目标是模拟内核线程的功能,但是为线程包提供通常在用户空间中才能实现的更好的性能和更大的灵活性。
机制思路:
由此我们可以看到,调度程序激活机制是上行调用的一个信赖基础。
并且注意,一般层次系统内在结构有一基本原理:“n层提供n+1层可调用的特定服务,但n层不能调用n+1层中的过程”,而上行调用显然不遵守这一原理。
弹出式线程:一个消息的到达导致系统创建一个处理该消息的线程。
弹出式线程的好处:
面临的问题 | 解决方式 |
---|---|
1. 各个线程所依附的全局变量不统一 | 为每个线程赋予私有的全局变量 |
2. 库调用并不像进程那样允许同步,库调用往往不可重入 | 在库内部一个固定缓冲区进行消息组合,然后陷入内核将其发送 |
3. 内存分配(比如指针指向不定) | 为每个过程提供一个包装器,该包装器设置一个二进制位从而标志某个库处于使用中。在调用未完成之前,任何试图使用该库的其他线程会被阻塞。 |
4. 信号不统一(由于用户级线程中的内核并不知道线程的存在,所以相应的信号无法发送到对应的线程) | 书上没有明确给出适用的解决方式,得具体问题具体分析 |
5. 堆栈的管理(也是因为内核不了解具体进程情况的话,就不能掌控相应堆栈的自动增长) | 可能需要重新定义系统调用的语义 |
通信方式:①高级通信;②低级通信
设置通信方式可以避免进程间冲突和阻塞。
定义:
在一些操作系统中,协作的进程可能会共享一些彼此都能读写的公用存储区,而此时可能会出现两个或多个进程读写某些共享数据,但最终结果却取决于进程运行的精确时序,不能将写入内容全部有效保存的情况。
互斥的概念:以某种手段确保当一个进程在使用一个共享变量或文件时,其他进程不能做同样的操作。
临界区的概念:对共享内存进行访问的程序片段称作临界区域或临界区。
为了有效避免竞争条件的出现,需要满足以下四个条件以达到公平的标准:
以下介绍几种互斥方案:
在每个进程刚刚进入临界区之后立即屏蔽所有中断(包括时钟中断),并在快离开前打开中断。
但这样并不好,将屏蔽权将给用户进程可能会导致整个系统因此而终止。所以屏蔽中断对于操作系统本身而言有用,但是对于用户进程则不是一种合适的通用互斥机制。
设置共享锁变量(初始值为0),当进程想要进入其临界区就先测试这把锁,若锁值为0,则将该进程设置为1并进入临界区;若锁值为1,则该进程等待直至其值表内0;
但是在——“若一个进程读出锁变量的值当前为0,在它将锁变量设置为1之前另一个进度被调度运行,更早一步将锁变量设置为1,此时就会有两个进程进入临界区”情况中,锁变量不再适用。
设置一个整型变量turn,turn标志当前哪个进程进入临界区,并检查或更新共享内存。
举例:
while(true){
while(turn != 0);//循环等待
critical_region();//临界区
turn = 1;
noncritical_region();
}
while(true){
while(turn != 1);//循环等待
critical_region();//临界区
turn = 0;
noncritical_region();
}
假设当前两个进程同时访问:进程0、进程1。
初始turn为0,所以进程0可以进入临界区,进程1发现turn为0,所以在一个等待循环中不停的测试turn,看其值何时变为1。
忙等待:连续测试一个变量直到某个值出现为止。但这种方式浪费CPU时间,所以忙等待一般用于测试时间非常短的情形。与锁变量类似,但用于忙等待的锁称为自旋锁。忙等待不适合用在一个进程比另一个慢了很多的情况下。
int turn; //现在轮到谁?
int interested[2]; //所有值初始化为0(false)
void enter_region(int process)//在进入临界区前调用
{
int other = 1 - process;
interested[process] = true;
turn = process;
while ( turn == process && interested[other] == true);
}
void leave_region(int process)//在进入临界区后调用
{
interested[process] = false;
}
大致流程:
while ( turn == process && interested[other] == true)
为0,所以进程0的enter_region也返回,直接进入临界区这样一来就满足了先到先得原则。
不过这一算法在进程是抢占式的并且有优先级的时候会发生死锁——例如有两个进程H,L(H优先级较高,所以调度规则规定只要H处于就绪态它就可以运行)。某一时刻,当L处于临界区而H想进入时,H变到就绪态,由于H优先级高,H会开始调度执行忙等待,但由于H就绪时L不会被调度,也就无法离开临界区,H会永远忙等待下去而进不了临界区。这一结果被称为优先级反转。
TSL指令是一种需要硬件支持的方案。
其工作如下所述:
TSL RX,LOCK
为了使用TSL指令,我们必须用一个共享变量lock来协调对共享内存的访问。当lock为0时,任何进程都可以使用TSL指令将其置为1并读写共享内存。当操作结束时,进程用一条普通的MOVE指令将lock重新置为0。
这条指令如何被用来防止两个进程同时进入临界区呢?解决方案示于下述代码(汇编语言形式)。
enter_region:
tsl register,lock //复制lock到寄存器,并将lock置为1
cmp register,#0 //lock等于0吗?
jne enter_region //如果不等于0,已上锁,再次循环
ret //返回调用程序,进入临界区
用TSL指令上锁和清除锁
leave_region:
move lock , #0 //置lock为0
ret //返回调用程序
上文提到过优先级反转,为了解决这种情况,于是引入通信原语,它们在无法进入临界区时将阻塞而不是忙等待。最简单的就是sleep和wakeup。
sleep是一个将引起调用进程阻塞的系统调用,即被挂起,直到另外一个进程将其唤醒。
wakeup调用有一个参数,即要被唤醒的进程。
两个进程共享一个公共的固定大小的缓冲区,其中一个是生产者:将信息放入缓冲区;另一个是消费者:从缓冲区中取出信息。当缓冲区已满,使生产者睡眠,当缓冲区已空,使消费者睡眠。
需要具备的标识符:
#define N 100 //缓冲区中的槽数目
int count = 0; //缓冲区中的数据项数目
void producer(void)
{
int item;
while(TRUE) //无限循环
{
item = produce_item(); //产生下一新数据项
if(count == N) //如果缓冲区满就休眠
sleep(); //休眠挂起
insert_item(item); //将新的数据项放入缓冲区
count = count + 1; //缓冲区数据项计数加1
if(count == 1) //缓冲区为空
wakeup(consumer); //唤醒消费者
}
}
void consumer(void)
{
int item;
while(TRUE) //无限循环
{
if(count == 0) //如果缓冲区空,则进入休眠状态
sleep();
item = remove_item();
count = count - 1; //缓冲区数据项计数减1
if(count == N - 1) //缓冲区满
wakeup(producer);
consume_item(item); //打印数据项
}
这里解释一下为什么要有唤醒等待位:
假设某一时刻,缓冲区为count=0。此时调度程序会暂停消费者并启动生产者。生产者回向缓冲区加入一个数据项,count=1。
①如果没有唤醒等待位
调度程序会推断认为由于count原先是0,所以此时消费者一定是睡眠状态,于是它会让生产者条用wakeup唤醒消费者。
但这里会出现时间差:消费者进程在wakeup信号发出之前会检测到count等于0,并在还没有运行sleep()时由于消费者进程时间片到期,消费者进程从runnable运行状态变成runnable可运行状态。
(注意:一个任务在自己的时间片内就是RUNNING运行状态,当时间片过期,线程就又变成RUNNABLE可运行状态,并且操作系统将另一个线程分配给处理器)
这个时候生产者调度运行,count变为1时,生产者试图唤醒消费者,此时wakeup对于消费者来说唤醒是无效的——因为消费者根本没有运行到sleep(),从而导致wakeup信号丢失,所以说在逻辑上并未睡眠。
当时间片被转到消费者时,这时候消费者进程被调度,执行完sleep()后,消费者进程才真正进入逻辑上的睡眠。尽管count已经非零了,但是再也不会有唤醒信号了,它将永远沉睡。归根到底是因为这里对count的访问不是原子性的。
(原子性:一组相关联的操作要么不间断地执行、要么都不执行)
②有唤醒等待位:
当一个wakeup信号发送给一个清醒的进程信号时,该位置置1,随后,当进程在逻辑上应该要睡眠时,因为该唤醒等待位为1,则将该位置清除,而该进程仍然保持清醒,唤醒等待位实际是wakeup的一个小仓库
针对于上述原有sleep-wakeup的非原子性存在的问题,E…Dijkstra提出了信号量方法:信号量就是使用一个整型变量来累计唤醒次数供以后使用。当信号量大于等于0时表示空闲资源余量,信号量小于等于0表示等待队列的长度(这也就是为什么下列up操作加一之后信号量仍然为0的原因)。
相对应的sleep变为了down操作,wakeup变为了up操作。
down操作:检查其保存的唤醒信号值是否大于0,大于0则减1,为0则睡眠;同时检查数值、修改变量值以及可能发生的睡眠操作均是单一、不可分割的原子性操作(用户不允许访问,由操作系统的系统调用掌控)——不允许其他进程访问该信号量。
up操作:对信号量值加1。注意,对一个在信号量上睡眠的进程,执行一次up操作后,该进程信号量仍旧是0,只是up操作上睡眠的进程少了一个。
临界区初始值为1。
用信号量解决生产者-消费者问题
定义信号量的注意事项:
①本身是描述资源的,且是针对独占资源的;
②信号量必须要有初值,用以标注空闲资源
使用三个信号量:
详细代码中值得关注的两句是顺序(一定要注意先判断资源是否空闲):
void producer(void){
...
while(条件){
down(&empty)
down(&mutex)
...
up(&full)}
}
void consumer(void){
...
while(条件){
down(&full)
down(&mutex)
...
up(&empty)}
}
mutex用于互斥,它保证任一时刻只有一个进程读写缓冲区和相关的变量。而信号量full和empty用于实现同步,以保证某种事件的顺序要么发生或不发生,在本例中,他们保证当缓冲区满的时候生产者停止运行,缓冲区空的时候停止运行,这跟互斥不同。
互斥量是信号量的一个简化,去除了计数能力,只控制互斥的过程。互斥量是一个可以处于两态之一的变量:解锁和加锁(0——解锁;其他所有值——加锁;初始值为1)
互斥量使用分为两个过程:
mutex_lock:
tsl register,mutex //将互斥信号量复制到寄存器,并且将互斥信号量置为1
cmp register,#0 //互斥信号量等于0吗?
jze ok//如果互斥信号量为0,它被解锁,所以返回
call thread_yield//互斥信号忙;调度另一个线程
jmp mutex_lock //稍后再试
ok:ret //返回调用程序,进入临界区
mutex_unlock:
move mutex , #0 //置mutex为0
ret //返回调用程序
观察上诉代码我们可以看到他和TSL指令中的enter_region很相似,但区别在于enter_region进入临界区失败之后会重复测试锁(忙等待)。而mutex_lock取锁失败后,会调用thread_yield将CPU放弃给另一个线程,从而没有忙等待。
注意:
共享一个公共地址空间的两个进程仍旧有各自的打开文件、定时器以及其他一些单个进程的特性,而在单个进程中的线程,则共享进程全部的特性。另外,共享一个公共地址空间的多个进程绝不会拥有用户级线程的效率,这一点是不容置疑的,这是因为内核还同其管理密切相关。
futex是Linux的一个特性,它实现了基本的锁(类似互斥锁)。其包含两个部分:
pthread的基本机制是使用一个可以被锁定和解锁的互斥量来保护临界区(互斥量可以有属性,但是这些属性只在某些特殊的场合下使用;并且这些互斥锁不是强制性的,而是由程序员来保证线程正确地使用它们)。
一些与互斥量相关的pthread调用
pthread_mutex_init;//创建一个互斥量
pthread_mutex_destroy;//撤销一个已经存在的互斥量
pthread_mutex_lock;//获得一个锁或阻塞
pthread_mutex_trylock;//获得一个锁或失败
pthread_mutex_unlock;//释放一个锁
pthread还提供了一种同步机制:条件变量。(互斥量在允许或阻塞对临界区的访问上十分有用,条件变量则允许线程由于一些未达到的条件而阻塞)
一些与条件变量相关的pthread调用
pthread_cond_init;//创建一个条件量
pthread_cond_destroy;//撤销一个条件变量
pthread_cond_wait;//阻塞以等待一个信号
pthread_cond_signal;//向另一个线程发信号来唤醒他
pthread_cond_broadcast;//向多个线程发信号来让它们全部唤醒
举个例子体会线程、互斥量、条件变量之间的关联:
在生产者-消费者模型中,如果生产者发现缓冲区中没有空槽可以使用了,它不得不阻塞起来直到有一个空槽可以使用。生产者使用互斥量可以进行原子性检查而不受到其他线程的干扰。但是当发现缓冲区已经满了以后,生产者需要一种方法来阻塞自己并在以后被唤醒(这一过程由条件变量完成)。
monitor example
integer i;
condition c;
procedure proceducer();
.
.
.
end;
procedure consumer();
.
.
.
end;
end monitor;
管程包含:
(1)多个彼此可以交互并共用资源的线程
(2)多个与资源使用有关的变量
(3) 一个互斥锁
(4) 一个用来避免竞态条件的不变量
管程的理解总述:
(1)在任一时刻管程中只能有一个活跃进程,这一特性使管程能有效地完成互斥,注意:对管程的实现互斥由编译器负责。编译器处理管程调用的方法之一为:当一个进程调用管程过程时,该过程中的前几条指令将检查在管程中是否有其他的活跃进程。如果有,调用进程将被挂起,直到另一个进程离开后管程将其唤醒。如果没有活跃进程在使用管程,则该调用才能进入。
(2)管程的共享变量在管程外部不可见,外部只能通过调用管程中的外部子程序访问共享变量。
(3)管程中有等待/唤醒机制,等待时释放管程的互斥权。 在管程入口处的等待队列称为入口等待队列,由于进程会执行唤醒操作,因此可能有多个等待使用管程的队列,这样的队列称为紧急队列,它的优先级高于等待队列。
(4)管程是一种高级的同步原语。进程可在任何需要的时候调用管程中的过程,但他们不能在管程之外声明的过程中直接访问管程内的数据结构。一个管程的程序在运行一个线程前会先取得互斥锁,直到完成线程或是线程等待某个条件被满足才会放弃互斥锁。若每个执行中的线程在放弃互斥锁之前都能保证不变量成立,则所有线程皆不会导致竞态条件成立。
(5)管程是一个编程语言概念,编译器必须要识别出管程并用某种方式对互斥做出安排。C、Pascal及多数其他语言都没有管程,所以指望这些编译器来实现互斥规则是不可靠的。不过在Java中,只要将关键字synchronized加入到方法声明中,Java保证一旦某个线程执行该方法,就不允许其他线程执行该方法,就不允许其他线程执行该类中的任何其他方法,在一定程度上保证了交错执行。
enter过程
一个进程进入管程前要提出申请,一般由管程提供一个外部过程:enter过程。如Monitor.enter()表示进程调用管程Monitor外部过程enter进入管程。
leave过程
当一个进程离开管程时,如果紧急队列不空,那么它就必须负责唤醒紧急队列中的一个进程,此时也由管程提供一个外部过程—leave过程,如Monitor.leave()表示进程调用管程Monitor外部过程leave离开管程。
条件型变量c
条件型变量c实际上是一个指针,它指向一个等待该条件的PCB队列。如notfull表示缓冲区不满,如果缓冲区已满,那么将要在缓冲区写入数据的进程就要等待notfull,即wait(notfull)。相应的,如果一个进程在缓冲区读数据,当它读完一个数据后,要执行signal(notempty),表示已经释放了一个缓冲区单元。
下面补充一些背景知识
条件等待队列:
某一时刻,进入管程的某个进程在对资源的操作过程中发现条件不成熟, 那么它就不能够继续对资源进行相应的操作。
以生产者、 消费者模型为例的话:好比生产者正想要完成把数据放到缓冲区里这个动作,但此时发现缓冲区满了,那显然把数据放到缓冲区这个动作就不能完成了,所以生产者(也就是上文提到的这个进程)就应该等,等条件成熟(比如生产者会在full这个条件变量上执行wait操作),该操作会导致调用进程自身阻塞进入条件等待队列,同时管程会把等在管程之外的另一个进程调入管程。
紧急等待队列:
正如上文提到的,某一个进程的执行环境不合适的时候,就会调用 wait 操作,等在某个条件变量上, 而当一个进程等在条件变量上的时候,它应该把管程的互斥权放开,也就是把门打开,让管程外想进入管程的进程进入。
在后面进来的伙伴进程运转过程中,伙伴进程发现条件成熟了,所以它就调用 signal 函数,去唤醒等在这个条件变量上的一个进程。如果唤醒的是刚才等待的这个进程, 那么在管程里头,同时就有两个进程存在了。按照HOARE 管程的语义,管程只允许一个活进程,所以后面一个进程唤醒了前面一个进程之后,它会等待前面的进程执行,而后面做好事的这个进程就等在管程中的紧急等待队列里。
入口等待队列
因为管程是互斥进入的, 如果一个进程已经调用了管程当中的某一个过程去做相应的操作, 那么后续的进程就不能再进入管程了。我们可以类比管程有个门,如果一个进程已经进到管程里头来并开始做相应的操作时,那么其他还想进管程的,就在门口排队,这样的队列我们称之为入口等待队列。
上诉的三个队列,JAVA中都有,Hansen只有入口等待队列和内部等待队列。
wait(c)
wait(c)表示为进入管程的进程分配某种类型的资源,如果此时这种资源可用,那么进程使用,否则进程被阻塞,进入紧急队列。
signal(c)
signal(c)表示进入管程的进程使用的某种资源要释放,此时进程会唤醒由于等待这种资源而进入紧急队列中的第一个进程。
这种进程间通信的方法使用两条原语send和receive,它们像信号量而不像管程,是系统调用而不是语言成分。
消费者申请空闲节点,它的并发处理能力逊于生产者消费者模型
是一种同步机制
在某一个节点需要互相等待对方的进程
eg:
f(x)=fA(x)+fB(x)+fC(x)+fD(x)
必须ABCD四个进程都结束了,才能确定参数x的值,不能中途更改访问x,否则就会出错。
应对实际情况中计算速度不一致的问题。
参考来源
加锁会导致:死锁现象的出现,锁资源消耗。
最快的锁是根本没有锁。但没有锁的情况,我们不允许对共享数据结构进行并发读写和访问。
试想假设进程A正在对一个数字数组进行排序,而进程B正在计算其均值。因为A在数组中将数值前后来回移动,所以B可能多次遇到某些数值,而某些数值则根本没有遇到过,得到的结果可能是任意值,而它几乎肯定是错的。
然而,在某些情况下,我们可能需要多个写操作可以并发执行。所以,Linux内核引入了读-拷贝-更新技术(英文是Read-copy update,简称RCU),它是另外一种同步技术,主要用来保护被多个CPU读取的数据结构。RCU允许多个读操作和多个写操作并发执行(窍门在于确保每个读操作要么读取旧的数据版本,要么读取新的数据版本,但绝不能是新旧数据的一些奇怪组合)。更重要的是,RCU是一种免锁算法,也就是说,它没有使用共享的锁或计数器保护数据结构(这儿还是主要指的读操作是无锁算法。而对于多个写操作来说,仍然需要使用lock保护避免多个CPU的并发访问。所以,其使用场合也是比较严格的,多个写操作中的锁开销不能大于读操作采用无锁算法省下的开销)。
举例说明,读操作从根部到叶子遍历整个树。在图的上半部分,加入一个新的节点X。为了实现这一操作,我们要让这个节点在树中可见之前使它“恰好正确”:我们对节点X中的所有值进行初始化,包括它的子节点指针。然后通过原子写操作,使X成为A的子节点。所有的读操作都不会读到前后不一致的版本。在图的下半部分,我们接着移除B和D。首先,将A的左子节点指针指向C。所有原本在A中的读操作将会后续读到节点C,而永远不会读B和D。也就是说,它们将只会读到新版数据。同样,所有当前在B和D中的读操作将继续依照原始的数据结构指针并且读取旧版数据。所有操作均正确进行,我们不需要锁住任何东西。而不需要锁住数据结构就能移去B和D的主要原因就是读-复制-更新(Read-Copy-Update,RCU),将更新过程中的移除和再分配过程分离开来。
但只要还不能确定没有对B和D更多的读操作,我们就不能真正释放它们。RCU谨慎地决定读操作持有一个数据结构引用的时间,在这段时间之后,就能安全地将内存回收。
调度程序:当有多个进程或线程同时竞争CPU时,操作系统进行处理,选择一个进入运行。
CPU是稀缺资源,好的调度程序可以提高性能和用户满意程度。
某些I/O活动可以看作计算,当一个进程等待外部设备完成工作而被阻塞时,才是I/O活动。
计算密集型:某些进程花费了绝大多数时间在计算上。
I/O密集型:某些进程在等待I/O上花费了绝大多数时间。
调度决策发生的情况主要为下面几种:
非抢占式调度算法:挑选一个进程,然后让该进程运行直至被阻塞(阻塞在I/O上或等待另一个进程),直到该进程自动释放CPU。
抢占式调度算法:挑选一个进程,并且让该进程运行某个固定时段的最大值。如果在该时段结束时,该进程仍在运行,它就被挂起,而调度程序挑选另一个进程运行(如果存在一个就绪进程的话)。
在不同的系统中,调度程序的优化是不同的,可以大致分为下面三种环境:
(1)批处理——多用于商业领域,处理薪水册、存货清单等周期性作业。批处理的用户端不会等待一个短请求的快捷回应。
(2)交互式
(3)实时
①保证公平性:相似的进程应该得到相似的服务
②保持系统的所有部分尽可能忙碌
③周转时间(是指一个批处理作业提交时刻开始直到该作业完成时刻为止的统计平均时间)尽可能小;注意能使吞吐量最大化的调度算法不一定就有最小的周转时间
④需要一定的系统强制执行策略
⑤保证均衡性
非抢占式调度算法。
原则就是进程按照他们请求CPU的顺序使用CPU。用一个单一队列或单链表就可以记录所有的就绪进程,每次选取队列头部进程即可。
优点:易于理解,便于在程序中运用
缺点:不适用于大量I/O密集型任务,会对CPU造成时间浪费。
非抢占调度算法。
原则是最短作业优先级最高(只有在所有作业都可以同时运行的情形下,最短作业优先算法才是最优化的)。
抢占式算法。
原则是调度程序总是选择剩余运行时间最短的哪个进程运行,如果新的进程比当前运行进程需要更少的时间,当前进程就被挂起,而运行新的进程。
时间片:每个进程被分配一个时间段,这个时间段被称为时间片,即允许该进程在该时间段中运行。
如果在时间片结束时该进程还在运行,则将剥夺CPU并分配给另一个进程。如果该进程在时间片结束前阻塞或结束,则CPU立即进行切换。
注意:时间片设的太短会导致过多的进程切换,降低了CPU效率,而设得太长有可能引起对短的交互请求的响应时间变长。所以时间片设为20~50ms通常是一个比较合理的折中。
为了防止高优先级进程无休止的运行下去,调度程序可能在每个时钟滴答(即每个时钟中断)降低当前进程得优先级。如果这一行为导致该进程的优先级低于次高优先级的进程,则进行进程切换。另一个方法是给每个进程赋予一个允许运行的最大时间片,当用完这个时间片时,次高优先级的进程便获得运行机会。
原则:属于最高优先级类的进程运行一个时间片,属于次高优先级的进程运行2个时间片,再次一级运行4个时间片。以此类推,当一个进程用完分配的时间片后,它就被分到下一类.
根据进程过去的行为进行推测,并执行估计运行时间最短的那一个。
评估规则为:假设某个终端上每条命令的估计运行时间为T0,现在假设测量到其下一次运行时间为T1,我们对两个值进行加权评估 aT0+(1-a)T1;通过设置a的值,可以决定时尽快忘掉老的运行时间还是在一段长时间内史中始终记住它们(通过当前测量值进行加权平均而得到下一个估计值的技术被称为老化)。
这一算法是基于公平原则的调度算法。即每个进程看作等价,平分CPU的时间,保证处理机分配的公平性,若有n个进程同时运行,公平的情况下每一个进程应该获得处理机时间的1/n。
算法实现:
为进程提供各种系统资源(如CPU时间)的彩票,一旦需要作出一项调度决策时,就随机抽出一张彩票,拥有该彩票的进程获得该资源。在应用到CPU调度时,系统可以掌握每秒钟50次的一种彩票,作为奖励每个获奖者可以获得20ms的CPU时间。(拥有彩票f份额的进程大约得到系统资源的f份额)
这一调度算法主要针对用户,而不是进程。目标是使用户能获得相同的CPU时间。大致如下:
时间片轮转算法让每个进程轮流运行一个时间片,对进程很公平,但如果每个用户拥有的进程数不同,则可能对用户不公平。
调度是以进程为基本单位的,所以必须考虑每一个用户所拥有的进程数目。
例如:用户1拥有4个进程A、B、C、D,用户2只有一个进程X,为了保证两个用户能获得相同的CPU时间,需要强制执行如下的调度顺序。
A X B X C X D X A X ……
实时调度算法的分类:
①按实时任务性质(即对时间约束的强弱程度)
②按调度方式
我们可以尽量将调度算法以某种形式参数化,而参数由用户进程填写。
计算机通常只有一个CPU,在任意时刻只能执行一条机器指令,每个线程只有获得CPU的使用权才能执行指令。所谓多线程的并发运行,其实是指从宏观上看,各个线程轮流获得CPU的使用权,分别执行各自的任务。在运行池中,会有多个处于就绪状态的线程在等待CPU,JAVA虚拟机的一项任务就是负责线程的调度,线程调度是指按照特定机制为多个线程分配CPU的使用权。
1.问题描述:
五个哲学家共用一张圆桌,在圆桌上有五个碗和五只筷子。平时,哲学家进行思考,饥饿时便试图取用其左右最靠近他的筷子,只有在他拿到左右两只筷子时才能进餐。进餐完毕,放下筷子继续思考。
2.解决思路:
因为是五位哲学家,并且每位哲学家各自做自己的事情(思考和吃饭),因此可以创建五个线程表示五位哲学家,五个线程相互独立(异步),分别编号为0到4。同时,有五根筷子,每根筷子只对其相邻的两位哲学家是共享的,因此这五根筷子可以看做是五种不同的临界资源(不能理解为一种资源有5个,因为每根筷子只能被固定编号与其相邻的哲学家使用),并对五根筷子分别编号为0~4。其中第i号哲学家左边的筷子编号为i,则其右边的筷子编号就应该为(i + 1) % 5。筷子是临界资源,因此当一个线程在使用某根筷子的时候,应该给这根筷子加锁,使其不能被其他进程使用。一个哲学家的大致动作流程即为如下:
void philosopher (void* arg) {
while (1) {
think();//每位哲学家先思考
hungry();//当某位哲学家饥饿的时候
pthread_mutex_lock(&chopsticks[left]);//拿起他左边的筷子
pthread_mutex_lock(&chopsticks[right]);//拿起他右边的筷子
eat();//然后进餐
pthread_mutex_unlock(&chopsticks[left]);//进餐完毕,放下他左右的筷子并进行思考
pthread_mutex_unlock(&chopsticks[right]);
}
}
在这其中筷子就类比为我们计算机中的临界资源,类似之前进程对临界区访问权限的处理——当一位哲学家拿起他左右的筷子的时候,就会对他左右的筷子进行加锁,使其他的哲学家不能使用;当该哲学家进餐完毕后,放下了筷子,意味着临界区解锁,此时才允许其他的哲学家可以使用。
但这样会发生死锁,因为假设在某一时间,五个哲学家都同时饿了,于是他们都拿起来左边的筷子,当他们想去拿右边的筷子时,会发现已经被上锁,所以等待、申请、等待、申请循环,没有人放手也没有人能够拿到两只筷子。
3.利用信号量的解决方案
① 设置信号量机制r
同时只允许四位哲学家拿起同一边的筷子,设置一个信号量r(初始值为4),每当一位哲学家希望拿起左边筷子时,先down操作对r减1,当前四位哲学家都成功拿起左筷子时r值变为0,这时若第五位哲学家也去拿左筷子,r就会变为-1,然后函数中的判断条件r<0为真就会使得第五位哲学家的线程被阻塞,从而第五位哲学家无法成功拿起左筷子,避免了死锁情况的发生。当然在最后,每一位哲学家吃饱饭放下左筷子时,执行up操作对r加1。代码展示:
void philosopher (void* arg) {
while (1) {
think();
hungry();
P(&r);//大黑书上讲到P可以理解为down操作,P是Dij提出者在其论文中的表示
pthread_mutex_lock(&chopsticks[left]);
pthread_mutex_lock(&chopsticks[right]);
eat();
pthread_mutex_unlock(&chopsticks[left]);
V(&r);//V可以理解为up操作
pthread_mutex_unlock(&chopsticks[right]);
}
}
②奇偶数判别法
规定奇数号哲学家先拿起他左边的筷子,然后再去拿他右边的筷子,而偶数号的哲学家则相反,这样的话总能保证一个哲学家能获得两根筷子完成进餐,从而释放其所占用的资源,代码如下:
void philosopher (void* arg) {
int i = *(int *)arg;
int left = i;
int right = (i + 1) % N;
while (1) {
think();
hungry();
if (i % 2 == 0) {
//偶数哲学家,先右后左
pthread_mutex_lock(&chopsticks[right]);
pthread_mutex_lock(&chopsticks[left]);
eat();
pthread_mutex_unlock(&chopsticks[left]);
pthread_mutex_unlock(&chopsticks[right]);
} else {
//奇数哲学家,先左后又
pthread_mutex_lock(&chopsticks[left]);
pthread_mutex_lock(&chopsticks[right]);
eat();
pthread_mutex_unlock(&chopsticks[right]);
pthread_mutex_unlock(&chopsticks[left]);
}
}
}
③利用AND信号量实现
AND信号量是一种思想,即在对进程请求的多个资源进行分配时,首先检查这些资源是否都是空闲的,如果的确都是空闲的,则将资源全部分配给该进程,否则一个资源也不分配。
在这道题中先统一一下相关变量的含义:
哲学家请求筷子时,首先检查他相邻的两个哲学家是否在就餐,只有相邻两个哲学家都没有就餐的时候才为他分配左右两根筷子(也就是说我们应该有一个原子性的操作procedure test去检查当前这个哲学家的左右两个相邻哲学家是否是就餐状态),信号量数组b[i]表示i哲学家对应的左右两根筷子都分配给i哲学家。实现的伪代码如下:
int a[5]={
0},i;
Semaphore b[5]={
0},r;//b[i]指哲学家信号量,0是挂起,1是允许就餐
procedure test(int i){
//判断能否就餐,测试必须是原子性操作
if(a[i]==1 && a[(i-1)%5]!=2 && a[(i+1)%5]!=2{
//这个哲学家相邻都不处于就餐状态
a[i]=2;//那么当前的哲学家可以吃饭
V(b[i]);
}
}
procedure philosopher(int i){
think();
P(r);//先用信号量r控制当前临界区状态,r从1变为0,表示原先没有请求时空间上锁,但现在有请求了就解锁
a[i]=1;//当前科学家饿了
test[i];//进入判断函数,如果失败的话,V(r)里有挂起操作会使b[i]=0为挂起状态
V(r);//判断允许进餐,那么r由0变为1上锁不允许其他进程访问临界区
P(b[i]);//i哲学家对应的左右两根筷子都分配给i哲学家,更新哲学界状态为1-就餐状态
put_up_fork(i);//拿起左边筷子
put_up_fork((i+1) mod 5);//拿起右边筷子
eat();//就餐
put_down_fork(i);//放下筷子
put_down_fork((i+1) mod 5);
P(r);//i哲学家吃完了,要解放对临界区的上锁状态,r由1变为0
a[i]=0;//i哲学家恢复到思考状态
//下面两步涉及唤醒操作,当前哲学家吃饱喝足它在离开前,要去看一看周围两个是否有就餐请求(为什么不看其他的呢,因为只有左右两位跟他有资源请求冲突),有的话就进入对应进程V(r)给r加1;没有的话自己就离开
test((i-1)%5);//i的吃饭操作结束,检查ta左边的哲学家是否有吃饭请求
test((i+1)%5);//i的吃饭操作结束,结束ta右边的哲学家是否有吃饭请求
V(r);//设计相关信号量的更新
}
④管程实现
用管程实现比信号量实现简单得多,但是管程效率太低
对于数据的访问:读存;写擦
内存资源本身是共享资源,但是如果正在完成写操作就会变成独占资源。
①读/读:同时
②读/写:互斥
③写/写:互斥
读者优先
写者优先
读写公平调用:读者到达,写者正等待,读者在写者之后被挂起,而不是立即允许进入;写者到达而前有读者正等待,写者只要等待这个读者完成,而不必等待后面到来的读者。(不过这个方案并发度和效率比较低)
作业执行的标志:分配内存空间。
进程需要保存其创建者信息,因为创建这决定了进程是否被执行。