“I/O” 就是 “输入/输出”(Input/Output)
I/O
设备就是可以将数据输入到计算机,或者可以接收计算机输出数据的外部设备,属于计算机中的硬件部件。
UNIX
系统将外部设备抽象为一种特殊的文件,用户可以使用与文件操作相同的方式对外部设备进行操作。
I/O
设备的机械部件主要用来执行具体 l/O
操作。
I/O
设备的电子部件通常是一块插入主板扩充槽的印刷电路板。
CPU
无法直接控制 I/O
设备的机械部件,因此 I/O
设备还要有一个电子部件作为 CPU
和 I/O
设备机械部件之间的 “中介”,用于实现 CPU
对设备的控制。
这个电子部件就是 I/O 控制器,又称设备控制器。
CPU
可控制 I/O
控制器,又由 I/O
控制器来控制设备的机械部件。
① 接受和识别 CPU
发出的命令
如 CPU
发来的 read/write 命令,I/O
控制器中会有相应的控制寄存器存放命令和参数
② 向 CPU
报告设备的状态
I/O
控制器中会有相应的状态寄存器。用于记录 I/O
设备的当前状态。
③ 数据交换
I/O
控制器中会设置相应的数据寄存器。
CPU
发来的数据,之后再由控制器传送设备。CPU
从数据寄存器中取走数据。④ 地址识别
类似于内存的地址,为了区分设备控制器中的各个寄存器,也需要给各个寄存器设置一个特定的“地址”。
I/O
控制器通过 CPU
提供的 “地址” 来判断 CPU
要读/写的是哪个寄存器
小细节:
① 一个 I/O 可能会对应多个设备;
② 数据寄存器、控制寄存器、状态寄存器可能有多个(如:每个控制/状态寄存器对应一个具体的设备),且这些寄存器都要有相应的地址,才能方便 CPU
操作。
I/O
专用地址,即寄存器独立编址。即:用什么样的方式来控制 I/O
设备的数据读/写
需要注意的问题:
CPU
干预的频率;Key word:轮询
① 完成一次读/写操作的流程(以读操作为例)
② CPU
干预的频率
很频繁,I/O
操作开始之前、完成之后需要 CPU
介入,并且在等待 l/O
完成的过程中 CPU
需要不断地轮询检查
③ 数据传送的单位
④ 数据的流向
读操作(数据输入):I/O 设备 -> CPU(指的是 CPU 的寄存器) -> 内存
写操作(数据输出):内存 -> CPU -> I/O 设备
每个字的读/写都需要 CPU 的帮助
⑤ 主要缺点和主要优点
优点:实现简单。在读/写指令之后,加上实现循环检查的一系列指令即可
缺点:CPU
和 I/O
设备只能串行工作,CPU
需要一直轮询检查,长期处于“忙等”状态,CPU
利用率低。
Key word:中断
引入中断机制。由于 I/O
设备速度很慢,因此在 CPU
发出读/写命令后,可将等待 l/O
的进程阻塞,先切换到别的进程执行。当 I/O
完成后,控制器会向 CPU
发出一个中断信号,CPU
检测到中断信号后,会保存当前进程的运行环境信息,转去执行中断处理程序处理该中断。处理中断的过程中,CPU
从 I/O
控制器读一个字的数据传送到 CPU
寄存器,再写入主存。接着,CPU
恢复等待 I/O
的进程(或其他进程)的运行环境,然后继续执行。
注意:
① CPU
会在每个指令周期的末尾检查中断;
② 中断处理过程中需要保存、恢复进程的运行环境,这个过程是需要一定时间开销的。可见,如果中断发生的频率太高,也会降低系统性能。
② CPU
干预的频率
每次 I/O
操作开始之前、完成之后需要 CPU
介入。
等待 I/O
完成的过程中 CPU
可以切换到别的进程执行。
③ 数据传送的单位
每次读/写一个字
④ 数据的流向
读操作(数据输入):I/O 设备 -> CPU(指的是 CPU 的寄存器) -> 内存
写操作(数据输出):内存 -> CPU -> I/O 设备
⑤ 主要缺点和主要优点
优点:与“程序直接控制方式”相比,在“中断驱动方式”中,I/O
控制器会通过中断信号主动报告 I/O
已完成,CPU
不再需要不停地轮询。
CPU
和 I/O
设备可并行工作,CPU
利用率得到明显提升。
缺点:每个字在 I/O
设备与内存之间的传输,都需要经过 CPU
。而频繁的中断处理会消耗较多的 CPU
时间。
与 “中断驱动方式” 相比,DMA
方式(Direct Memory Access,直接存储器存取。主要用于块设备的 I/O
控制)有这样几个改进:
① 数据的传送单位是“块”。不再是一个字、一个字的传送;
② 数据的流向是从设备直接放入内存,或者从内存直接到设备。不再需要 CPU
作为“快递小哥”。
③ 仅在传送一个或多个数据块的开始和结束时,才需要 CPU
干预。
DR
(Data Register,数据寄存器)∶暂存从设备到内存,或从内存到设备的数据。
MAR
(Memory Address Register,内存地址寄存器)∶
MAR
表示数据应放到内存中的什么位置;MAR
表示要输出的数据放在内存中的什么位置。DC
(Data Counter,数据计数器):表示剩余要读/写的字节数。
CR
(Command Register,命令/状态寄存器)∶用于存放 CPU
发来的 I/O
命令,或设备的状态信息。
其实 DMA
控制器在读入数据的过程中,也是一个字一个字读入的,每次读入的一个字放在 DR
中,再从 DR
写入到内存当中
② CPU
干预的频率
仅在传送一个或多个数据块的开始和结束时,才需要CPU千预。
③ 数据传送的单位
每次读/写一个或多个块(注意:每次读写的只能是连续的多个块,且这些块读入内存后在内存中也必须是连续的)
CPU
发送多条 I/O
指令④ 数据的流向(不再需要经过CPU)
读操作(数据输入):l/O
设备 -> 内存
写操作(数据输出):内存 -> I/O
设备
⑤ 主要缺点和主要优点
优点:数据传输以 “块” 为单位,CPU
介入频率进一步降低。数据的传输不再需要先经过 CPU
再写入内存,数据传输效率进一步增加。CPU
和 I/O
设备的并行性得到提升。
缺点:CPU
每发出一条 I/O
指令,只能读/写一个或多个连续的数据块。
如果要读/写多个离散存储的数据块,或者要将数据分别写到不同的内存区域时,CPU
要分别发出多条 I/O
指令,进行多次中断处理才能完成。
通道:一种硬件,可以理解为是 “弱鸡版的 CPU”。通道可以识别并执行一系列通道指令
与 CPU
相比,通道可以执行的指令很单一,并且通道程序是放在主机内存中的,也就是说通道与 CPU
共享内存
通道 = 弱鸡版 CPU
通道程序 = 任务清单
② CPU
干预的频率
极低,通道会根据 CPU
的指示执行相应的通道程序,只有完成一组数据块的读/写后才需要发出中断信号,请求CPU
干预。
③ 数据传送的单位
每次读/写一组数据块
④ 数据的流向(在通道的控制下进行)
读操作(数据输入):l/O
设备 -> 内存
写操作(数据输出):内存 -> I/O
设备
⑤ 主要缺点和主要优点
缺点:实现复杂,需要专门的通道硬件支持
优点:CPU
、通道、I/O
设备可并行工作,资源利用率很高。
用户层软件实现了与用户交互的接口,用户可直接使用该层提供的、与 I/O
操作相关的库函数对设备进行操作
设备独立性软件,又称设备无关性软件。与设备的硬件特性无关的功能几乎都在这一层实现。
主要实现的功能:
① 向上层提供统一的调用接口(如 read/write
系统调用)
② 设备的保护
原理类似与文件保护。设备被看做是一种特殊的文件,不同用户对各个文件的访问权限是不一样的,同理,对设备的访问权限也不一样。
③ 差错处理
设备独立性软件需要对一些设备的错误进行处理
④ 设备的分配与回收
⑤ 数据缓冲区管理
可以通过缓冲技术屏蔽设备之间数据交换单位大小和传输速度的差异
⑥ 建立逻辑设备名到物理设备名的映射关系;根据设备类型选择调用相应的驱动程序
用户或用户层软件发出 I/O
操作相关系统调用的系统调用时,需要指明此次要操作的 I/O
设备的逻辑设备名
设备独立性软件需要通过 “逻辑设备表(LUT,Logical UnitTable)”来确定逻辑设备对应的物理设备,并找到该设备对应的设备驱动程序
操作系统系统可以采用两种方式管理逻辑设备表(LUT) :
第一种方式,整个系统只设置一张 LUT,这就意味着所有用户不能使用相同的逻辑设备名,因此这种方式只适用于单用户操作系统。
第二种方式,为每个用户设置一张 LUT,各个用户使用的逻辑设备名可以重复,适用于多用户操作系统。
LUT
就存放在用户管理进程的 PCB
中。类似于单级目录和两级目录
各式各样的设备,外形不同,其内部的电子部件(I/O
控制器)也有可能不同
就是 I/O
控制器可能不相同
不同设备的内部硬件特性也不同,这些特性只有厂家才知道,因此厂家须提供与设备相对应的驱动程序,CPU
执行驱动程序的指令序列,来完成设置设备寄存器,检查设备状态等工作
usb
插入到电脑的时候,右下角会有正在安装驱动程序的提示注:驱动程序一般会以一个独立进程的方式存在
当 I/O
任务完成时,l/O
控制器会发送一个中断信号,系统会根据中断信号类型找到相应的中断处理程序并执行。中断处理程序的处理流程如下:
理解并记住 I/O
软件各个层次之间的顺序,要能够推理判断某个处理应该是在哪个层次完成的
最常考的是设备独立性软件、设备驱动程序这两层。
只需理解一个特点即可:直接涉及到硬件具体细节、且与中断无关的操作肯定是在设备驱动程序层完成的;没有涉及硬件的、对各种设备都需要进行的管理工作都是在设备独立性软件层完成的
注:假脱机技术(SPOOLing
技术)需要请求“磁盘设备”的设备独立性软件的服务,因此一般来说假脱机技术是在用户层软件实现的。但是 408 大纲又将假脱机技术归为 “I/O 核心子系统” 的功能,因此考试时还是以大纲为准。
I/O 调度:用某种算法确定一个好的顺序来处理各个 l/O 请求。
如:磁盘调度(先来先服务算法、最短寻道优先算法、SCAN 算法、C-SCAN 算法、LOOK 算法 C-LOOK 算法)。当多个磁盘 I/O
请求到来时,用某种调度算法确定满足 l/O
请求的顺序。
同理,打印机等设备也可以用先来先服务算法、优先级算法、短作业优先等算法来确定 l/O
调度顺序。
操作系统需要实现文件保护功能,不同的用户对各个文件有不同的访问权限(如:只读、读和写等)。
在 UNIX
系统中,设备被看做是一种特殊的文件,每个设备也会有对应的 FCB
。
FCB
中记录的信息来判断该用户是否有相应的访问权限,以此实现“设备保护”的功能。(参考 “4.8、文件保护 ”小节)手工操作阶段:主机直接从 l/O
设备获得数据,由于设备速度慢,主机速度很快。人机速度矛盾明显,主机要浪费很多时间来等待设备
批处理阶段引入了脱机输入/输出技术(用磁带完成):
Tips:为什么称为 “脱机”―― 脱离主机的控制进行的输入/输出操作。
引入脱机技术后,缓解了 CPU
与慢速 I/O
设备的速度矛盾。
CPU
在忙碌,也可以提前将数据输入到磁带;“假脱机技术”,又称 “SPOOLing 技术” 是用软件的方式模拟脱机技术。SPOOLing
系统的组成如下:
要实现 SPOOLing
技术,必须要有多道程序技术的支持。系统会建立“输入进程”和“输出进程”。
独占式设备――只允许各个进程串行使用的设备。一段时间内只能满足一个进程的请求。
共享设备――允许多个进程“同时”使用的设备(宏观上同时使用,微观上可能是交替使用)。可以同时满足多个进程的使用请求。
独占式设备的例子:若进程 1 正在使用打印机,则进程 2 请求使用打印机时必然阻塞等待
当多个用户进程提出输出打印的请求时,系统会答应它们的请求,但是并不是真正把打印机分配给他们,而是由假脱机管理进程为每个进程做两件事:
(1)在磁盘输出井中为进程申请一个空闲缓冲区(也就是说,这个缓冲区是在磁盘上的),并将要打印的数据送入其中;
(2)为用户进程申请一张空白的打印请求表,并将用户的打印请求填入表中(其实就是用来说明用户的打印数据存放位置等信息的),再将该表挂到假脱机文件队列上(打印任务队列)。
当打印机空闲时,输出进程会从文件队列的队头取出一张打印请求表,并根据表中的要求将要打印的数据从输出井传送到输出缓冲区,再输出到打印机进行打印。用这种方式可依次处理完全部的打印任务
虽然系统中只有一个台打印机,但每个进程提出打印请求时,系统都会为在输出井中为其分配一个存储区(相当于分配了一个逻辑设备),使每个用户进程都觉得自己在独占一台打印机,从而实现对打印机的共享。
SPOOLing
技术可以把一台物理设备虚拟成逻辑上的多台设备,可将独占式设备改造成共享设备。
设备的固有属性可分为三种:独占设备、共享设备、虚拟设备。
设备的固有属性
独占设备 ―― 一个时段只能分配给一个进程(如打印机)
共享设备 ―― 可同时分配给多个进程使用(如磁盘),各进程往往是宏观上同时共享使用设备,而微观上交替使用。
虚拟设备 ―― 采用 SPOOLing
技术将独占设备改造成虚拟的共享设备,可同时分配给多个进程使用
SPOOLing
技术实现的共享打印机设备的分配算法
先来先服务
优先级高者优先
短任务优先
设备分配中的安全性
从进程运行的安全性上考虑,设备分配有两种方式:
安全分配方式:为进程分配一个设备后就将进程阻塞,本次 I/O
完成后才将进程唤醒。
一个时段内每个进程只能使用一个设备
优点:破坏了 “请求和保持” 条件,不会死锁
缺点:对于一个进程来说,CPU
和 I/O
设备只能串行工作
不安全分配方式:进程发出 I/O
请求后,系统为其分配 I/O
设备,进程可继续执行,之后还可以发出新的 l/O
请求。只有某个 l/O
请求得不到满足时才将进程阻塞。
一个进程可以同时使用多个设备
优点:进程的计算任务和 I/O
任务可以并行处理,使进程迅速推进
缺点:有可能发生死锁(死锁避免、死锁的检测和解除)
静态分配:进程运行前为其分配全部所需资源,运行结束后归还资源
动态分配:进程运行过程中动态申请设备资源
“设备、控制器、通道”之间的关系:
一个通道可控制多个设备控制器,每个设备控制器可控制多个设备。
设备控制表(DCT):系统为每个设备配置一张 DCT
,用于记录设备情况
注:“进程管理” 章节中曾经提到过 “系统会根据阻塞原因不同,将进程 PCB
挂到不同的阻塞队列中”
I/O
设备的分配,但是这个 I/O
设备没法给该进程分配资源,会将该进程就会挂到这个 I/O
设备的设备控制表所指向的设备队列的队尾控制器控制表(COCT):每个设备控制器都会对应一张 COCT
。操作系统根据 COCT
的信息对控制器进行操作和管理。
通道控制表(CHCT):每个通道都会对应一张 CHCT
。操作系统根据 CHCT
的信息对通道进行操作和管理。
系统设备表(SDT):记录了系统中全部设备的情况,每个设备对应一个表目。
① 根据进程请求的物理设备名查找 SDT
(注:物理设备名是进程请求分配设备时提供的参数)
② 根据 SDT
找到 DCT
,若设备忙碌则将进程 PCB
挂到设备等待队列中,不忙碌则将设备分配给进程。
③ 根据 DCT
找到 COCT
,若控制器忙碌则将进程 PCB
挂到控制器等待队列中,不忙碌则将控制器分配给进程。
④ 根据 COCT
找到 CHCT
,若通道忙碌则将进程 PCB
挂到通道等待队列中,不忙碌则将通道分配给进程。
缺点:
① 用户编程时必须使用 “物理设备名”,底层细节对用户不透明,不方便编程
② 若换了一个物理设备,则程序无法运行
③ 若进程请求的物理设备正在忙碌,则即使系统中还有同类型的设备,进程也必须阻塞等待
改进方法:建立逻辑设备名与物理设备名的映射机制,用户编程时只需提供逻辑设备名
① 根据进程请求的逻辑设备名查找 SDT
(注:用户编程时提供的逻辑设备名其实就是 “设备类型” )
② 查找 SDT
,找到用户进程指定类型的、并且空闲的设备,将其分配给该进程。操作系统在逻辑设备表(LUT)中新增一个表项。
② 根据 SDT
找到 DCT
,若设备忙碌则将进程 PCB
挂到设备等待队列中,不忙碌则将设备分配给进程。
③ 根据 DCT
找到 COCT
,若控制器忙碌则将进程 PCB
挂到控制器等待队列中,不忙碌则将控制器分配给进程。
④ 根据 COCT
找到 CHCT
,若通道忙碌则将进程 PCB
挂到通道等待队列中,不忙碌则将通道分配给进程。
逻辑设备表(LUT)建立了逻辑设备名与物理设备名之间的映射关系。
某用户进程第一次使用设备时使用逻辑设备名向操作系统发出请求,操作系统根据用户进程指定的设备类型(逻辑设备名)查找系统设备表,找到一个空闲设备分配给进程,并在 LUT
中增加相应表项。
如果之后用户进程再次通过相同的逻辑设备名请求使用设备,则操作系统通过 LUT 表即可知道用户进程实际要使用的是哪个物理设备了,并且也能知道该设备的驱动程序入口地址。
逻辑设备表的设置问题:
整个系统只有一张 LUT
:各用户所用的逻辑设备名不允许重复,适用于单用户操作系统
每个用户一张 LUT
:不同用户的逻辑设备名可重复,适用于多用户操作系统
缓冲区是一个存储区域,可以由专门的硬件寄存器组成,也可利用内存作为缓冲区。
使用硬件作为缓冲区的成本较高,容量也较小,一般仅用在对速度要求非常高的场合
一般情况下,更多的是利用内存作为缓冲区,“设备独立性软件”的缓冲区管理就是要组织管理好这些缓冲区
如下所示:只有缓冲区中的数据充满了或者被取走为空后, CPU
才会介入来处理中断
假设某用户进程请求某种块设备读入若干块的数据。若采用单缓冲的策略,操作系统会在主存中为其分配一个缓冲区(若题目中没有特别说明,一个缓冲区的大小就是一个块)。
注意:当缓冲区数据非空时,不能往缓冲区冲入数据,只能从缓冲区把数据传出;当缓冲区为空时,可以往缓冲区冲入数据,但必须把缓冲区充满以后,才能从缓冲区把数据传出。
常考题型:计算每处理一块数据平均需要多久?
技巧:假定一个初始状态,分析下次到达相同状态需要多少时间,这就是处理一块数据平均所需时间。
在“单缓冲”题型中,可以假设初始状态为工作区满,缓冲区空。
结论:采用单缓冲策略,处理一块数据平均耗时 Max(C, T) + M
假设某用户进程请求某种块设备读入若干块的数据。若采用双缓冲的策略,操作系统会在主存中为其分配两个缓冲区(若题目中没有特别说明,一个缓冲区的大小就是一个块)
双缓冲题目中,假设初始状态为:工作区空,其中一个缓冲区满,另一个缓冲区空
结论:采用双缓冲策略,处理一块数据平均耗时 Max(C + M, T)
两台机器之间通信时,可以配置缓冲区用于数据的发送和接受。
显然,若两个相互通信的机器只设置单缓冲区,在任一时刻只能实现数据的单向传输。
若两个相互通信的机器设置双缓冲区,则同一时刻可以实现双向的数据传输。
注:管道通信中的“管道”其实就是缓冲区。要实现数据的双向传输,必须设置两个管道
将多个大小相等的缓冲区链接成一个循环队列。
注:以下图示中,橙色表示已充满数据的缓冲区,绿色表示空缓冲区。
缓冲池由系统中共用的缓冲区组成。这些缓冲区按使用状况可以分为:空缓冲队列、装满输入数据的缓冲队列(输入队列)、装满输出数据的缓冲队列(输出队列)。
另外,根据一个缓冲区在实际运算中扮演的功能不同,又设置了四种工作缓冲区: