1. 系统的配置与性能评价(P221)
计算机系统评价的目标有三个:选择(要建立系统:从方案中选择一个性价比最合适的),设计(系统建设,对未来的系统进行性能预测,在性能成本方法进行最佳设计),改进(对已有系统的性能瓶颈和性能缺陷进行改进)。
影响系统性能的主要元素有两个,系统配置(构成系统的软硬件成分、数量、能力和系统结构)和系统负载(工作负载和方式,例如交互方式、批处理方式)。性能评价的任务是调整系统配置、工作负载和性能指标之间的关系。
1.1. 计算机系统层次结构【注:系统配置】
计算机系统是软、硬件结合的系统,从功能角度可以分为七级。
1.1.1. 计算机硬件组成
最初冯.诺依曼设计的计算机结构以运算为中心,发展到现在,已转向以存储器为中心。入下图:
1.1.2. 计算机软件的分类
软件,用户和硬件的接口界面。按照功能,分为应用软件和系统软件两类。
系统软件
系统软件用于计算机系统的管理、调度、监视和服务。分为五类:操作系统、语言处理程序(由用户识别的源程序,翻译为计算机识别的程序语言)、服务性程序(提供链接、调试、诊断等功能)、数据库管理系统、计算机网络软件。
应用软件
计算机结构的分类
存储程序的概念
1946年,冯.诺依曼提出,简要概括为:(1)计算机由运算器、存储器、控制器、输入设备和输出设备五部分组成;(2)计算机内部采用二进制表示;(3)将编好的程序和数据事先存入存储器中,然后在启动计算机。
Flynn分类
单指令单数据流( SingleInstruction stream and single Data Stream,SISD);单指令多数据流(SIMD),例如矩阵处理机;多指令单数据流(MISD),少见;多指令多数据流(MIMD)。
其他分类法
冯氏分类法,Handler分类法,Kuck分类法。
存储器系统
存储器,存储程序和数据的部件。
分为高速缓存存储器(Cache)、主存、辅存。
存取方式:相联存取(cache;随机存储一种方式),随机存取(random access,主存;每个地址一个存取装置,任意时间对任意一个地址访问),直接存取(辅存:磁盘;共享一个存取装置,每个数据块拥有一个独立地址),顺序存取(辅存:磁带;共享一个存取装置,数据以记录进行组织,线性顺序访问)。
主存储器
存放计算机运行期间所需要的程序和数据。
根据工艺和技术,可以分为:随机存储器(RandomAccess Memory,RAM;包括DRAM和SDRAM),只读存储器(Read OnlyRandom,ROM;包括掩模式ROM,MROM,厂商写,不可修改;一次可编程ROM:PROM;可擦出ROM:EPROM;闪速存储器:Flash ROM)。
辅助存储器
存储当前不需要立即使用的数据。
分为:磁带、磁盘、磁盘阵列和光盘存储器。
磁带存储器
磁盘存储器
硬盘地址表示为:驱动器号、柱面号(磁道号)、记录面号(磁头号)、扇区号。注意:扇区编号从1开始。一个扇区的存储容量有操作系统决定,例如512k。存取时文件放在一个柱面内。
磁盘格式化的容量一般为非格式化容量的60-70%。格式化容量,用户可以使用的,非格式容量,全部的磁道单元数。
磁盘阵列
磁盘冗余阵列技术(RedundantArray of Inexpensive Disks,RAID),目标是缩小CPU速度和磁盘读写速度之间的差距。
分为8级,应用了分块技术、交叉技术和重聚技术。
0级:无冗余、无校验。
1级:磁盘镜像阵列,每个工作盘都有一个镜像盘,磁盘利用率50%。
2级:采用纠错海明码的磁盘阵列,用户增加校验盘提供单纠错和双验错功能,大数据量传输效率高。应用很少。
3级,4级:采用奇偶校验码的磁盘阵列,奇偶校验码发在一个独立盘上,如果一个盘失效,可以通过其他盘的异或运算得到。读快,写慢。3级采用位交叉奇偶校验码,4级块交叉奇偶校验码。3级适用大型文件I/O不频繁;4级适用大型文件读取。
5级:无独立校验盘的奇偶校验码磁盘阵列,采用独立存取技术(4级也采用),每个磁盘能独立操作,支持并发读写;适用于I/O频繁,不适用于传输效率高的文件。
6级:具有独立数据硬盘与两个独立的分布式校验方案,设置了一个专用的、可快速访问的异步校验盘。
7级:具有最优化的异步高I/O速率和高数据传输的磁盘阵列,对6级的改进。为磁盘阵列的最高档次。
10级:高可靠性和高性能的组合
光盘存储器
包括CD-ROM,CD-R(采用WORM技术 , WriteOne Read Many ,一次写多次读),CD-RW(可擦写),DVD-ROM(单面单层,单面双层,双面单层和双面双层)。
Cache存储器
提高CPU数据输入输出的速率。
Cache采用相联存储器,CAM是基于数据内容进行访问的存储设备。CAM,存取时直接存取,读取时给出数据或数据的部分,CAM读取存储单元中符合的条件的数据。
Cache的原理
程序的局部性原理。时间局部性,和空间据部性。时间局部性,系统执行一条指令或访问一个数据后,该单元可能很快会被访问。【注:对应程序中循环机制】空间局部性,一个指令单元或者数据单元被访问,相邻的单元可能会很快会被访问。【注:指令和数据都是数据存储的。】
映射机制
Cache单元和和主存单元的映射关系。
直接映射。多对一映射,主存分为若干块,每块单元数量和容量和cache大小一致,根据块号直接映射。缺点,不同的块同一位置单元不能同时映射到cache中。
全相联映射。采用相联存储器组成的cache。因为需要数据比较,映射速度慢。
组相联映射。cache和主存分组,采用直接映射机制。组内采用全相联映射机制。
替换算法
随机、先进先出、最近最少使用。
写操作
写直达,写cache同时,写回主存。
写回,写入cache,单元被替换时,写入主存。
标记法,cache中作出标记,1:cache中最新,0:和主存一致。
网络存储技术
包括,直接附加存储、网络附加存储和存储区域网络。
直接附件存储(Direct Attached Storage,DAS),通过SCSI(SmallComputer System Interface , SCSI 小型计算机系统接口)接口直接连到服务器,存储操作依赖于服务器,服务器直接存取。扩展困难,受距离影响。
网络附加存储(Network Attached Storage,NAS),通过网络连接到服务器,提供独立的存储操作,类似于文件服务器,采用文件共享的存储方式,采用TCP/IP协议。存储速度快,效率高。
存储区域网络(Storage area network,SAN),用交互机将磁盘阵列与服务器联接起来的高速专用子网。采用块(block)级别存储。存储技术:FC SAN,IP SNA和IBSAN。
虚拟存储技术
对硬盘、RAID的物理存储设备统一管理,形成一个存储池。实现物理存储实体和逻辑表示实现分离,应用服务器只与分配给他们的逻辑卷交互,而不关心数据存储在那个物理存储实体上。
虚拟存储的分类
拓扑结构 |
虚拟存储的存储方式 |
|
|
对称式(控制器属于网络中设备) |
数据块存储(高性能) |
|
|
非对称式(控制器独立于网络) |
虚拟文件存储(高安全) |
|
|
虚拟存储的实现方式
存储设备级虚拟化,在存储控制器实现虚拟存储;厂商各自实现,存在异构问题。
主机级虚拟化,服务器上的卷管理软件实现,增加主机负担。
网络级虚拟化,由加入SAN的专用设置实现虚拟化。
输入输出系统(P241)
I/O系统由:I/O设备、I/O控制器(I/O接口)和I/O管理软件等部分组成。
输入输出方式
包括五种方式:程序控制方式、程序中断方式、DMA工作方式、通道方式、I/O处理机方式。
程序控制方式
CPU执行一段I/O程序实现主机和外设之间的数据传送。分为无条件传送和程序查询传送。无条件传送,默认外设一致处以发生/接收就绪状态【注:属于理想状态】;程序查询传送,事先查询外设状态,未就绪cpu等待,就绪后,在执行传送。效率低。
程序中断方式
为了提高效率,采用中断方式。中断方式指计算机在执行程序的过程中,出现某些急需处理的异常情况或特殊请求,CPU中止现行程序(保护现场),转而处理发生的更紧迫事件,处理完毕后,CPU自动返回原来的程序继续执行。
中断分为:中断请求、中断判优、中断响应、中断执行、中断返回五个阶段。
I/O系统的就绪与完成以中断信号的方式通知CPU。
DMA方式
增加一个DMAC控制器(DirectMemory Access Controller)控制和管理数据传输,实现主存和外设的高速数据传输。DMAC和CPU共享系统总线。获取总线的方式有三种,(1)CPU暂停方式,(2)存储器分时方式;(3)周期挪用方式。
通道方式
是DMAC方式的进一步发展,在主存和外设之间建立数据传输通道,不在占用系统总线。分为字节多路通道(字节交叉方式传递信息,通道共享,低速设备)、选择通道(通道独享,高速设备)和数据多路通道(分为多个子通道,子通道采用字节多路通道,主通道采用选择通道机制)。
I/O处理机方式
有丰富的指令系统和中断系统,和中央处理机异步工作。
总线
是多个部件分时共享的公共信息传送线路。【注:同一时刻只允许一个部件发生,可以多个接收。】
总线的分类
按照CPU和其他芯片的位置,分为内部总线和外部总线。内部总线,CPU和寄存器、ALU部件、控制部件传输数据。外部总线,CPU和主存、I/O外设传输数据。
根据传输数据的类型不同(或总线功能不同),分为数据总线、地址总线和控制总线。
根据总线中数据线的不同分为并行总线和串行总线。并行总线,实现一个数据多位同时传输,距离近;串行总线,一个数据多位顺序传输,距离远。
总线的标准
正式标准有IEEE等标准委员会发布,工业标准由厂商提出,然后再其他厂商中得到广泛应用。
总线的性能指标
包括物理特性、功能特性、电气特性和时间特性。
物理特性:总线的线数、插头接口的形状、尺寸和信号线的排列方式等。
功能特性:每根线的功能。
电气特性:每根线的传递方向和电平范围。
时间特性:每根线在什么时间有效,和不同信号间相互配合的关系。
性能指标包括:
总线宽度,总线的线数。
总线的带宽,最大数据传输速率,每秒传输字节数。
总线的负载,能够接入到总线的最大设备数量。
总线的分时复用。
总线猝发传输,在一个总线周期中,可以传输存储地址的连续的多个数据。
接口
主机和外设的交接界面,实现主机和外设的数据传输。
接口的功能
实现通讯联络控制(不同速度的主机和外设之间的最佳信息交换时刻)、地址转译和设备选择、数据缓冲、数据格式转换、传递控制命令和状态信息。
接口的分类
串行接口和并行接口。串行可以分为同步通信方式和异步通信方式(每个字符开始加上开始和结束标志)。
常见接口
IDE,磁盘接口。
接口类型 |
带宽 |
传输宽度 |
IDE |
1.5Mbps |
8位 |
EIDE |
150Mbps |
32位 |
高级附件技术(AdvancedTechnology Attachment ,ATA),全球硬盘接口标准,也称为Ultra DMA133, 1064Mbps(133MBps)的传输速率。
串行高级附件技术(Serial ATA,SATA),串行硬件驱动器,理论速率1200Mbps(150MBps),支持热插拔。
外部串行高级附加技术(externalSATA),在接口加金属弹片,增加插拔次数,传输速率3.2Gbps。
SCSI,大容量存储设备、音频外设和CD-ROM驱动器的接口标准。最大速率5Gbps(640MBps),雏菊链形式接入。
个人计算机内存卡国际联合会(PersonalComputer Memory Card International Association ,PCMCIA),笔记本电脑的接口标准。
IEEE-1394:
USB:串行总线接口,雏菊链形式接入,最多127个设备。
端口
指能接口电路中能够被CPU直接访问的寄存器。多个端口加上相应的控制逻辑电路组成接口。一个接口包括数据端口、命令端口和状态端口。
端口编制,分为统一编址和独立编址。独立编址指主存地址空间和端口地址空间是独立的,又称为I/O映射。
指令系统
指令,计算机执行操作的命令。是计算机系统中软件与硬件分界面的一个主要标志。
RISC比CISC指令提高3-5倍。
基本指令系统
设计要求
完整性、规整性、兼容性、高效性。
基本指令
包括数据传送指令、运算指令、程序控制指令、I/O指令和处理机调试与控制指令。
数据传送:寄存器之间、寄存器与主存之间、主存单元之间数据传送。
运算指令:算术运算、逻辑运算移位指令。
I/O指令:主机和外部设备进行数据交换,属于特权指令。【注:在管态下系统管理员调用,用户无权调用。】
处理机调试与控制指令:处理机分为管态和用户态,指令分为特权指令和一般指令。特权指令在管态下才能调用。
复杂指令系统
指令发展两国方向:1)将软件功能硬件指令化,复杂指令计算机(Complex instruction Set Computer ,CISC);2)指令系统提供基本的指令,其余的功能用户微程序实现,精简指令计算机(Reduced Instruction Set Computer , RISC).
特点:
指令数量多,100-250条左右。
使用频率相差悬殊,80-20原则。
支持多种寻址方式。
变长指令。
指令对主存单元数据直接操作。
以微程序控制。
精简指令系统
通过简化指令系统,是计算机结构更加简化、合理。
特点:
指令数量少。
指令的寻址方式少,仅包括寄存器寻址、立即数寻址和相对寻址。
指令长度固定。
以硬件布线逻辑控制为主。
单周期指令执行,采用流水线技术。
优化的编译器。
流水线技术(P255)
提升计算机的性能,有两种方式,空间并行性和时间并行性。空间并行性,增加部件;时间并行性,采用流水线技术。
流水线工作原理
流水线把一项任务分解为若干子任务,不同的子任务由不同的操作部件执行,这些部件可以并行工作。任意时刻任意任务只占一个部件。
时空图
流水线特点
流水线的任务必须是连续的,
每个部件后有一个缓冲器,
大的操作部件分解小的部件。
流水线的分级
三级:操作部件级(运算操作流水线)、指令级(处理机级,将指令的执行过程分解为流水线)、处理机间级(2个以上的处理机和寄存器组成流水线)。
流水线的分类
从功能分,单功能流水线、多功能流水线。单功能,该流水线只实现一个功能;多功能,只该流水线各段可以执行不同的链接,完成不同的功能。
从工作方式分,静态流水线和动态流水线。静态,同一时间仅有一种运行方式,指当流水线功能变换时,流水线需要重新初始化配置,动态指流水线统一时间允许不同运算的链接方式。
从链接方式分,线性的和非线性的。线性指,从输入到输出,每个部件仅执行一次,没有回路;非线性,则有回路、循环等。
流水线的性能分析
性能包括:吞吐率、加速比和效率。
吞吐率
单位时间内完成的任务数量或者输出结果的数量。流水线的吞吐率=1/t;t流水线各段中执行时间最长段的执行时间。
执行总时间:kt+(n-1)Δxt (Δxt两个任务的间隔时间)。k个时钟周期完成第一个任务,n-1个时钟周期,完成其余的n-1个任务。效率=n/[(k+n-1)*t],即n>>k,执行效率越高,趋近于1/t.
加速比
执行同一批任务,不使用流水线时间与使用流水线时间的比率。T0/Tk=nkt/()t =nk/(n+k-1)
效率
各个部件的利用率。即时空图的区域比。=n/(k+n-1)à1
局部相关于全局相关
流水线的关键在于重叠执行。
局部相关,只指令对共享资源【注:这里的共享资源是相同的地址,可能是寄存器,也可能是主存】的访问冲突,此次不会影响流程的总体执行。全局相关,转移指令和中断指令,这两个会影响整体流程的执行。
多处理机系统
多处理结构由若干个独立的处理机组成,每个处理机能够独立执行自己的程序。
多处理机系统概述
多处理机基于MIMD结构。
和并行处理机的比较
并行处理机基于SIMD结构,单控制器,多个处理单元;适用于矩阵等的计算。进程内同步。MIMD,进程间同步。
多处理机系统的分类
从对内存的访问方式的角度,分为共享存储方式分布存储方式,两种类型处理机。
海量并行处理结构(分布存储)
MVP特点是大规模并行处理。采用分布式多处理机模型。
对称多处理结构(共享存储))
SMP也称为共享存储多处理机。共享存储的实现方式有三种:1)6-10图所示;2)存储器和处理绑定,存储器之间,形成共享,即一个地址空间。3)仅仅cache共享。
互连网络
互连网络是并行处理系统的核心组成部分。
多处理机互连的方式包括:
总线式(简单、争用高)、交叉开关(在处理机和共享内存间建立连接点的矩阵,每个节点为开关;复杂、难扩展)、开关枢纽(开关枢纽有仲裁单元和开关单元组成)、多端口存储器、多级互连网络。
系统性能设计
性能指标分为两类,第一类,系统的可靠性和可用性,例如:无故障时间;第二类处理能力和效率,包括1)吞吐量(单位时间处理作用的数量);2)响应时间(单个作业从接收到处理完成的时间);3)资源利用率(对系统资源的利用率)。
系统性能指标
字长和数据通路宽度
字长只计算机运算的数的位数,由加法器和寄存器的位数决定。一般等于CPU内部寄存器的大小。数据通路宽度,数据总线能够一次并行传输信息的位数。
主存容量和存取速度
运算速度
主频和时钟周期、CPI(指令平均执行时间)、吞吐量和吞吐率(给定时间/单位时间)、响应时间和完成时间(用户提交请求后,输出开始之前的时间;时间从发生到结束的时间。完成时间=响应时间+输出结果的时间)、兼容性。
系统性能调整
即性能优化。
系统性能评估
评估方法体系
分为两类,测量方法(通过测量程序和设备,直接获取性能指标数据)和模型(通过模拟分析系统负载;通过分析得到性能指标)方法。
经典评估方法
常用方法,时钟频率法、指令执行速度法、等效指令速度法、数据处理速率法、综合理论性能法和基准程序法。
基准程序法
Dhrystone基准程序
综合性整数基准测试程序。目标,CPU对整数指令和控制功能有效性。很少使用。C 语言编写测试包。
Linpack基准程序
浮点性能测试。浮点加和浮点乘;fortran语言编写。很少使用。
whestone基准程序
fortran编写综合性能测试程序,很少使用。
SPEC
包括速度测试和吞吐率测试。
TPC
测试系统的事务处理、数据库处理、企业管理与决策支持系统等方法内容。