【笔记】计算机组成与结构复习笔记

最后一门,来辣老弟!

Computer Organization & Architecture

ppt浏览

CH0 知识点总结

  1. Overview
  2. Computer system
  3. CPU
  4. CU
  5. Parallel organization

CH1 Overview

  1. 结构Architecture偏逻辑,组成Organization偏实现
  2. 透明Transparency:对于一个存在的东西,从一个角度看就好像不存在一样.
  3. 功能Functions:结构中部分组件的操作
  4. 计算机包括:CPU(Central Processing Unit),主存Main Memory,System interconnection,IO
  5. CPU包括:Registers, Arithmetic and logic unit(ALU), Control Unit(CU), Internal CPU interconnection
  6. CU包括:Sequencing Logic, Control Unit Registers and Decoders, Control Memory.

CH2 Computer Evolution and Performance

  1. ENIAC - first computer
  2. 冯诺依曼机的特性和结构
    特性:
    数据和程序存放在可读写的存储器中
    存储器按位置寻址
    指令顺序执行
    【笔记】计算机组成与结构复习笔记_第1张图片
    寄存器包括:
    1. MBR: Memory Buffer Register
    2. MAR: Memory Address Register
    3. IR: Instruction Register
    4. IBR: Instruction Buffer Register
    5. PC: Program Counter程序计数器
    6. AC: Accumulator
    7. MQ:Multiplier Quotient
  3. 摩尔定律:芯片上的晶体管数量每18个月翻一倍。
  4. 发展史:电子管计算机,晶体管计算机Transistor Computer,集成电路计算机Integrated Circuits Computer
  5. 经典分类:单片机chip microcomputer, 单板机single board computer,嵌入式计算机Embedded computer, 微型计算机Microcomputer, 服务器Server, 超级计算机SuperComputer

CH3 A Top-Level View Of Computer Function And Interconnection

KeyPoint

  1. Interrupt and instruction cycles
  2. Multiple interrupts
    一个中断句柄被中断了。
  3. System bus
    连接计算机主要组件的总线。
    data,address,control
  4. Multiple bus hierarchy
  5. Key elements of bus

自由总结

  1. 计算机的基础功能是执行程序
  2. 指令周期:处理一个指令的cpu时间
  3. 指令执行分为两步:fetch,execute(包括一步:数据处理)
  4. 中断
    一种允许其他模块中断CPU执行序列的机制。
    可以提高CPU利用率,便于处理紧急事件。
    类别有程序,定时器,IO,硬件错误。
    在一个指令周期之后才会检查中断。
  5. 总线
    1. 连接两个或多个组件的通信路径,通常打包。
    2. 同一时刻只能有一个部件发送信息,可以有多个部件接受信息。
    3. 系统总线system,外围总线peripheral,内部总线internal
    4. 数据总线:指令也是数据,数据总线宽=机器字长=主要寄存器长度
    5. 地址总线:决定内存的最大容量
    6. 多总线:防止长总线带来的延迟?

总线要素

  1. 类型:专用/复用
  2. 仲裁方法:分布式,集中式:
    1. 链式轮询chain polling:扩展性强;敏感易损坏
    2. 计数器定时轮询counter polling:灵活的优先级,故障不敏感;控制较复杂
    3. 分立请求separate request:优先级灵活,速度快;线太多,控制复杂
  3. 时序:(??)
    1. Synchronous同步:容易实现;不灵活
    2. Asynchronous异步:反应快;控制复杂;非互锁interlock,半互锁,全互锁
    3. Half-Synchronous半同步:允许各种速度的模块和谐通信
    4. Separate分离:避免总线空闲等待,用于大型机
  4. 宽度
    1. 数据总线宽度:系统性能
    2. 地址总线宽度:内存容量
    3. 带宽bandwidth:传输速率,B/s
  5. 传输类型
    1. 写复用
    2. 读复用
    3. 读改写
    4. 写后读
    5. 写(不复用)
    6. 读(不复用)
  6. PCI:外围设备互连

CH4 Cache Memory

标识符约束

自由总结

  1. 数据存储方法:顺序,直接,随机,关联
  2. 存取时间Access Time:将数据取出的时间
  3. 内存周期时间Memory Cycle Time: 地址变化时间+数据取出时间
  4. 局部性原理Principle of locality of reference
    1. CPU访问数据或指令时,访问的存储单元趋于一个较小的数据区域中
    2. 90/10规则:10%的代码执行90%的时间
    3. 时间局部性Temporal,空间局部性Spatial

Cache

  1. 少量,快速的存储。接近CPU的速度。
  2. Cache的一个line和内存的一个block相等,C个line,M个block
  3. 命中率h = Nc/(Nc+Nm),总时间T = T1+(1-h)*T2
  4. size
    小:便宜;命中率低
    大:命中率高;贵,门多访问慢,占CPU空间
    1k-512k均可
  5. 映射函数
    1. 直接映射 direct mapping
      1. i=j%m,
      2. 内存地址->Tag+Line+Word
      3. 简单,易实现
      4. 敲击thrashing,如果多次取不同块的同一地址
    2. 完全关联映射full associative mapping
      1. tag完全标识内存块,检查每个line
      2. 内存地址 = Tag + Word
      3. 可以任意映射,灵活
      4. 需要并联比较电路,昂贵
    3. 组关联映射set associative mapping
      1. 分为许多个块,外部直接映射,内部完全关联映射
      2. 内存地址 = Tag + Set + Word
  6. 替换算法(非直接映射)
    1. Least Recently Used(LRU):替换最远使用的
    2. First In First Out(FIFO)
    3. Least frequently Used(LFU):替换使用次数最少的
    4. Random,和LRU效率相近
    5. Optimized:替换最远到来的
  7. Cache写
    1. 回写write back:被替换时写入内存
    2. 写直达wirte through:直接写入内存;

CH5 Internal Memory

KeyPoint

  1. Differences between SRAM and DRAM?
  2. Comparing EPROM and Flash memory!
  3. What is SDRAM? what applications need it?
  4. Parallel DRAM techniques

分类

  1. RAM(Random Access Memory)
    1. 读写时间相同
    2. 直流电源DC Supplies保持数据
    3. 临时存储
    4. 动静态
  2. DRAM(Dynamic RAM)
    1. 结构简单
    2. 需要刷新
    3. 低成本
    4. 主存
  3. SRAM(Static RAM)
    1. 通电后不用刷新
    2. 更贵
    3. cache
    4. 使用寄存器
  4. ROM(Read Only Memory)
    1. 只能写,不能读
  5. PROM(Programmable ROM)
    1. 只能写入一次,需要特殊设备
    2. 灵活便利
  6. Read Mostly Memory
    1. Erasable Programmable ROM(EPROM),多次写入,紫外线,贵,20分钟写入
    2. Electronically EPROM (EEPROM),任意时刻写入,更贵,密度低,写慢
    3. Flash Memory,快速重新编程,逐块写入。U盘

模块组织

  1. 字长扩展
  2. 字数扩展
  3. 同时扩展

现代存储

  1. Synchronous DRAM(SDRAM)
    访问与外部时钟同步,CPU可以在内存取数据时做别的事
  2. Double-data-rate SDRAM (DDR)
    单个时钟周期可以发送两次数据(上升沿,下降沿)
  3. Parallel DRAM
    用于大型计算机

CH6 External Memory

KeyPoint

  1. Organization of Disk System
  2. Disk Performance Parameters
  3. Common characteristics of RAID and different applications of different RAID levels
  4. Types of optical memory

自由记录

  1. 类型
    1. 磁盘
      1. 硬盘/软盘
      2. RAID(Redundant array of independent Disks,独立磁盘冗余阵列)
      3. 可移动硬盘
    2. 光学设备
      1. CD-ROM
      2. CD-Writable(WORM)
      3. CD-R/W
      4. DVD: Digital video disk
    3. Magnetic Tape磁带
  2. 物理存储
    1. tracks inter-track gap
    2. sectors inter-sector gap
    3. CAV(constant angular velocity,恒定角速度旋转),Multiple zoned recording
    4. 控制字段,间隔很多
    5. 磁头head:Fixed,每个track一个;Movable,每个side有一个机械臂
    6. 多面side磁盘,垂直叠加;track->cylinder,数据由cylinder划分
  3. 类型
    1. Floppy Disk软盘,容量小,慢,便宜
    2. Winchester Hard Disk,通用便宜大
  4. 磁盘系统的组织
    Disks, Disk Driver, Disk Controller(电子集成驱动器IDE,SCSI)
  5. 性能
    1. 取决于:计算机系统,操作系统,输入输出机制,磁盘控制器硬件
    2. 存取时间Ta = Ts + 1/(2r) + b/(rN)
      1. 寻道时间seek time
      2. 旋转延迟rotational delay = 1/(2r)
      3. 传动时间transfer time = b/(rN)
    3. 标识符定义
      1. r 磁盘旋转速率
      2. b 传送字节数,最少一个sector,最多一个track
      3. N 每个磁道的字节数
  6. RAID,7个级别
    1. RAID 0 (non-redundant),无冗余
    2. RAID 1(mirrored),存两个,读一个
    3. RAID 2,海明纠错,大量冗余
    4. RAID 3,奇偶校验
    5. RAID 4,写入惩罚?
    6. 5 循环分配
    7. 6 两种方法,循环分配
  7. 光驱动器
    1. CD-ROM
      1. CAV恒定角速度 CLV恒定线速度
      2. 寻址:粗调,设置速度,读取地址,细调
      3. 优点:便宜,大量生产,可移动,鲁棒
      4. 缺点:慢,只读,脆弱
    2. WORM-CD 可以写一次
    3. DVD -> Digital Versatile(而非Video) Disk
      physical records, 由inter-record gaps分隔。

CH7 Input/Output

自由记录

  1. 简单分类:人类可读/机器可读/控制
  2. ASCII: American Standard Code for Information Interchange,小写&0xdf编程大写
  3. Programmed I/O
    1. CPU issues commands: Control, Test, Read, Write
    2. 发送命令,等待;执行命令,设置位;
    3. 浪费时间
    4. 完全控制,类似于访问内存
  4. Interrupt Driven I/O
    1. 中断分辨:多中断线/软件轮询/链式轮询/总线仲裁
  5. DMA(Direct Memory Access),直接内存存取
    1. CPU外部,总线上的附加模块,在没有CPU干预的情况下将数据传输到内存中
    2. 方式:
      1. Block Transfer Mode,垄断模式
      2. Cycle stealing mode,循环窃取
      3. Transparent mode,分时交替使用
    3. 步骤
      1. CPU告诉DMA信息,然后去干别的事情
      2. DMA进行数据传输
      3. 传输完成后发送中断
    4. 配置
      1. 单总线分离DMA:IO到DMA,DMA到memory,cpu挂起两次
      2. 单总线集成DMA:cpu挂起一次
      3. 分离IO总线:COU挂起一次
  6. I/O 通道
    1. 步骤与DMA类似

CH9 Computer Arithmetic

  1. 补码:取反加一
    好处:0只有一个表示,算术更简单,取反更容易
    扩展规则:向左扩展符号位
    溢出判断:同号相加,符号改变
  2. IEEE754标准
    第1位符号,后面8位指数,后面23位底数.

CH10 Instruction Sets: Characteristics and Functions

  1. MMX——MultiMedia eXtension
    原来这个东西上课讲过啊。。。
    punpcklbw 解包
    packuswb 打包
  2. SSE——Stream SIMD Extension

CH11 Instruction Sets: Addressing Modes and Formats

  1. 立即数
  2. 直接
  3. 间接
  4. 寄存器
  5. 寄存器间接
  6. 偏移
  7. 隐含

CH12 CPU Structure and Function

寄存器分类

  1. 用户可见
  2. 控制状态

指令周期

  1. Fetch instruction 取指
  2. Decode instruction 译码
  3. Calculate operands address
  4. Fetch operands
  5. Execute instructions
  6. Write operand

标识符约定

  1. n 指令数量
  2. k 阶段数
  3. τ \tau τ 最长阶段的执行时间

性能评价

  1. 加速比SpeedUp: s k = n ∗ k / ( k + n − 1 ) s_k = n*k/(k+n-1) sk=nk/(k+n1)
  2. 吞吐量ThroughPut: T p = n / ( k + n − 1 ) / τ T_p = n/(k+n-1)/\tau Tp=n/(k+n1)/τ

条件转移的处理

  1. 多指令流
  2. 预取分支目标
  3. 循环缓冲
  4. 分支预测
  5. 延迟分支

spatio-temporal diagram

【笔记】计算机组成与结构复习笔记_第2张图片

CH13 Reduced Instruction Set Computers

精简指令集计算机(RISC)

CISC与RISC

  1. CISC
    简化编译器,程序更小
  2. RISC
    编译器优化更有效,更好的响应中断,有效利用流水线,指令简单执行效率高。

图染色算法

找到哪些变量可以放在寄存器

寄存器窗口

Parameter registers 参数
Local registers 局部变量iang
Temporary registers 参数调用,返回值

CH14 Instruction Level Parallelism and Superscalar Processors

你可能感兴趣的:(学习笔记)