缓存cache

1. 先修知识

  1. b位的二进制数可以表示2^b个数。
    相应的B个数需要log2(B)位来表示。
  2. k代表2的10次方, M代笔2的20次方,G代表2的30次方
  3. 一个字节等于8位,一个字一般为4个字节

2. 存储器模型

2.1 cpu与存储器的关系

经典的冯诺依曼模型将计算机分为运算器、存储器、控制器、输入和输出。cpu分为运算器和控制器,cpu需要从内存中读取数据。

2.2 cpu与内存的连接

cpu与内存的连接通过数据线连接,主要包括:
地址线,数据线,控制线。各种线的作用如下:

  • 地址线传输地址信息(也就是要读取哪一个地址的数据)
  • 数据线传输读取出的数据
  • 控制线(负责告诉内存是读 还是写)
    注意:
    地址线的位数决定存储器可以寻址的空间,b位的地址可以寻址2^b个地址。
    数据线的位数决定了一次可以读取的数据量的大小。例如8根数据线,一次可以读取8位,也就是一个字节,32根的 就是一次可以读取4个字节
    假设地址线a根,数据线d根,那么存储器可以存储的位数位: 2^a*d。 字节数需要除以8

**所以可以将内存想象成二维的矩阵,然后行代表每一个地址, 列代表了这个地址的存储单元每一位保存的数据 **
存储器模型如图所示:

缓存cache_第1张图片
QQ图片20161120220202.jpg

以下介绍一个真实的内存过程:

  1. cpu控制器将内存的地址信息放到地址线上
  2. 内存将地址线映射到某一行去。例如三个地址线101的将映射到内存的第5行。
  3. cpu控制器将控制信号(“读”)放到控制信号
  4. 此时开始读, 数据通过数据线到达cpu.

3. 缓存设计原理

3.1 缓存的初衷

  • cpu和内存速度之间的差异
  • 存储介质的矛盾(速度,价格,容量)

3.2 缓存可行的原因

  • 局部行原理

3.3 缓存的设计过程

下面都假设一个地址读取一个字节的数据:也就是数据线只有8根

  • 首先设计决定缓存和内存之间移动数据块的大小。假设为B字节的数据,那么就是连续的B个地址的数据放到一个块中去。因为地址是连续的增长的,所以可以使用地址最低b=log2(B)位来代表该块哪一个字节。
  • 确定了块的大小,我们在看通用缓存的设计,缓存被设计成为S组,每组E行,如下图
缓存cache_第2张图片
通用缓存结构.PNG

**注意: **这是一种通用的缓冲区的结构,随着M, E的变化,该结构可以到特殊的情行。例如以下的特殊情况:1. S=1 ; 2. E=1。
该通用缓存结构的规定是:
某一内存块只能放到某一具体的组,但是可以放到该组E行中的任意一行。

  • 现在我们确定了块大小,和使用物理地址的后b位确定一个块中的哪一个字节(我们强调过,一个地址对应一个字节)。现在想像一下,数据块从内存到缓存中的过程,该过程首先要决定将数据放到相应的那个组中去,然后才决定放到哪一行中去。对于S组,我们需要s=log2(S)为来表示放到哪一组中去。

现在我们退出来,从地址的规律的角度思考如何设计该如何决定将数据块放到哪一个缓存组中。
下面是一个5位的地址,共可以表示32个地址,以下是地址的递增到末尾。我们假设一个块保存四个字节, 也就是四个地址的数据,下面我们已经将每块通过空行分割。同样我们假设缓冲区的分为四组,也就是S=4,所以需要两位来表示哪一个组(缓冲区的组数是硬件设计人员决定的,当然可以是任何的组数,但是一般是2的幂次方个。
我们通过下面的地址可以很清晰的看出,

  • 每个块的后两位的十进制就是0-3,确实可以用来标注一个块中的第几个字节,其实这个是因为地址是连续增加,且低位先变化,这个和十进制的递增是一样的。

  • 比较每一块的第一个地址的中间的两个数, 其也在递增,取值也是0-3,然后同一块内的是相同的,所以使用这两个数作为组号是可行的。

  • 第一块和第五块的数据中间数字会被隐射到同一个组内,因为中间的位的数字是相同的,这时就需要高位来区分。第一块的高位为0,第五块的高位为1, 高位也被称为标记。 为什么标记一定能保证唯一的确定一个数据块呢? 首先因为地址是连续增加的,没有重复;当中间的组号再次循环到某一组号时,地址会向前进位,所以标记位会不同。
    标记的位数:地址的位数 - 块偏移的位数 - 组的位数
    注意: 我们是先确定块的大小,进而得到块偏移的位数
    然后由组数,确定组的位数
    最后才是有上述的关系 得到 标记的位数。

标记 组号 块偏移
(1)
0  00  00
0  00  01
0  00  10
0  00  11

0  01  00
0  01  01
0  01  10
0  01  11

0  10  00
0  10  01
0  10  10
0  10  11

0  11  00
0  11  01
0  11  10
0  11  11

(5)
1  00  00
1  00  01
1  00  10
1  00  11

1  01  00
1  01  01
1  01  10
1  01  11

1  10  00
1  10  01
1  10  10
1  10  11

1  11  00
1  11  01
1  11  10
1  11  11
  • 现在我们已经知道放到哪一组中去,下面需要知道放到哪一行中去,因为通用缓冲区约定,放到该组E行中的任意一行,所以当该组中有空闲的空间时,就直接存放就行了。
    问题: 如何判断一个缓冲区有效(即存放有数据)?
    这就是缓冲区中有效位的作用,该位为1表示有效,0表示无效。
    所以只需遍历该组内所有行,若有行中的有效位为0,则将数据放到该行即可
  • 上面我们讨论的是有空闲的时候,那么如果没有空闲,此时需要替换算法来决定将哪一个缓冲块踢掉,替换算法, 替换算法一般有最近最少使用, FIFO等算法。
    缓冲区设计完成

下面来讨论数据的读取

  • 组选择
    从地址中选择中间的s位,转换为十进制的第i组
  • 行匹配
    从该组中依次匹配每一行,当且仅当有效位和标志位全部一致,才表示数据块匹配
  • 字抽取
    从地址最低的b位,转化到十进制j,表示数据是该块的第j个,读取出来。

4. 特殊的缓冲区结构

本大节讨论的是对于通用型缓存结构的特化

4.1 直接映射缓冲区

直接映射缓冲区是指 有S组缓冲区,每组只有一个缓冲块。

4.2 组相连

组相连是指有S组,每组E行,E>1.

4.3 全相连缓冲区

全相连缓冲区 是指只有一个组

你可能感兴趣的:(缓存cache)