【Oracle-内存管理】-深入Buffer Cache

1.  深入Buffer Cache 

用最简单的语言来描述Oracle数据库的本质,其实就是能够用磁盘上的一堆文件来存储数据,并提供了各种各样的手段对这些数据进行管理。作为管理数据的最基本要求就是能够保存和读取磁盘上文件中的数据。众所周知,读取磁盘的速度相对来说是非常慢的,而读取内存的速度相对则要快得多。因此为了能够加快处理数据的速度,Oracle必须将读取过的数据缓存在内存里。而Oracle对这些缓存在内存里的数据起了个名字:数据块缓存区(Database buffer cache),通常就叫做buffer cache。按照Oracle官方的说法,buffer cache就是一块含有许多数据块的内存区域,而这些数据块主要都是数据文件中数据块内容的副本。通过初始化参数buffer_cache_size来指定buffer cache的大小。Oracle实例一旦启动,该区域大小就被分配好了。

buffer cache所能提供的功能主要包括:


(1) 通过缓存数据块,从而减少I/O。
(2)通过构造CR(Consistent Read)块,从而提供读一致性功能。
(3) 通过提供各种lock、latch机制,从而提供多个进程并发访问同一个数据块的功能。

内存里的数据块通常叫做buffer,而数据文件里的数据块通常叫做block,二者是一个意思。一般我们会混用这两个名词。

1.1  Buffer Cache的内存结构

Oracle内部在实现其管理的过程中,有两个非常有名的名词:链表和hash算法。

链表是一种数据结构,通过将对象串联在一起,从而构成链表结构。这样,如果要修改、删除、查找某个对象的话,都可以先到链表中去查找,而不必实际地访问物理介质。Oracle中最有名的链表大概就是LRU链表了,我们后面会介绍它。而hash算法则在前面描述shared pool时已经做过介绍。

hash算法则是为了能够进行快速查找定位所使用一种技术。所谓hash算法,就是根据要查找的值,对该值进行一定的hash算法后得出该值所在的索引号,然后进入到该值应该存在的一列数值列表(可以理解为一个二维数组)里,通过该索引号去找它应该属于哪一个列表。然后再进入所确定的列表里,对其中所含有的值,进行一个一个的比较,从而找到该值。这样就避免了对整个数值列表进行扫描才能找到该值,这种全扫描的方式显然要比hash查找方式低效很多。其中,每个索引号对应的数值列在oracle里都叫做一个hash bucket。

我们来列举一个最简单的hash算法。假设我们的数值列表最多可以有10个元素,也就是有10个hash buckets,每个元素最多可以包含20个数值。则对应的二维数组就是t[10][20]。我们可以定义hash算法为n MOD 10。通过这种算法,可以将所有进入的数据均匀放在10个hash bucket里面,hash bucket编号从0到9。比如,我们把1到100都通过这个hash函数均匀放到这10个hash bucket里,当查找32在哪里时,只要将32 MOD 10等于2,这样就知道可以到2号hash bucket里去找,也就是到t[2][20]里去找,2号hash bucket里有10个数值,逐个比较2号hash bucket里是否存在32就可以了。

buffer cache就是使用多个hash bucket来管理的,其hash算法当然比我们前面列举的要复杂多了。

我们先来看下面这个图一。这副图从逻辑上说明了整个buffer cache的结构是怎么样的。这副图的右上角列出了三个名词:hash bucket、buffer header和hash chain。

我们先来看图一。这幅图从逻辑上说明了整个buffer cache的结构是怎么样的。

【Oracle-内存管理】-深入Buffer Cache_第1张图片
图一  buffer cache结构图

从图一中我们可以看到,buffer cache就像一个水池,水池的最小单位就是数据块。当每个数据块被读入buffer cache时,Oracle都会抽取数据块的头部,在内存中构建buffer header,并将这些buffer header串成链表的形式。而buffer header里面记录的指针就指向buffer cache中的该数据块本身。于是,Oracle在搜索某个数据块时,就不用去buffer cache中找,而是直接扫描链表上该数据块所对应的buffer header,然后根据找到的buffer header所记录的指针就能到buffer cache中直接定位该数据块了。

在管理buffer header的过程中,Oracle同样借助了hash算法。通过对buffer header里记录的数据块地址和数据块类型运用hash函数以后,得到该数据块所属的组号。这里的组号就是图5-4中的hash bucket。

这里的hash chain就是属于同一个hash bucket的所有buffer header所串起来的链表。实际上,hash bucket只是一个逻辑上的概念。每个hash bucket都是通过不同的hash chain体现出来的。每个hash chain都会由一个cache buffers chains latch来管理其并发操作。

启动数据库以后,Oracle究竟产生多少个hash bucket,则由Oracle自己计算。

当前台进程发出SELECT或者其他DML语句时,Oracle根据SQL语句的执行计划找到符合SQL条件的数据块,然后Oracle会根据对请求的数据块的地址以及数据块的类型作为参数,应用hash函数以后,得到要找的数据块所处的hash bucket,也就是确定该数据块在哪条hash chain上。然后,Oracle进入该hash chain,从上面所挂的第一个buffer header开始,根据buffer header所含有的指针找到对应的块体,然后扫描其中的数据,确认其是否是SQL语句所需要的块,如果是,则返回该块里所需要的数据;否则,如果不是,则继续往下搜索,一直搜索到最后一个buffer header为止。如果一直都没有找到,则调用物理I/O,到数据文件里把该块所含有的内容复制一份到一个可用的buffer里,并构建该块的buffer header,然后将该buffer header挂到hash chain上去。


读后理解:
hash bucket:对应到一串buffer header,是hash算法后的一个索引对象
buffer header:数据块被读出buffer后,构建成buffer cache检索机制里的一部份,实际中我们可以通过buffer header对应的cache里真实的块
buffer chain:归属于同一个buffer bucket下的buffer header链,受到buffer chain latch的管理

125030644.jpg

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/645199/viewspace-678592/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/645199/viewspace-678592/

你可能感兴趣的:(内存管理,运维,数据库)