1、cache buffers lru chain
要想查看或修改工作组(LRU+LRUW)进程,始终要持有管理相应工作组的cache buffers lru chain 锁存器,若在此过程中发生争用,则要等待:latch:cache buffers lru chain 事件。
在下面两类情况下我们必须首先获得cache buffers lru chain锁存器:
(1)进程想要读取还没有装载到内存上的块时,通过查询LRU列分配到所需空闲缓冲区,再次过程中需要cache buffers lru chain 锁存器。
(2)DBWR 为了将脏缓冲区记录到文件上,查询LRUW列,将相应缓冲区移动到LRU列的过程中也要获得cache buffers lru chain锁存器。
我们接下来想一下,在什么情况下DBWR将脏缓冲区记录到文件里。。。。。。。。。。啊哈,大致上列出如下几种情况:
1)oracle进程为了获得空闲缓冲区,向dbwr请求记录脏缓冲区时;
2)oracle进程为执行praallel query 或 tablespace backup, truncate/drop等工作,请求记录相关对象的脏缓冲区时;
3)由于周期性或管理上的原因检查点(checkpoint)被执行时。
大致就是上面这些了,下面我们再回头考虑一下究竟是什么引起cache buffers lru chain锁存器争用呢?其实就是过多的队空闲缓冲区的请求,还有过多的记录脏缓冲区操作。。也就是上面的两种情况。
我们必须理解cbc latch 和 cblc latch争用的差别,或者说,到底是什么情况下会引起cbc latch 争用,什么情况下会引起cblc latch的争用。。简单的理解:若是多个的会话同时访问不同的表,或者索引,那么就要大量的从磁盘上读写数据,伴随着buffer cache 中内存块的分配使用,cblc latch争用的概率会大大增加。若是多个进程同时访问一个表,这时会在内存中争用cbc latch。因为要读取或者操作一行数据,首先要获得这个块的cbc latch。。
一般情况下,cbc latch 和 cblc latch争用同时发生的情况较多,因为复杂的应用程序将符合地应用上述模式。通过我们分析,高速缓冲区过小,或者检查点周期过短。。都会引起cache buffers lru chain锁存器的争用。。。
2、buffer busy waits/read by other session
(参照博客:http://blog.csdn.net/changyanmanman/article/details/7968537)
若是两个进程同时修改一个表的两个行,恰好这两个行位于同一个数据块内,即使某个用户已经以exclusive模式获得TX锁,但是也需要保障当前只有自己在修改块。此时需要获得的锁就称为buffer lock,与其他锁相同,需要一直等到获得锁。buffer lock只有两种模式exclusive 和 shared 模式。
buffer lock 与 cache buffers chains 存储器,TX锁一起对缓冲区的修改该起到同步化的作用。在抽象层次上,为了修改一个行,获得锁存器或者锁的过程如下:
1)为了查找要修改的行相对应的块存在的位置(通过hash chain) 请求cache buffers chains 锁存器。
2)对于载入块的缓冲区请求buffer lock ,并释放cache buffer chains 锁存器。。获得buffer lock。
3)请求TX锁,修改相应的行。若果没有获得TX锁,则释放buffer lock并进入等待状态。之后重复过程1.
4)修改相应(欲修改的)行后,释放buffer lock。
为了获得buffer lock 而等待期间内,一般会等待buffer busy waits事件,buffer busy waits等待是最普通的等待现象中的一个,其原因很多,在10g中,为获得buffer lock的时间总共有4个:buffer busy wait 、 buffer busy global cache /CR(gc buffer busy) 、write comlete waits、read by other session。。
下面我们通过介绍四种情况下的操作,来了解buffer busy wait等待:
1、select/select引起的read by other session:
buffer lock 只有shared 和exclusive模式,读取位于SGA上的块时以shared模式获得buffer lock,所以此时不会发生读取工作时引起的buffer lock争用,但是,问题是,如果多个进程同时第一次读取某个块,而这个块又不在SGA中,这样,第一个进程会以exclusive 模式获得buffer lock 然后去磁盘上读取块数据。这时如果有其他进程来访问相同的块,必须以shared模式获得这个buffer lock。显然这个时候就会发生buffer lock的争用。
需要注意,发生read by other session的等待同时,会发生db file sequential read、db file scattered read 等待等I/O等现象。read by other session 等待在其属性上一直与物理I/O同时出现。
综上:若要减少select /select引起的read by other session等待的方法,整理结果如下:
***通过对sql的优化,以便能以最少的I/O获得所需的结果
***若SGA(或高速缓冲区)大小比系统全局I/O小,就需要增加其大小。
2、select/update 引起的buffer busy wait/read by other session:
select/update引起的buffer lock争用与select/select或者update/update引起的buffer lock争用机制有很大差异。
oracle的select 做出以一致性读取为基础。若实际读取的数据已经修改,则必须读取持有过去映像的CR块,这时,若CR块不在当前的告诉缓冲区上时,应该从磁盘读取撤销块。若多个会话试图读取撤销块时,在将撤销块载入到内存上的过程中发生buffer lock 争用。因此select/update引起的buffer lock争用会在如下情况下发生。
***特定进程修改该特定表,数据的过去映像记录在撤销块。
***很多进程试图同时(或之后)读取已修改的数据。
KTU:指与回滚段的内部管理(internal management of undo and rollback segments)相关的内核区。
SMU:system management undo 简称。
AUM:aotomatic undo management 的回滚段。
撤销块头上的buffer lock争用,是update会话的撤销头块修改操作和select会话引起的撤销头块读取操作之间的buffer lock争用引发的,这是因为修改头块的进程,要以exclusive模式获取buffer lock;读取头块的进程,则需要以shared模式获取buffer lock。。
撤销块上的buffer lock争用就是我们之前所描述的,创建CR块,多个会话同时读取cr块,这时,创建cr块过程是exclusive模式获得buffer lock的,所以这就引起了争用。
3、insert/insert 引起的buffer busy waits:
多个会话同时对同一个表执行Insert操作时,段的区域将急速扩大,因此引发多种性能问题,buffer lock 争用引起的buffer busy waits等待现象就是其中之一。
在ASSM(自动段空间管理)中,我们进行测试buffer lock 争用,通过v$session_wait视图,可以发现P3(class)值为8的占较大比重。偶尔也能看到9.块类8、9分别对应的是L1 BMB(level 1 bitmap block) L2 BMB(level2 bitmap block) 使用ASSM时,比起数据块争用,主要还是用于段空间管理的位图块发生 buffer lock争用,特别是L1 BMB作为空间管理的最下层leaf block 随着块状态的改变发生许多变化,因此L1 BMB 主要多发buffer busy waits 等待。在使用ASSM时,主要发生对于位图块的buffer busy waits等待。即便是使用assm,依然存在对于buffer lock 的争用,但是整体上buffer busy waits 等待将减少,特别是hw (高水位线)锁争用大幅减少。
4、update/update引起的buffer busy waits:
多个会话同时update相同的行的时候,通过TX锁形式同步。但同时多个会话对不同的行执行update时,若该行位于同一个块内,则需要通过buffer lock 进行同步。在此过程中,若发生争用,则等待buffer busy waits事件,这时发生的buffer lock 引起的争用与TX锁引起的争用性质上截然不同,因此,说明其现象时必须注意。若发生TX锁争用时,结束所持有者的事务是唯一的解决方法。但是在修改该相同块的过程中发生的buffer lock争用的解决方法却截然不同。
3、write complete waits
write complete watis 等待与buffer busy waits 等待相同,可以通过buffer lock争用引起的等待进行分类。DBWR将脏缓冲区记录到磁盘上的期间,对缓冲区以exclusive模式占有buffer lock,这时,读取或修改缓冲区的其他进程就需要等待此项工作结束,这时等待write complete waits事件。
查看v$BH视图的GLAG列,可知道当前缓冲区的准确状态。下面贴出9i中flag与状态的关系
参考此表可知想x$BH.FLAG值5时,正是利用DBWR记录到缓冲区上的状态。出现write complete waits 等待的主要原因就是DBWR进程的性能问题,也就是会所dbwr将脏缓冲区的数据写入磁盘的时间过长。其原因大致分为如下两类:
1)I/O系统性能缓慢:如果在DBWR上显示的db file parallel write等待时间较长,可以判断存在i/o系统问题。在dbwr上,db file parallel write等待时间变长,则服务器进程连续经历free buffer waits等待或者write complete waits等待。我们知道,组合使用裸设备和AIO(asynchronous IO 异步io) 是改善io性能的最好方法。使用aio(异步io)时,一般认为增加dbwr数量没有意义。因为使用多个dbwr的最红目的是以软件的方式实现aio。但若是写入繁忙的系统,可以同时使用aio和多个dbwr。
2)dbwr的工作量过多:一般情况 过小的FAST_START_MTTR_TARGET值,频繁的增量检查点,重做日志文件过小(频繁日志切换,导致检查点频繁发生),parallel query 引发direct path read时,还有truncate ,drop, hot backup时发生检查点。。。虽然这些时候io性能没有问题,但是还是因为大量的dbwr工作,还会出现write complete waits。
4、free buffer waits
服务器进程将块载入到内存的过程如下:
1)在用户请求的dba上应用hash函数,获得hashbucket。
2)检索伴随hash bucket的hash chain,确认块所对应的缓冲区头(BH)是否存在,若缓冲区头已经存在,相应块已经位于高速缓冲区的状态,则使用该块。
3)若高速缓冲区不存在,首先在lru列按最少使用的顺序寻找空闲缓冲区。在此过程中发现脏缓冲区,则将脏缓冲区移动到lruw列。找到空闲缓冲区后,可以从数据文件将块读取到该缓冲区上。
4)在lru列上寻找空闲缓冲区时,扫描与_DB_BLOCK_SCAN_MAX_PCT(缺省值40)参数值相同次数后,若仍然没有找到缓冲区,oracle将停止扫描,并且向dbwr请求脏块写入到磁盘,以得到空闲缓冲区。写入完成后使用该块。
在第四个步骤,若检索LRU列的一定区域后,也没有找到空闲缓冲区,就会向dbwr发出写入请求。直到写入工作结束为止,一直要等待 free buffer waits 事件,这样我们也就能区分write complete waits等待的区别,(wcw等待是dbwr写入对缓冲区的竞争,而这个是fbw等待是等待获得)
发生free bufferwaits等待的理由如下:
***低效的sql:请求很多空闲缓冲区
***过小的告诉缓冲区:很少的空闲缓冲区请求也会引起fbw
***dbwr的性能下降:其实前两条的的原因有一部分(或者说根本原因)就是这个dbwr不给力,如果他给力,什么都好解决了。。
在AWR 看到local write waits和 enq: RO - fast object reuse 的 等待事件。
网上对local write waits 的说明:
Note 1:
Typically DBWRhas to free up some buffers when you want to read something from the disk.During this process there are chances that you will be waiting for your localbuffer (i.e blocks dirtied/invalidated by your session) to be written to disk.During this time the waits are shown as local write waits.
Note 2:
Basically 'localwrite' wait happens (as the name indicates) when the session is waiting for itslocal (means writes pending because of its own operation) writeoperation. This could happen typically if the underlying disc has some seriousproblems (one of the member disk crash in RAID-05 - for example, or acontroller failure). That is why I might have said ' you never see this wait inthe normal databases!'. You may see thisduring (rarely) Truncating a large table while most of the buffers of that table in cache. During TRUNCATEs the session has to a local checkpoint and during this process, the session may wait for 'local write' wait.
基本上'local write' wait 表示会话在等待自己的写操作。在磁盘发生严重问题时会发生(例如RAID 5的一个磁盘崩溃,或者磁盘控制器错误),这在正常的系统中极少发生,在TRUNCATE 一个大表而这个表在缓存中的时候,会话必需进行一个localcheckpoint,这个时候会话会等待localsession wait.
在MOS 的文档:
Truncates Taking Too Long... [ID 334822.1]
提到了这个等待事件。
Processes that involve temporary tables being truncated and repopulated(使重新住入) in multiple,concurrent batch streams may present this situation.
The underlying(最根本的) problem is we have to write the object's dirty buffers to disk prior to (优先于) actually truncating or dropping the object. This ensures instance recoverability and avoids a stuck(被卡住的) recovery. It seems at first glance perfectly reasonable to simply truncate a temporary table, then repopulate for another usage. And then to do the temporary poplulate/truncate operationsin concurrent batches to increase throughput.
However, inreality(实际上) the concurrent truncates get bogged down(陷入困境) as dbwr gets busy flushing those dirty block buffers from the buffer cache. You will see huge CI enqueue waits.The multiple truncate operations in concurrent streams absolutely kill throughput.This is specially critical with large buffers.
There was also adisscussion in Bug: 4147840 (non-publish) where a peoplesoft process wascausing this behavior because of the above explanation and they seemed to fixit by changing some peoplesoft code to implement delete rather than truncate onsamll temporary tables.
In 9.2.0.5 and higher, it may also help to make sure a "temp" table that is frequently truncated have storage defined so that it occupies one extent.But this workaround is only available as long as the extent is no morethan 50% the size of the buffer cache. In non-RAC environments the tablestill has to be smaller than 50% of the buffer cache, but it allows thetable to have up to 5 extents before falling back to the old algorithm.