Oracle体系结构之检查点

CKPTQCheckpoint Queue(检查点队列)检查点队列中的数据块记录着每个数据块的LRBA地址

  • RBA      Redo Block Address(重做日志块的地址,相当于数据文件中的rowid,可以通过该地址定位重做日志块)

由三个部分组成:4byte+4byte+2byte

logfile sequence number(日志文件序列号)

logfile block number(日志文件块编号)

byte offset into the block(重做日志记录在日志块中的起始偏移字节数)

  • LRBA    Low cache RBA(buffer cache中脏块第一次变脏的时候产生重做日志记录在redo log file中对应的地址,即当前检查点队列的位置)

  • HRBA    High cache RBA(buffer cache中脏块最近一次变脏的时候产生重做日志记录在redo log file中对应的地址)

  • on disk RBAredo log file中状态为CURRENT的最后一条日志地址


在数据库系统中,写日志和写数据文件是数据库中IO消耗最大的两种操作,在这两种操作中写数据文件属于分散写,写日志文件是顺序写,因此为了保证数据库的性能,通常数据库都是保证在提交(commit)完成之前要先保证日志都被写入到日志文件中,而脏数据块则保存在buffer cache中再不定期的分批写入到数据文件中。也就是说日志写入和提交操作是同步的,而数据写入和提交操作是不同步的。这样就存在一个问题,当一个数据库崩溃的时候并不能保证缓存里面的脏数据全部写入到数据文件中,这样在实例启动的时候就要使用日志文件进行恢复操作,将数据库恢复到崩溃之前的状态,以保证数据的一致性。检查点就是这个过程中的重要机制,通过它来确定,恢复时哪些重做日志应该被扫描并应用于恢复。

一般所说的checkpoint是一个数据库事件(event),checkpoint事件由checkpoint进程(LGWR/CKPT进程)发出,当checkpoint事件发生时DBWn会将脏块写入到磁盘中,同时数据文件和控制文件的文件头也会被更新以记录checkpoint信息。


Checkpoint的主要作用:

  • 保证数据库的一致性。

   这是指将脏数据写入到硬盘,保证内存和磁盘上的数据是一样的;

  • 缩短实例恢复的时间。

   实例恢复需要把实例异常关闭前没有写入到磁盘的脏数据通过日志进行恢复,如果脏块过多,实例恢复的时间也会很长,检查点的发生可以减少脏块的数量,从而提高实例恢复的时间。


如果初始化参数LOG_CHECKPOINTS_TO_ALERT设置为TRUE,则有关每个检查点的信息都记录在alert_$ORACLE_SID.log 文件内。该参数缺省值为FALSE,表示不记录检查点。


在Oracle里面,检查点分为三种:完全检查点、增量检查点、部分(临时)检查点

完全检查点

在Oracle8i之前,数据库的发生的检查点都是完全检查点。

完全检查点会触发DBWn将buffer cache里面所有的脏数据块写入相应的数据文件中(即使事务未提交),并且同步数据文件头和控制文件中的信息,保证数据库的一致性。

完全检查点在8i之后只有在下列两种情况下才会发生:

  • 数据库正常shutdown(immediate,transcational,normal)

  • DBA手工命令干预(alter system checkpoint)


增量检查点

增量检查点并不更新控制文件中系统SCN、文件SCN、结束SCN以及数据文件头部的开始SCN,而是每隔3秒由CKPT进程将检查点队列中第一个脏块所对应的LRBA地址(即检查点的位置,前滚起点)记录到控制文件中.

但如果是由日志切换所引起的增量检查点,则同时还会将LRBA地址记录到每个数据文件头中


引起增量检查点的条件有:

  • fast_start_mttr_target参数(mttr:Mean Time To Recovery 快速启动平均故障恢复时间)

   该参数控制数据库对单个实例执行崩溃恢复所花费的时间量(以秒为单位,默认为0,最大值为3600)。

启用快速启动检查点功能时,Oracle将自动根据工作负载情况计算增量检查点的频率(间接影响DBWn进程的频率),以便达到请求的MTTR。如果将该值设置为0, 将禁用此功能。(但工作负载检查无法关闭)

   log_checkpoint_timeout参数用于表示检查点位置和重做日志文件末尾之间的时间间隔,以秒为单位,默认情况下是1800秒。

   fast_start_io_target参数用于表示数据库发生Instance Recovery的时候需要产生的IO总数,它通过v$filestat的AVGIOTIM来估算的。(9i以后已经废弃)


   SQL> alter system set fast_start_mttr_target=90;

   System altered.

   SQL> show parameter fast_start_mttr_target

   NAME                                 TYPE        VALUE

   ------------------------------------ ----------- ---------

   fast_start_mttr_target               integer     90


  • 日志切换

   SQL> alter system switch logfile;

   System altered.


部分检查点

触发DBWn进程将buffer cache中相关的数据脏块都会写入相应的数据文件

引起部分检查点的条件有:

  • 表空间下线/只读

   SQL> ALTER TABLESPACE tablespace_name OFFLINE;

   SQL> ALTER TABLESPACE tablespace_name READ ONLY;

  • 热备份(热备份表空间的时候,为了避免redo log被覆盖,数据库必须运行在归档模式下)

   SQL> ALTER TABLESPACE tablespace_name BIGEN BACKUP;          //进入热备份状态(锁住数据文件头,并记录块变化日志)

   SQL> ! cp

   SQL> ALTER TABLESPACE tablespace_name END backup;            //退出热备份(解锁数据文件头)


你可能感兴趣的:(lgwr,checkpoint,DBWn,CKPT)