DB2 LOAD的4个阶段

转载自:CNBLOGS文章,有删改。

1.load概述

数据的导入方法有insert,import和load三种,其中load不需要写日志(或很少日志),不做检查约束和参照完整性约束,不触发Trigger,锁的时间比较短,因此特别适合大数据量的导入。

2.load的4个阶段

load过程分为4个阶段:load/build/delete/index copy。load阶段是将源文件parser成物理数据存储的格式,直接装入到页中,而不通过db2引擎,load阶段会检查表定义,违背定义的数据不会装入到表中。build阶段建议索引(如果装入表有索引的话),会检查唯一性约束,违背了唯一性的数据会在delete阶段删除。index copy阶段将index数据从指定的临时表空间拷贝到初始的表空间里,index copy只适应于allow read access场景。load的4个阶段会记录在messages文件里。

3.online and offline load

缺省情况下,load过程不允许其他应用访问表,即allow no access,或叫offline load(离线加载)。Allow read access,或叫online load(在线加载),只有在load …insert into的时候才允许使用,其他应用读到的数据是加载前的数据,load … replace into会将数据先删除,再load,只能是离线加载。

4. load表的状态

load可能出现的几种状态,某一时刻可能会同时处于几种状态。只有当表是normal状态时,表才能进行正常的增删改查操作。
normal: 正常状态
set integrity pending: 如果目标表有check约束或reference约束,那么Load后此表处于set integrity pending,表明表有约束还未检查,稍后解释。
load in progress:load正在数据加载过程中。
load pending:数据提交前出现了故障,需要通过load…terminate,load…replace或load…restart解除暂挂状态
read access only:目标表数据是可以读的,当load时指定了allow read access,那表就会处于read access only状态
unavailable:表可能被删除了或从backup中恢复了。
unknown:通过load…query命令无法得知表的状态。

可以通过load…query命令查看表的状态,

(1).当表处于load pending的时候,

需要检查pending的原因,然后通过load…terminate终止load操作,或通过load…replace将表数据清空,或通过load…restart重启load操作。记住不要删除load的临时数据文件。load pending的原因很多,如表空间没有足够的空间等。

(2).当表处于set integrity pending状态的时候,

意味着要求用户去检查数据的一致性(check constraint和reference constraint)。可通过 set integrity for immediate checked将set integrity pending去掉。

(3).load…replace

会将数据先清空,再load数据。如果中间出现故障,那么通过load…terminate命令后,表里的数据会变空,因此建议load之前进行数据库备份或单表备份。

5. load的COPY选项

COPY可以理解为备份,主要针对前滚恢复,即当数据库处于归档日志情况下。由于load不记日志,需要备份才能进行恢复。
Load支持三种COPY选项,COPY NO(缺省),COPY YES,和NONRECOVERABLE。
COPY NO :此选项会导致load表所在的表空间处于backup pending状态,可以读数据,但不能对表进行增删改。load操作一旦开始,表就会处于backup pending状态,即使终止Load,也不会使表空间脱离此状态。load完成后,需要进行表空间backup。
COPY YES: 此选项会将load变化的数据进行自动备份。在前滚恢复阶段(rollforward),会使用这个备份重建load过程产生的数据。
NONRECOVERABLE:此选项表明此表是不能通过rollforward恢复的,当rollforward完成后,此表只能被删除或从备份介质中恢复。此选项不会使表空间处于backup pending状态,也不会产生数据的备份。
举例:
如果在正常联机交易时间load数据,可能会造成了表空间处于backup pending状态,交易系统只能查不能更新,发现问题后应立即终止load,但也可能由于表空间很大,backup花费时间很长,会严重影响了交易的正常运行。在测试环境测试若不能重现问题,则检查测试环境是否使用的是循环日志,与生产中利用的归档日志不同。

6. load replace快速清空大表

对于大表数据的清空,如果用delete,由于会产生大量的日志,导致效率很慢,而且容易出现log full。可以考虑用load from /dev/null of del replace into
(Unix/Linux) 或者load from empty.del of del replace into(Windows,empty.del是一个空的文本文件即可)

备注:在生产中可以在diaglog日志中查看Load的几个阶段分别耗时多长,状态如何。

你可能感兴趣的:(DB2)