记一次Oracle 10g exp导出缓慢问题

某客户数据库为10.2.0.4 RAC,运行在HP-UX平台上,如下所示:

某日,在使用exp进行本地全库逻辑导出时发现很慢,导出语句的主要语法如下:
exp full=y buffer=10M  direct=y statistics=none file=..  log =..
可以看到客户对exp导出已经进行了优化,使用了直接路径导出(direct=y ),并且不导统计信息(statistics=none) ,但导出速度依然不可接受,一个晚上只导出了20G,这是极为不正常的。
数据库exp导出速度的主要影响因素如下:
 存储的I/O性能。
 exp的导出参数。
 数据库资源的争用。
exp导出期间,操作系统资源和存储I/O正常,如下所示:
Mon Jul  8 20:27:00 EAT 2013
         procs           memory                   page                              faults       cpu
    r     b     w      avm    free   re   at    pi   po    fr   de    sr     in     sy    cs  us sy id
    6     1     0  3632805  6982185    0    0     1    0     0    0     0  13059 130731  4225   5  1 94
    7     1     0  3840773  6969343    0    0     0    0     0    0     0  16492 228979  9570  15  1 84
    4     1     0  3519137  6936935    0    0     0    0     0    0     0  13698 162008  6590   8  1 91
    4     1     0  3967479  6893185    0    0     0    0     0    0     0  13660 175978  6911   9  1 90
    5     1     0  4021955  6847447    0    0     0    0     0    0     0  14958 204016  8399  10  1 89
    6     1     0  3916920  6795387    0    0     1    0     0    0     0  15059 234239  7520  11  1 88
    7     1     0  4202389  6673342    0    0     0    0     0    0     0  16642 756681 39425  16  2 83
    3     0     0  4274821  6657615    0    0     0    0     0    0     0  15079 189115  8325  11  1 88
    3     1     0  3874784  6629859    0    0     0    0     0    0     0  14310 255546 17619  14  1 85
    5     0     0  4084843  6605861    0    0     0    0     0    0     0  16176 163433  7805  12  1 87
检查了存储I/O性能和exp导出参数,确定没有问题。于是进一步检查数据库资源的争用情况。AWR报告的采样时间为为20:00至第二天8:00,即exp逻辑导出时间。如下所示:

exp导出期间,数据库的TOP 5等待事件极为不正常,几乎可以肯定不正常的等待事件才导致了exp导出缓慢,如下所示:

根据以上等待事件,可以看到SHARED POOL出现了严重问题,SQL的解析时间占DB TIME的88.56%。如下所示:

但发生故障时,系统每秒的解析数并不高,每秒解析才50个左右,如下所示:

进一步查看系统解析数最高的应用模块,发现全都是exp发起的,如下所示:

AWR报告查看到这里,就已经很明确了。接下来就查看exp最消耗资源的SQL语句,在这里主要查看最消耗CPU资源的exp语句,发现是查询SYS用户下的EXU9XML。如下所示:


而且每次执行需要读取58536个逻辑I/O。这是极为不正常的。如下所示:

而且逻辑读最高的对象为SYS用户下OPQTYPE$基表(占83.84%),这同样是极为不正常的,如下所示:

碰到这种情况,我们首先想到的是借助MOS工具,查询Oracle是否有相关BUG,果然在729248.1有相关解释,解决方法如下:
$ sqlplus /nolog

SQL> connect / as sysdba
SQL> create index OPQTYPE_IDX1 on OPQTYPE$(TYPE,BITAND (FLAGS, 2));
SQL> execute dbms_stats.gather_table_stats ('SYS', 'OPQTYPE$');
按照MOS提供的解决方法,在OPQTYPE$表建立相关索引之后,exp导出速度变为正常。
总结:
这个案例给我们的启发是当发生故障时,需要多角度的考察多个环节,然后借助MOS工具从而快速地解决问题。

你可能感兴趣的:(oracle)