han_dongwei

1. PLSQL程序开发总结

1. PLSQL程序优化原则

1.1 导致性能问题的内在原因

导致系统性能出现问题从系统底层分析也就是如下几个原因：

l CPU占用率过高，资源争用导致等待

l 内存使用率过高，内存不足需要磁盘虚拟内存

l IO占用率过高，磁盘访问需要等待

1.2 PLSQL优化的核心思想

PLSQL优化实际上就是避免出现“导致性能问题的内在原因”，实际上编写程序，以及性能问题跟踪应该本着这个核心思想去考虑和解决问题。

l PLSQL程序占用CPU的情况

n 系统解析SQL语句执行，会消耗CPU的使用

n 运算（计算）会消耗CPU的使用

l PLSQL程序占用内存的情况

n 读写数据都需要访问内存

n 内存不足时，也会使用磁盘

l PLSQL程序增大IO的情况

n 读写数据都需要访问磁盘IO

n 读取的数据越多，IO就越大

大家都知道CPU现在都很高，计算速度非常快；访问内存的速度也很快；但磁盘的访问相对前两个相比速度就差的非常大了，因此PLSQL性能优化的重点也就是减少IO的瓶颈，换句话说就是尽量减少IO的访问。

性能的优先级CPU->内存->IO，影响性能的因素依次递增。根据上面的分析，PLSQL优化的核心思想为：

1. 避免过多复杂的SQL脚本，减少系统的解析过程

2. 避免过多的无用的计算，例如：死循环

3. 避免浪费内存空间没有必要的SQL脚本，导致内存不足

4. 内存中计算和访问速度很快

5. 尽可能的减少磁盘的访问的数据量，该原则是PLSQL优化中重要思想。

6. 尽可能的减少磁盘的访问的次数，该原则是PLSQL优化中重要思想。

下面的章节具体介绍常见影响性能的SQL语句情况。

1.3 ORACLE优化器

ORACLE的优化器：
a. RULE (基于规则) b. COST (基于成本) c.CHOOSE (选择性)

设置缺省的优化器,可以通过对init.ora文件中OPTIMIZER_MODE参数的各种声明,如RULE,COST,CHOOSE,ALL_ROWS,FIRST_ROWS . 你当然也在SQL句级或是会话(session)级对其进行覆盖.

为了使用基于成本的优化器(CBO, Cost-Based Optimizer) , 你必须经常运行analyze 命令,以增加数据库中的对象统计信息(object statistics)的准确性.

如果数据库的优化器模式设置为选择性(CHOOSE),那么实际的优化器模式将和是否运行过analyze命令有关. 如果table已经被analyze过, 优化器模式将自动成为CBO , 反之,数据库将采用RULE形式的优化器.

在缺省情况下,ORACLE采用CHOOSE优化器, 为了避免那些不必要的全表扫描(full table scan) , 你必须尽量避免使用CHOOSE优化器,而直接采用基于规则或者基于成本的优化器.

在oracle10g前默认的优化模式是CHOOSE，10g默认是ALL_ROWS，我不建议大家去改动ORACLE的默认优化模式。

1.4 PLSQL优化

主要说明了在SQL编写上和PLSQL程序编写上可以优化的地方。

1.4.1 选择最有效率的表名顺序

只在基于规则的优化器rule中有效，目前我们oracle选择的优化器基本都不选择rule，因此该问题基本不会出现，但为了安全和规范起见，建议编程习惯采用该规则。

ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表 drivingtable)将被最先处理. 在FROM子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表.当ORACLE处理多个表时, 会运用排序及合并的方式连接它们.首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并.

例如:

表 ac01有 16,384 条记录
表 ab01 有1 条记录

选择ab01作为基础表 (好的方法)
select count(*) from ac01,ab01 执行时间0.96秒

选择ac01作为基础表 (不好的方法)
select count(*) from ab01,ac01 执行时间26.09秒

1.4.2 WHERE子句中的连接顺序

ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前

例如:

(低效)
SELECT ab01.aab001,ab02.aab051
FROM ab01,ab02
WHERE ab02.aae140=’31’
AND ab01.aab001=ab02.aab001;

(高效)
SELECT ab01.aab001,ab02.aab051
FROM ab01,ab02
WHERE ab01.aab001=ab02.aab001
AND ab02.aae140=’31’;

1.4.3 SELECT子句中避免使用 ‘ * ‘

当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用 ‘*' 是一个方便的方法.不幸的是,这是一个非常低效的方法. 实际上,ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间。

1.4.4 用EXISTS替代IN

实际情况看，使用exists替换in效果不是很明显，基本一样。

在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率.

低效:

SELECT *
FROM ac01

Where aac001 in (select aac001 from ac02 whereaab001=str_aab001 and aae140=’31’);

或

SELECT *
FROM ac01

Where aac001 in (select distinct aac001 from ac02where aab001=str_aab001 and aae140=’31’);

注意使用distinct也会影响速度

高效:

SELECT *
FROM ac01

Where exists (select 1from ac02 where aac001=ac01.aac001 and aab001=str_aab001 and aae140=’31’);

in的常量列表是优化的(例如：aab019 in (‘20’,’30’))，不用exists替换；in列表相当于or

1.4.5 用NOT EXISTS替代NOT IN

Oracle在10g之前版本not in都是最低效的语句，虽然在10g上not in做到了一些改进，但仍然还是存在一些问题，因此我们一定要使用not exists来替代not in的写法。

在子查询中,NOT IN子句将执行一个内部的排序和合并. 无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历). 为了避免使用NOT IN ,我们可以把它改写成NOT EXISTS.

例如:

SELECT *
FROM ac01
WHERE aab001 NOT IN (SELECT aab001 from ab01 where aab020=’100’);

为了提高效率.改写为:
SELECT *
FROM ac01
WHERE not exists (SELECT 1 from ab01 where aab001=ac01.aab001 and aab020=’100’);

1.4.6 用表连接替换EXISTS

在子查询的表和主表查询是多对一的情况，一般采用表连接的方式比EXISTS更有效率。

例如：

低效：

SELECT ac01.*
FROM ac01
Where exists (select 1 from ac02
                      whereaac001=ac01.aac001
                        andaab001=ac01.aab001
                        and aae140='31'
                        andaae041='200801');

高效：
SELECT ac01.*
FROM ac02,ac01
Where ac02.aac001=ac01.aac001
and ac02.aab001=ac01.aab001
and ac02.aae140='31'
and aae041='200801';

到底exists和表关联哪种效率高，其实是根据两个表之间的数据量差别大小是有关的，如果差别不大实际上速度基本差不多。

1.4.7 用EXISTS替换DISTINCT

当提交一个包含一对多表信息(比如个人基本信息表和个人参保信息表)的查询时,避免在SELECT子句中使用DISTINCT.一般可以考虑用EXISTS替换

例如:

低效:

select distinct ac01.aac001
from ac02,ac01
where ac02.aac001 = ac01.aac001
and ac02.aae140='31'
and ac01.aab001='100100';

高效:

select ac01.aac001
from ac01
where exists(select 1 from ac02 where aac001 = ac01.aac001
and aae140='31')
and ac01.aab001='100100';

EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。因此如果不是特别研究和追求速度的话（例如：数据转换），查询一个表的数据需要关联其他表的这种情况查询，建议采用EXISTS的方式。

1.4.8 减少对表的查询

该问题是我们编程中出现过的问题，请大家一定注意，并且该类问题优化可以带来较大性能的提升。

例如:

低效
cursor cur_kc24_mz is

Select akc260

from kc24

where akb020 =str_akb020

and aka130=’11’;

cursor cur_kc24_zy is

Select akc260

from kc24

where akb020 =str_akb020

and aka130=’21’;

for rec_mz incur_kc24_mz loop

门诊处理…..

end loop;

for rec_mz in cur_kc24_zy loop

住院处理…..

end loop;

高效
cursor cur_kc24 is

Select akc260,aka130

from kc24

where akb020 =str_akb020

and aka130 in (’11’,’21’);

for rec_kc24 in cur_kc24 loop

if rec_kc24.aka130=’11’ then

门诊处理…..

end if;

if rec_kc24.aka130=’21’ then

住院处理…..

end if;

end loop;

高效的做法使用同样的条件（或者说是索引）只访问一次磁盘，低效的做法访问了2次磁盘，这样速度差别将近2倍。

1.4.9 避免循环（游标）里面嵌查询

游标里面不能嵌入查询(或者再嵌游标)，其实也不能有update delete等语句，只能有insert语句。但在实际的编程情况下是不可能完全避免的，但我们一定要尽量避免。该类问题也是我们程序中出现过的问题，该类问题也可以大大提升程序效率，请大家一定注意。

例如：

低效：

Cursor cur_ac04 is

Select aac001,akc010

From ac04

Where aab001= prm_aab001;

……

For rec_ac04 in cur_ac04 loop

Select aac008

Into str_aac008

from ac01

where aac001=rec_ac04.aac001;

if str_aac008=’1’ then

n_jfje := rec_ac04.akc010*0.08;

end if;

if str_aac008=’2’ then

n_jfje := rec_ac04.akc010*0.1;

end if;

End loop;

高效：

Cursor cur_ac04 is

Select ac01.aac001,ac04.akc010,ac01.aac008

From ac04,ac01

Where ac04.aac001=ac01.aac001

and aab001= prm_aab001;

……

For rec_ac04 in cur_ac04 loop

if rec.aac008=’1’ then

n_jfje := rec_ac04.akc010*0.08;

end if;

if rec.aac008=’2’ then

n_jfje := rec_ac04.akc010*0.1;

end if;

end loop;

优化的方法是尽量把游标循环中的查询语句放到游标查询中一起查询出来，这样相当于只访问了1次磁盘读到内存；如果放到游标中的话，假如游标有100万数据量，那么程序需要100万次磁盘，可以想象浪费了多少IO的访问。

如果在程序编写上没有办法避免游标中有查询语句的话（一般情况是可以避免的），那么也要保证游标中的查询使用的索引（即查询速度非常快），例如：游标100万数据量，游标中的查询语句执行需要0.02秒，从这个速度上来说是很快的，但总体上看100万*0.02秒=2万秒=5小时33分钟，如果写一个不够优化的语句需要1秒，那么需要几天能执行完呢？

1.4.10 尽量用union all替换union

Union会去掉重复的记录，会有排序的动作，会浪费时间。因此在没有重复记录的情况下或可以允许有重复记录的话，要尽量采用union all来关联。

1.4.11 使用DECODE函数来减少处理时间

使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表.

例如:

（低效)
select count(1) from ac01 where aab001=’100001’and aac008=’1’;
select count(1) from ac01 where aab001=’100001’and aac008=’2’;
（低效)

Select count(1),aac008

From ac01

Where aab001=’100001’

and aac008 in (’1’,’2’)

group by aac008;

（高效）
select count(decode(aac008,’1’,’1’,null)) zz,

count(decode(aac008,’2’,’1’,null))tx

from ac01

where aab001=’100001’;

特别说明：

group by和order by 都会影响性能，编程时尽量避免没有必要的分组和排序，或者通过其他的有效的编程办法去替换，比如上面的处理办法。

1.4.12 group by优化

Group by需要查询后排序，速度慢影响性能，如果查询数据量大，并且分组复杂，这样的查询语句在性能上是有问题的。

尽量避免使用分组或者采用上面的一节的办法去代替。

采用group by的也一定要进行优化。

例如：

低效

selectac04.aac001,ac01.aac002,ac01.aac003,sum(aac040),ac01.aab001
from ac04,ac01
where ac04.aac001=ac01.aac001 andac01.aab001='1000000370'
group byac04.aac001,ac01.aac002,ac01.aac003,ac01.aab001;

高效：

selectac04.aac001,ac01.aac002,ac01.aac003,gzze,ac01.aab001
from (select aac001,sum(aac040) gzzefrom ac04 group by aac001) ac04,ac01
where ac04.aac001=ac01.aac001
and aab001='1000000370';

1.4.13 尽量避免用order by

Order by需要查询后排序，速度慢影响性能，如果查询数据量大，排序的时间就很长。但我们也不能避免不使用，这样大家一定注意一点的是如果使用order by那么排序的列表必须符合索引，这样在速度上会得到很大的提升。

1.4.14 用Where子句替换HAVING子句

避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作. 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销.

例如:

低效:
SELECT aac008,count(1)
FROM ac01
GROUP BY aac008
HAVING aac008 in (‘1’,’2’);

高效
SELECT aac008,count(1)
FROM ac01

Where aac008 in(‘1’,’2’)
GROUP BY aac008 ;

HAVING 中的条件一般用于对一些集合函数的比较,如COUNT() 等等. 除此而外,一般的条件应该写在WHERE子句中

1.4.15 使用表的别名(Alias)

当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误.

1.4.16 删除重复记录

一般数据转换的程序经常会使用到该方法。

最高效的删除重复记录方法 (因为使用了ROWID)

DELETE FROM ac01 a
WHERE a.rowid > (SELECT MIN(b.rowid)
FROM ac01 b
WHERE a.aac002=b.aac002

and a.aac003=b.aac003 );

1.4.17 COMMIT使用

数据转换的程序需要关注这一点。

1. Commit执行也是有时间的，不过时间特别短，但提交频率特别大，必然也会浪费时间。

2. commit可以释放资源，在大量数据更新时，必须及时提交。
a. 回滚段上用于恢复数据的信息.
b. 被程序语句获得的锁
c. redo log buffer 中的空间
d. ORACLE为管理上述3种资源中的内部花费

例如：

Cur_ac20有5000万数据

n_count :=0;

For arec in cur_ac20 loop

Insertinto ac20 ……

n_count := n_count + 1;

Ifn_count = = 100000 then --10万一提交

commit;

n_count := 0;

Endif;

End loop;

Commit;

如果1条一提交，需要提交5000万必然浪费时间；如果整体提交，资源不能释放，性能必须下降。

在实际编程时，应注意提交的次数和提交的数据量的平衡关系。

1.4.18 减少多表关联

表关联的越多，查询速度就越慢，尽量减少多个表的关联，建议表关联不要超过3个（子查询也属于表关联）。

数据转换上会存在大数据量表的关联，关联多了会影响索引的效率，可以采用建立临时表的办法，有时更能提高速度。

1.4.19 批量数据插入

数据转换时或者大业务数据插入时，有以下几种办法进行数据插入（不包括imp、impdp和sqlloader）

l Insert into …select 方式

将查询的结果一次插入到目标表中。

例如：

Insert into ac01_bakselect * from ac01;

由于是一次查询一次插入，并且最后一次提交，他的速度要比下面描述的curosr的方式速度要快。但查询插入的数据量过大必然会占用更多的内存和undo表空间，只能在插入完成后提交，这样资源不能释放，会导致回滚表空间不足和快照过旧的问题，另外一旦失败需要全部回滚。因此建议小数据量（例如：300万以下）的导入采用该种方式。

l Insert /*+append */ into … select方式

该种方式同上种方式，不过由于有append的提示，这种语句不走回滚段直接插入数据文件，速度非常快。注意系统开发编程不能使用该种方式，数据转换可以灵活使用。

l Cursor方式

定义游标，然后逐行进行插入，然后定量提交。

例如：

Cusor cur_ac20 is

Select* from ac20;

….

n_count :=0;

For rec_ac20 in cur_ac20 loop

Insertinto ac20_bak

(aac001,

…….)

Values

(rec_ac20.aac001,

….);

Ifn_count :==100000 then

Commit;

n_count :=0;

Endif;

End loop;

l 批绑定的方式

通过游标查询将数据逐行写到数组里（实际上就是内存），然后通过批绑定的语句forall … in… insert into…values…;将内存的数据一次写入到数据文件中。相比cursor的方式减少了对io的访问次数，提高了速度，但注意内存别溢出了。

1.5 索引使用优化

在实际的应用系统中索引问题导致性能问题可能能占到80%，在程序优化上索引问题是需要我们特别关注的。本节主要描述什么情况索引会不生效。

1.5.1 避免在索引列上使用函数或运算

这个问题是在我们实际编程中出现过的，请大家一定注意。在索引列上使用函数或运算，查询条件都不会使用索引。

例如：

不使用索引

Select * from ka02 whereaka060=’10001000’ and to_char(aae030,’yyyymm’)=’200801’;

使用索引

Select * from ka02 whereaka060=’10001000’ andaae030=to_date(’200801’,’yyyymm’);

不使用索引

Select * from ka02 whereaka060=’10001000’ and aae031+1=sysdate;

使用索引

Select * from ac04 whereaac001=’10001000’ and aae031=sysdate-1;

如果一定要对使用函数的列启用索引, ORACLE新的功能: 基于函数的索引(Function-BasedIndex)

CREATE INDEX IDX_KA02_AKA066 ON KA02 (UPPER(AKA066)); /*建立基于函数的索引*/

SELECT * FROM KA02 WHERE UPPER(AKA066) = ‘ASPL’; /*将使用索引*/

不是极特殊情况，建议不要使用。

1.5.2 避免改变索引列的类型.

索引列的条件如果类型不匹配，则不能使用索引。

例如：

不使用索引

Select * from ac01 where aac001=10001000;

使用索引

Select * from ac01 where aac001=’10001000’;

1.5.3 避免在索引列上使用NOT

避免在索引列上使用NOT,NOT不会使查询条件使用索引。对于!=这样的判断也是不能使用索引的，索引只能告诉你什么存在于表中, 而不能告诉你什么不存在于表中

例如:

低效: (这里,不使用索引)

select *

From ac02

Where not aab019=’10’;

高效: (这里,使用了索引)
select *

From ac02

Where aab019 in(’20’,’30’);

1.5.4 用>=替代>

虽然效果不是特别明显，但建议采用这种方式

低效:

SELECT *
FROM ab01
WHERE aab019 > ‘10’

高效:

SELECT *
FROM ab01
WHERE aab019 >=’20’

两者的区别在于, 前者DBMS首先定位到aab019=10的记录并且向前扫描到第一个aab019大于10的记录,而后者DBMS将直接跳到第一个aab019等于10的记录

1.5.5 避免在索引列上使用IS NULL和IS NOT NULL

对于索引列使用is null或is not null不会使用上索引．因为空值不存在于索引列中,所以WHERE子句中对索引列进行空值比较将使ORACLE停用该索引.

举例:

低效: (索引失效)

select * from ab01 where aab019 is not null;

高效: (索引有效)

select * from ab01 where aab019 in(‘10’,’20’,’30’);

在实际开发中，对于这类的问题很难避免，如果不是特别影响速度或者要求速度的，可以忽略。

1.5.6 带通配符（%）的like语句

%在常量前面索引就不会使用。

例如：

不使用索引

Select * from ac01 where aac002 like ‘%210104’;

Select * from ac01 where aac002 like ‘%210104%’;

使用索引

Select * from ac01 where aac002 like ‘210104%’;

1.5.7 总是使用索引的第一个列

如果索引是建立在多个列上, 只有在它的第一个列被where子句引用时,优化器才会选择使用该索引。

例如：

Ac02的复合索引：aac001、aae140、aae041

Select * from ac02 where aae140=’31’ and aae041=’200801’; --不会使用索引

Select * from ac02 where aac001=’10001000’; --可以使用索引

如果不使用索引第一列基本上不会使用索引，使用索引要按照索引的顺序使用，另外使用复合索引的列越多，查询的速度就越快

1.5.8 多个平等的索引

当SQL语句的执行路径可以使用分布在多个表上的多个索引时, ORACLE会同时使用多个索引并在运行时对它们的记录进行合并, 检索出仅对全部索引有效的记录.

在ORACLE选择执行路径时,唯一性索引的等级高于非唯一性索引. 然而这个规则只有

当WHERE子句中索引列和常量比较才有效.如果索引列和其他表的索引类相比较. 这种子句在优化器中的等级是非常低的.

如果不同表中两个相同等级的索引将被引用, FROM子句中表的顺序将决定哪个会被率先使用. FROM子句中最后的表的索引将有最高的优先级.

如果同一表中有两个相同等级的索引被引用，oracle会分析最有效的索引去引用，其他的索引不会使用，如果这些相同等级的索引效果差不多，oracle可能会自动合并进行使用。

1.5.9 不明确的索引等级

当ORACLE无法判断索引的等级高低差别,优化器将只使用一个索引,它就是在WHERE子句中被列在最前面的.

1.5.10 自动选择索引

如果表中有两个以上（包括两个）索引，其中有一个唯一性索引，而其他是非唯一性．

在这种情况下，ORACLE将使用唯一性索引而完全忽略非唯一性索引．

1.5.11 使用提示(Hints)

对于表的访问,可以使用两种Hints. FULL 和 ROWID
FULL hint 告诉ORACLE使用全表扫描的方式访问指定表.

例如:

SELECT /*+ FULL(AC01) */ *
FROM AC01
WHERE AAC001 = ‘10001000’;

如果一个大表没有被设定为缓存(CACHED)表而你希望它的数据在查询结束是仍然停留
在SGA中,你就可以使用CACHE hint 来告诉优化器把数据保留在SGA中. 通常CACHE hint 和 FULL hint 一起使用.

例如:

SELECT /*+ FULL(AC01) CACHE(AC01)*/ *
FROM AC01;

ROWID hint 告诉ORACLE使用TABLE ACCESSBY ROWID的操作访问表.
采用TABLE ACCESSBY ROWID的方式特别是当访问大表的时候,使用这种方式, 你需要知道ROIWD的值或者使用索引.

索引hint 告诉ORACLE使用基于索引的扫描方式. 你不必说明具体的索引名称

例如:

SELECT /*+index(IDX_AC01_AAC002)*/ aac001
FROM AC01
WHERE aac002='2101111111111111111';

在不使用hint的情况下, 以上的查询应该也会使用索引,然而,如果该索引的重复值过多而你的优化器是CBO, 优化器就可能忽略索引. 在这种情况下, 你可以用INDEX hint强制ORACLE使用该索引.

ORACLE hints 还包括ALL_ROWS,FIRST_ROWS, RULE,USE_NL, USE_MERGE, USE_HASH 等等.

使用hint , 表示我们对ORACLE优化器缺省的执行路径不满意,需要手工修改.
这是一个很有技巧性的工作. 除非特定的情况，例如：数据转换，其他情况最好不用.

1.5.12 表上存在过旧的分析

我们现在很多项目都存在性能问题，其中有很多种情况都是由于分析过旧导致ORACLE判断索引级别和资源成本上出现问题，会导致ORACLE判断错误不使用索引。我个人觉得这是ORACLE不够完善的地方。

解决办法：

第一种办法：删除分析，停止oracle10g的自动分析，但不使用分析，oracle访问数据的CPU消耗就过大。

第二种办法：重新分析，但过长时间后，索引是否会再次失效，没有验证过。

1.5.13 表上存在并行

表上存在并行，ORACLE判断索引级别和资源成本上出现问题，会导致ORACLE判断错误不使用索引。

这个问题我不知道有什么好的处理办法，从现场实际应用速度角度比较，我还是选择去掉并行，因为不使用索引进行全表扫描肯定是不能忍受的。

1.5.14 关于索引建立

索引的使用是肯定会大大提高查询的速度，但索引其实也是一种数据，它也是存放的用户类型的表空间下的，索引建立的越多越大，占用的空间也越大，从用户的环境来说这也不是问题，但如果一个表有过多过大的查询，必然会影响insert、delete和update索引列的速度，因为这些操作改变了整个表的索引顺序，oracle需要进行调整，这样性能就下降了。因此我们一定要合理的建立好有效的索引，编程也要符合索引的规则，而不能是索引符合编程的规则。

案例：

某项目数据转换，采用游标循环insert的方式，总共2000万的数据，总共用了4个小时，原因就是目标表里面有很多索引。解决方法是先删除索引再执行转换脚本，结果不用1小时就完成了，建立全部的索引不到半个小时。

原因就是第一种方式每次insert都改变索引顺序，共执行改变2000万次，而第二种方式整体上执行索引顺序就一次。

2. PLSQL程序性能问题分析方法

本章主要介绍怎样找到出现性能问题PLSQL程序或语句的方法。

2.1 性能问题分析

出现性能问题，我先要从整体进行分析，一般总体上会有几种现象：

l 整个系统运行速度都慢

n 在业务不忙的时候，所有模块都慢

n 只有在业务繁忙的时候，所有模块都慢

n 时快时慢

l 个别业务模块运行速度慢

n 在业务不忙的时候，该模块就慢

n 只有在业务繁忙的时候，该模块才慢

n 时快时慢

一般导致系统性能慢的因素：

l 硬件：客户端、服务器CPU、内存和存储设备配置不符合应用系统要求

l 网络：网速低、丢包

l 操作系统参数设置：参数设置不合理

l 受到其他软件干扰：例如：防火墙、病毒

l Weblogic设置：参数设置不合理

l Oracle设置：内存、表空间、redolog、系统参数设置不合理等

l PLSQL程序：plsql不优化、未使用索引、锁表

在不同现象下，可能导致性能问题的因素：

1. 一般来说，如果在不办理业务的情况下，整个系统性能就慢的话，应该和PLSQL程序优化是没有关系的。可能的因素为硬件、网络、操作系统、其他软件干扰、ORACLE设置。

2. 只有在业务繁忙的时候，整体系统性能都慢，有可能的因素有硬件、操作系统设置、WEBLOGIC设置、ORACLE设置、PLSQL程序。如果在sqlplus下做查询都慢，那么就和weblogic没有关系。

3. 一般来说，如果在不办理业务的情况下，个别业务模块速度就慢的话，那么基本上就是PLSQL程序不优化或未使用索引造成的。

4. 只有在业务繁忙的时候，个别模块慢，有可能的因素有硬件、操作系统设置、WEBLOGIC设置、ORACLE设置、PLSQL程序、锁表。

这里我们重点是说明PLSQL优化、索引优化的问题，其他例如：硬件、网络、操作系统和oracle设置等因素我们不进行说明。

PLSQL优化、索引不使用的问题产生的影响：

1. 对于某段不优化的程序或语句频繁或者全表扫描一个表时，它访问磁盘的时间和占用的吞吐量是很高的，这就导致系统IO长时间处于忙的状态，导致整个系统性能下降。

2. 对于某段不优化的程序或语句频繁或者全表扫描一个表时，其他的业务程序也访问同一个表时，速度将大大下降。

3. 如果是更新表操作时间长，还可能会导致锁等待，导致会话堵塞，weblogic端也出现压力问题，导致这个系统性能下降。

我们一般根据这些现象、以及一些方法判断，来初步分析产生性能问题的大致原因的范围。不过对于这一点，还是比较困难的，因为产生问题的原因是多种的，并且还有一定的关联。下面的章节介绍我们已经断定是PLSQL优化、索引不使用的问题，我们通过什么方法来具体定位问题。

2.2 Expain Plan分析索引使用

在PL/SQLDeveloper等工具有一个ExpainPlan分析的功能，这个功能可以帮助我们分析SQL语句是否使用了索引、使用哪些索引和使用索引的效果。

1. 选择explain plan的窗口

2. 在上面栏中输入SQL语句，然后点击工具栏上的EXECUTE执行（或按F8），就会在下面显示Optmizergoal优化器的默认方式（也可手工选择），以及下面的解释计划，从解释计划上能看到哪个条件语句使用了索引，哪个没有使用；哪个表使用了索引，使用了哪个索引，哪些表是全表扫描的(TABLE ACCESS FULL)

3. 分析内容说明：

l COST：根据优化程序的基于开销的方法所估计出的操作开销值对于使用基于规则方法的语句该列为空该列值没有特定的测量单位它只是一个用于比较执行规划开销大小的权重值

l Cardinality：根据基于开销的方法对操作所访问行数的估计值

l Bytes：根据基于开销的方法对操作所访问字节的估计

l 通过设置，我们还能看到更多的信息，例如：CPU使用、时间等等

全表扫描的(TABLEACCESS FULL)肯定是速度慢的，如果是大数据量的表，那么这个语句是绝对影响性能的。

另外使用了索引也不一定性能就高，因为索引使用也有效率的情况，下面列出索引常见的使用类型：

1. INDEX UNIQUE SCAN：唯一索引扫描，速度最快

2. INDEX RANGE SCAN：范围索引扫描，使用这个索引时，就需要看COST、Cardinality、Bytes的大小了，如果特别大，有时候还可能速度低于全表扫描的速度。

我们在知道语句有问题，或者我们对语句进行优化时，这个工具是非常有用的。

2.3 TOPSQL分析

程序有性能问题的时候，我们是不知道哪些语句存在性能的问题，尤其你不是开发人员。幸好有一些工具可以帮助我们找到这些存在性能问题的语句。

Toad工具和ORACLE9I的企业管理控制台工具可以捕获到这些问题语句（oracle10g中em的功能不够好）。在TOAD和ORACLE9I工具中可以查询到TOPSQL顶级SQL的内容，通过CPU、IO吞吐量、占用时间等信息的排序，我们可以找到最影响系统性能的语句，通过分析我们可以看到这些语句的解释计划。

根据解释计划，我们可以进行语句的优化，我们知道语句后，我们通过plsql的搜索功能就知道存在问题语句的程序了。

这个办法使用有个前提条件就是这些问题语句在系统上运行过，并且没有间隔过长的时间，因此最好是在实际出现性能问题的ORACLE上不断的去监控，才能捕获到最全的问题语句。

1. ORACLE9i企业管理控制台工具的topsql

2. 系统运行中的所有TOPSQL

3. 分析具体的SQL语句

4. Sql分析的解释计划

2.4 针对性语句搜索

TOPSQL分析也只能是找到未使用索引的语句（实际上这一点基本就足够解决性能的问题了），但是对于2.4章节中的很多内容，没有办法进行捕获。

我们可以采用针对性语句搜索，来尽量找到一些问题语句进行优化。在PLSQL工具中有一个Find DBObject的功能，可以进行搜索。

我们可以搜索的关键特征信息：

l NOT IN

l UNION

l GROUP BY

l ORDER BY

l > 、 < 、<>

l Like ‘%

l From tab 、Update tab、delete tab，其中tab是数据量特别大的表，我们可以针对性的检查对大表访问的语句（例如：ac20、ab09、kc22、kc24等）。

这种办法很有局限性，不过也是一种检查代码的办法。

2.5 后台存储过程跟踪

以上的各种办法，基本都不能检查出类似2.4.8和2.4.9等问题，当我们不能通过整体上去发现问题的时候，我们对有性能问题程序直接进行后台的跟踪，有时候往往是最有效的。

2.6 性能监控

用户的生产运行环境，数据库一般都是UNIX系统的小机。我们会在操作系统级上进行监控和ORACLE的session上进行监控。

UNIX下监控性能的命令：

1. topas可以观察CPU、内存、IO的使用，不过该命令不是所有的UNIX都通用

2. vmstat可以观察CPU和内存的使用情况。例如：vmstat 1

3. iostat可以观察IO的使用情况。例如：iostat 1

4. ps aux | head -25查看cpu占用最高的进程

5. 查询内存使用最高的进行命令：top

6. 查看oracle进程命令：ps –ef|greporacle

7.        通过ps找到进程的pid，我们也可以执行下面的语句查看进程具体运行的SQL语句的文本：
SELECT /*+ ORDERED */ sql_text FROM v$sqltext a
WHERE (a.hash_value, a.address) IN (
         SELECT DECODE(sql_hash_value,0, prev_hash_value,sql_hash_value),
               DECODE (sql_hash_value,0, prev_sql_addr, sql_address)
            FROM v$sessionb
         WHERE b.paddr = (SELECTaddr
                             FROMv$process c
                          WHERE c.spid ='&pid'))
ORDER BY piece ASC

3. 性能测试工具设计思想

3.1 开发工具的目的

现在所有解决程序上的性能问题的办法，大部分都是在系统运行后的解决办法，我们想制作一个工具，该工具在开发阶段和测试阶段就可以直接找到存在问题的程序语句。这样可以大大提高程序上的风险，也可以提高代码检查和性能测试的工作量。

3.2 总体设计思想

对后台存储过程的程序文件进行遍历扫描，对SQL语句进行检查。

实现的功能：

1. 检查程序中的SQL语句是否使用索引

2. 查询具有特征的关键字的SQL语句。例如：NOT IN

3. 检查游标中嵌入游标或查询的语句

4. 检查列上使用了函数、运算的语句

5. 检查超过3个表以上的关联语句

6. 检查同一个表多次访问（不容易实现）

3.2.1 读取文件

逐行进行读取

3.2.2 捕获SQL语句

遇到SQL关键字开始记录，直到遇到“；”为止

建立分析表做保存

记录包体名、过程名、简略SQL、详细SQL、是否循环中

简略SQL：

l SQL去掉回车换行

l 截取前100个字符

3.2.3 SQL语句分析

3.2.4 设置关键字

你可能感兴趣的:(DBOperation)

递归应用判断是否循环引用驾驭人生 c#
vardata=await_IDBInstance.DBOperation.QueryAsync(sql); //向上查询引用公式 ListGetSonNode(longid,ListnodeList,Listpath=null) { if(path==null) { path=newList(); }
c#缓存机制，用于大批量连接数据库的性能优化,可减少对数据库的消耗。 __如影
publicvoidFrmReceive_Load(objectsender,EventArgse)//初始化加载{SqlDependency.Start(_connectionString);ModuleId=DBOperation.GetMouduleId(DbHelper,"废水");DataProcessing.ParamList=GetDataList(ModuleId);}public
模型使用（数据库的连接） GHope
创建项目进入已经配置好的Django项目虚拟环境，创建名为dbOperation的项目（win+r输入：cmd-->进入win窗口），再进入项目目录为其创建应用关键命令：activate激活虚拟环境django-adminstartprojectdbOperation创建Django项目dbOperationpythonmanage.pystartappapp为dbOperation创建应用app
用C#与数据库实现MySchoolBase系统老明宇. C#
下面是自己用C#写的一个使用数据库实现MySchoolBase系统管理（大神勿喷，初学者以借鉴为主）一共分为三个类分别是：Program（启动类），DBOperation（操作语句类），SchoolManager（显示语句类）代码部分（如下）：既然使用了数据库那么using还是要记得导入的呦：usingSystem.Data.SqlClient;usingSystem.Data;Program（启
在线程池中的使用spring aop事务增强 filozofio
问题描述：在项目里使用了线程池运行同一个类的实例方法，代码大致如下，运行时发现job方法的事务不生效@TransactionalpublicvoiddoJob(){EXECOTOR.execute(()->job());}@Transactionalpublicvoidjob(){//dboperation}原因分析：debug进入job方法时，发现运行job方法的实例是个普通实例而不是个代理对象
iPhone中的Sqlite3数据库操作 wonderzl C++c sqlite C#
可将数据库操作写入一个类，这样用起来也很方便。例如： #import <Foundation/Foundation.h> #import <sqlite3.h> @interface DBOperation : NSObject { sqlite3 *readableDB; sqlite3 *wri
jsp学习笔记（六） nwj2010 java DAO sql jsp bean
package bean; import java.util.ArrayList; import dao.DBOperation; /** * 用户业务处理类 */ public class UserBean { /** * 获得登入用户信息</p&
jsp学习笔记（五） nwj2010 java DAO sql bean jsp
package bean; import java.util.ArrayList; import DAO.DBOperation; /** * 书籍的业务类 */ public class BookBean { /** * 添加、删除、更新书籍 */ public boolean addDelUpdate(String sql){ DBO
jsp学习笔记（四） nwj2010 DAO sql jsp J#
package DAO; import java.sql.*; import java.util.ArrayList; public class DBOperation { private Connection conn = null; private Statement st = null; private Prepared
已知圆弧的一些信息,求得圆弧上中间点的坐标的方法(C++语言描述) 老马驿站
已知圆弧的一些信息,求得圆弧上中间点的坐标的方法(C++语言描述)//从圆弧一些信息得到圆弧上一个特殊的点(计算的是二维图形的情况)Point3d DBOPERATION::GetArcTangencyPoint(Point3d pStartPoint, Point3d pEndPoint, Point3d pCent
通过 servletContext 得到数据源，进而得到connection hongmin118 java sql Web servlet jdbc
DBOperation： package com.community.util; import java.sql.PreparedStatement; import java.sql.SQLException; import javax.servlet.ServletContext; import org.slf4j.Logger; import org.slf4j.Logge
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts