Expert Oracle Database Architecture学习笔记
死锁的头号原因:不加索引的外键(第6章.锁)
据Tom的经验,导致死锁的头号原因是外键未加索引,第二号原因是表上的位图索引遭到并发更新。在以下两种情况下,Oracle在修改父表后会对子表加一个全表锁:
·如果更新了父表的主键(倘若遵循关系数据库的原则,即主键应当是不可变的,这种情况就很少见。)由于外键上没有索引,所以子表会被锁住。
·如果删除了父表中的一行,整个子表也会被锁住(由于外键上没有索引,比如:如果EMP表有DEPT的一个外键,而且在EMP表的DEPTNO列上没有任何索引,那么更新DEPT时整个EMP表都会被锁定)。
在Oracle9i及以上的版本中,这些全表锁都是短期的,他们仅在DML操作期间存在,而不是在整个事务的期间都存在。即使如此,这些全表锁还是可能(而且确实会)导致很严重的锁定问题。
因为在关系数据库中,更新主键是一个很大的禁忌,所以在更新主键方面一般没有什么问题。但是如果开发人员用工具生成SQL,而且这些工具会更新每一列,此时更新主键就会成为一个严重的问题。
删除父表中的一行可能导致子表被锁住,由此产生的问题更多。如:
create table p(x int primary key);
Table created.
create table c(x reference p);
Table created.
如果删除p表中的一行,则在DML操作期间,子表c就会被锁定,这样可以避免事务期间对c执行其他更新(当然,这里有一个前提,即没有人在修改c,如果确实已经有人在修改c,删除会等待)。此时就会出现阻塞和死锁问题。通过锁定整个表c,数据库的并发性就会大幅下降,以至于没有人能够修改c中的任何内容。另外,出现死锁的可能性则增大了。
Tom说,如果有人抱怨说数据库中存在死锁,他会让他们运行一个脚本,察看是否存在未加索引的外键,而且99%的情况下都会发现表中的确存在这个问题。只需对外键加索引,死锁(以及大量其他的竞争问题)都会烟消云散。下面的例子展示了如何使用这个脚本来找出表c中未加索引的外键。
ops$tkyte@ORA10G> column columns format a30 word_wrapped
ops$tkyte@ORA10G> column tablename format a15 word_wrapped
ops$tkyte@ORA10G> column constraint_name format a15 word_wrapped
ops$tkyte@ORA10G> select table_name, constraint_name,
2 cname1 || nvl2(cname2,','||cname2,null) ||
3 nvl2(cname3,','||cname3,null) || nvl2(cname4,','||cname4,null) ||
4 nvl2(cname5,','||cname5,null) || nvl2(cname6,','||cname6,null) ||
5 nvl2(cname7,','||cname7,null) || nvl2(cname8,','||cname8,null)
6 columns
7 from ( select b.table_name,
8 b.constraint_name,
9 max(decode( position, 1, column_name, null )) cname1,
10 max(decode( position, 2, column_name, null )) cname2,
11 max(decode( position, 3, column_name, null )) cname3,
12 max(decode( position, 4, column_name, null )) cname4,
13 max(decode( position, 5, column_name, null )) cname5,
14 max(decode( position, 6, column_name, null )) cname6,
15 max(decode( position, 7, column_name, null )) cname7,
16 max(decode( position, 8, column_name, null )) cname8,
17 count(*) col_cnt
18 from (select substr(table_name,1,30) table_name,
19 substr(constraint_name,1,30) constraint_name,
20 substr(column_name,1,30) column_name,
21 position
22 from user_cons_columns ) a,
23 user_constraints b
24 where a.constraint_name = b.constraint_name
25 and b.constraint_type = 'R'
26 group by b.table_name, b.constraint_name
27 ) cons
28 where col_cnt > ALL
29 ( select count(*)
30 from user_ind_columns i
31 where i.table_name = cons.table_name
32 and i.column_name in (cname1, cname2, cname3, cname4,
33 cname5, cname6, cname7, cname8 )
34 and i.column_position <= cons.col_cnt
35 group by i.index_name
36 )
37 /
TABLE_NAME CONSTRAINT_NAME COLUMNS
------------------------------ --------------- ------------------------------
C SYS_C009485 X
这个脚本将最多处理8列外键约束(如果你的外键有更多的列,可能就得重新考虑一下你的设计了)
除了全表锁外,在以下情况下,未加索引的外键也可能带来问题:
·如果有on delete cascade,而且没有对子表加索引:例如,emp是dept的子表,delete deptno=10应该cascade(级联)至emp。如果emp中的deptno没有索引,那么删除dept表中的每一行时都会对emp做一次全表扫描。这个全表扫描可能是不必要的,而且如果从父表删除多行,父表中每删除一行就要扫描仪一次子表。
·从父表查询子表:在此考虑emp/dept例子。利用deptno查询emp表是相当常见的。如果频繁地运行以下查询,你就会发现没有索引会使查询速度变慢:
select * from dept, emp
where emp.deptno=dept.deptno and dept.deptno=:x;
所以,要特表注意是否需要对外键加索引,防止出现这种Oracle“过分地锁定了”数据的情况。