oracle in与exists的使用

关于in:

[TEST1@orcl#22-12月-10] SQL>select * from t9 where sal in (select id from t8);

      YEAR        SAL
---------- ----------
      2000         10

这个句子与下面的句子等价:

[TEST1@orcl#22-12月-10] SQL>select t9.* from t9,(select distinct id from t8) t8 where t8.id=t9.sal;

select distinct id from t8 会被使用到索引。

关于exists

[TEST1@orcl#22-12月-10] SQL>select * from t9 where exists (select id from t8 where t8.id=t9.sal);

      YEAR        SAL
---------- ----------
      2000         10

这相当于下面的句子

for v in (select * from t9) loop

    if(exists(select null from t8 where t8.id=t9.sal)) then

            output the record;

    end if;

end loop;

 

分析:

假设t8表数据量很大

那么select id from t8   将会耗费很长时间。

而select null from t8 where t8.id=t9.sal 执行速度非常快(这主要得益于t8表id列上面的索引)。

此时t1表的数据量相对较少。那么尽管select * from t9 是全表扫描,再从t8上使用索引查询,但是仍然比索引查询t9,再全表扫描t8表要快上很多。

因此可以得出exists适用于大数据量,in适用于小数据量了。

如果子查询和外表都很大,那么in和exists效率差不多。查询速度就必须依赖于其它因素了。

 

那么从上面还能得出什么结论呢?如果t8表中游空值又会发生什么事情?

其实可以从上面的语句中看出来。

 

[TEST1@orcl#23-12月-10] SQL>insert into t8 values(null);

已创建 1 行。

[TEST1@orcl#23-12月-10] SQL>insert into t9 values(2004,null);

已创建 1 行。

[TEST1@orcl#23-12月-10] SQL>commit;

提交完成。

[TEST1@orcl#23-12月-10] SQL>select * from t9 where sal in (select id from t8);

      YEAR        SAL
---------- ----------
      2000         10

[TEST1@orcl#23-12月-10] SQL>select * from t9 where exists (select id from t8);

      YEAR        SAL
---------- ----------
      2000         10
      2001         20
      2002         30
      2003         40
      2004

 

in不包含空值,而exists包含空值。


in 是把外表和内表作hash join,而exists是对外表作loop,每次loop再对内表进行查询。

一直以来认为exists比in效率高的说法是不准确的。
如果查询的两个表大小相当,那么用in和exists差别不大。

如果两个表中一个较小,一个是大表,则 子查询表大的用exists, 子查询表小的用in:

例如:表A(小表),表B(大表)
1:
select * from A where cc in (select cc from B)
效率低,用到了A表上cc列的索引;
select * from A where exists(select cc from B where cc=A.cc)
效率高,用到了B表上cc列的索引。
相反的
2:
select * from B where cc in (select cc from A)
效率高,用到了B表上cc列的索引;
select * from B where exists(select cc from A where cc=B.cc)
效率低,用到了A表上cc列的索引。
带in的关联 子查询是多余的,因为in子句和子查询中相关的操作的功能是一样的。如:
select staff_name from staff_member where staff_id in
(select staff_id from staff_func where staff_member.staff_id=staff_func.staff_id);

为非关联子查询指定exists子句是不适当的,因为这样会产生笛卡乘积。如:
select staff_name from staff_member where staff_id
exists (select staff_id from staff_func);

not in 和not exists

如果查询语句使用了not in 那么内外表都进行全表扫描,没有用到索引;
而not extsts 的子查询依然能用到表上的索引。
所以无论哪个表大,用not exists都比not in要快。

尽量不要使用not in子句。使用minus 子句都比not in 子句快,虽然使用minus子句要进行两次查询:
select staff_name from staff_member where staff_id in (select staff_id from staff_member minus select staff_id from staff_func where func_id like '81%');

in 与 "=" 的区别

select name from student where name in ('zhang','wang','li','zhao');



select name from student where name='zhang' or name='li' or name='wang' or name='zhao'

的结果是相同的。

你可能感兴趣的:(oracle in与exists的使用)