Oracle它提供了一个强大的SQL引擎,使得用户可以通过SQL语言来管理和操作数据库。
以CAP(顾客-代理-产品)数据库为例,表结构如下:
(1)All
找出佣金百分率最小的代理商aid
select aid from agents where percent <=all (select percent from agents);
(2)in/exists 子查询
EXISTS
用于检查subquery是否至少会返回一行数据,subquery 是一个受限的 SELECT 语句 (不允许有 COMPUTE 子句和 INTO 关键字) 返回一个结果集,EXISTS
子句根据其内查询语句的结果集空或者非空,返回一个布尔值True或False。一种通俗的可以理解为:将外查询表的每一行,代入内查询作为检验,如果内查询返回的结果取非空值,则EXISTS
子句返回TRUE,这一行行可作为外查询的结果行,否则不能作为结果。
NOT EXISTS
的作用与 EXISTS
正好相反。如果子查询没有返回行,则满足了 NOT EXISTS 中的 WHERE 子句。
关系代数 π c i d ( σ p i d = ’ p 01 ’ ( O ) ) ∩ π c i d ( σ p i d = ’ p 07 ’ ( O ) ) π_{cid}(σ_{pid=’p01’}(O))∩ π_{cid}(σ{pid=’p07’}(O)) πcid(σpid=’p01’(O))∩πcid(σpid=’p07’(O))SQL语句
select distinct cid from orders x where x.pid=‘p01’ and exists (select * from orders y where x.cid=y.cid and y.pid=‘p07’);
或
select distinct x.cid from orders x,orders y where x.pid=‘p01’ and x.cid=y.cid and y.cid=‘p07’ ;
关系代数: π c i d ( O ) — π c i d ( σ a i d = ’ a 03 ’ ( O ) ) π_{cid}(O)—π_{cid}(σ_{aid=’a03’}(O)) πcid(O)—πcid(σaid=’a03’(O))SQL语句
select distinct cid from orders x where not exists (select * from orders where cid=x.cid and aid=‘a03’);
EXISTS
的查询一般能找到等价的其他查询形式,如
select distinct t.xk from bm_zyml t where not exists (select * from bm_xk s where s.mc= t.xk);
等价于
select distinct t.xk from bm_zyml t where t.xk not in (select s.mc from bm_xk s)
通常情况下采用exists
要比in
效率高,因为in
不走索引,但一般in
适合于外表大而内表小的情况,exists
适合于外表小而内表大的情况。
(3)union/except/intersect
包含了顾客所在的或代理商所在或两者皆在的城市名单:
select city from customers union select city from agents;#不含重复行
select city from customers union all select city from agents;# 含有重复行
(4)group by
每个代理商为顾客c002和c003订购产品及产品总数量:
select a.aid,aname,p.pid,pname,sum(qty)
from orders x,products p,agents a
where x.pid=p.pid and x.aid=a.aid
and x.cid in (‘c002’,’c003’)
group by a.aid,a.aname,p.pid,p.pname;
group by
后可跟多个字段
(5)having
至少两个顾客订购的产品pid:
select pid from orders
group by pid having count(distinct cid) >=2
(6)聚集函数:avg, max, min, sum, count
聚焦函数不能作为条件用在where子句中,需要与having
,group
一起使用
所有代理商的最大销售额的平均值:
select avg(select max(dollars) from orders group by aid);
删除总订货金额小于600的代理商:
delete from agents where aid in (select aid from orders group by aid having sum(dollars)<600);
例如图书馆借阅系统,表book与student结构如下:
(1)内连接
内连接查询操作列出与连接条件匹配的数据行,它使用比较运算符比较被连接列的列值。
上述SQL等价于
select * from book t, student s where t.studentid=s.studentid
(2)外连接
外连接返回到查询结果集合中的不仅包含符合连接条件的行,而且还包括左表(左外连接时)、右表(右外连接时)或两个边接表(全外连接)中的所有数据行,无匹配的显示空值。
select * from book t, student s where t.studentid(+) = s.studentid
上述SQL等价于
select * from book t, student s where t.studentid = s.studentid(+)
(3)交叉连接交叉连接不带WHERE
子句,它返回被连接的两个表所有数据行的笛卡尔积,返回到结果集合中的数据行数等于第一个表中符合查询条件的数据行数乘以第二个表中符合查询条件的数据行数。
SQL解析指的是Oracle数据库将用户提交的SQL语句转换成可以执行的代码的过程,主要包括三个阶段:分析、优化和执行。
(1)分析
(2)优化
(3)执行
SQL语句解析的过程是非常复杂和计算密集的,每个步骤都需要大量的处理和IO操作。因此,如果SQL语句不正确或不规范,它会导致解析速度缓慢甚至失败。另外,一个错误的执行计划也会导致查询效率低下或查询结果不正确。为了确保最佳的数据库性能,必须深入了解SQL语句解析的过程,并可以优化查询语句以提高查询效率。
e.g. 标准的SQL 解析顺序:
FROM
子句, 组装来自不同数据源的数据WHERE
子句, 基于指定的条件对记录进行筛选GROUP BY
子句, 将数据划分为多个分组HAVING
子句筛选分组ORDER BY
对结果集进行排序例如:在学生成绩表中 (暂记为 tb_Grade), 把 "考生姓名"内容不为空的记录按照 “考生姓名” 分组, 并且筛选分组结果, 选出 “总成绩” 大于 600 分的。
SQL 语句为:
select 考生姓名, max(总成绩) as max总成绩
from tb_Grade
where 考生姓名 is not null
group by 考生姓名
having max(总成绩) > 600
order by max总成绩
执行顺序如下:
FROM
子句, 从 tb_Grade 表组装数据源的数据WHERE
子句, 筛选 tb_Grade 表中所有数据不为 NULL 的数据GROUP BY
子句, 把 tb_Grade 表按 “学生姓名” 列进行分组max()
聚集函数, 按 “总成绩” 求出总成绩中最大的一些数值HAVING
子句, 筛选课程的总成绩大于 600 分的.ORDER BY
子句, 把最后的结果按 “Max 成绩” 进行排序Oracle hint是一种在SQL语句中使用的特殊注释,它可以告诉Oracle数据库如何执行SQL语句,从而达到最优的执行效果。
Oracle hint主要用于优化复杂的SQL查询语句,特别是当优化器无法选择最优的执行计划时。例如,当使用复杂的连接查询、子查询、聚合函数或大数据量的表时,Oracle hint通过给出提示指导优化器选择最优的执行计划,从而提高SQL语句的执行效率和性能。
Oracle hint必须写在SQL语句的SELECT、INSERT、UPDATE或DELETE语句之后,但在WHERE子句之前。
注意:如果表中指定了别名,那么Hint中也必须使用别名,否则Hint会忽略:
Select /+full(a)/ * from t a; – 使用hint
Select /*+full(t) */ * from t a; --不使用hint
(1)优化器模式提示
select /*+ALL_ROWS(t)*/* from student t Where name='WASEEM HAIDER'
select /*+FIRST_ROWS(t)*/* from student t Where name ='WASEEM HAIDER'
select /*+FIRST_ROWS(t,20)*/* from student t Where name ='WASEEM HAIDER'
ALL_ROWS
时,Oracle 会用最快的速度将SQL执行完毕,将所有结果集全部返回,在OLAP 系统中使用得比较多;ALL_ROWS
强调SQL整体的执行效率,而FIRST_ROWS(n)
强调用最快的速度返回前N行,而不管所有的结果返回的时长,可能最后一条要很长时间才能获得。
select /*+RULE(t)*/* from student t Where name ='WASEEM HAIDER'
(2)访问路径提示
select /*+FULL(t)*/* from student t Where name='WASEEM HAIDER'
select /*+INDEX(T_JBXX X)*/* from student Where name='WASEEM HAIDER'
(3)并行执行提示
select /*+PARALLEL(t,16)*/* from student t Where t.name ='WASEEM HAIDER'
这个值会覆盖表自身设定的并行度,如果这个值为default,CBO使用系统参数值。
(4)其他
Insert /*+append */ into t as select * from all_objects
提示数据库以直接加载的方式(direct load)将数据加载入库,尤其在插入大量的数据,一般都会用此hint。
此外还有表连接顺序/表关联方式提示、查询转换提示等。