connect by 是结构化查询中用到的,其基本语法是:
select ... from tablename start with 条件1
connect by 条件2
where 条件3;
例:
select level,empno,ename,job,mgr from emp
start with empno=7566 or empno=7788
connect by prior empno=mgr;
简单说来是将一个树状结构存储在一张表里,比如一个表中存在两个字段:
org_id,parent_id那么通过表示每一条记录的parent是谁,就可以形成一个树状结构。
用上述语法的查询可以取得这棵树的所有记录。
其中:
条件1 是根结点的限定语句,也可以放在CONNECT BY后面。它后面所跟的就是递归的种子,也就是递归开始的地方;当然可以放宽限定条件,以取得多个根结点,实际就是多棵树。
条件2 是连接条件,其中用PRIOR表示上一条记录,比如 CONNECT BY PRIOR org_id = parent_id就是说上一条记录的org_id 是本条记录的parent_id,即本记录的父亲是上一条记录。
条件3 是过滤条件,用于对返回的所有记录进行过滤。
简单介绍如下:
早扫描树结构表时,需要依此访问树结构的每个节点,一个节点只能访问一次,其访问的步骤如下:
第一步:从根节点开始;
第二步:访问该节点;
第三步:判断该节点有无未被访问的子节点,若有,则转向它最左侧的未被访问的子节,并执行第二步,否则执行第四步;
第四步:若该节点为根节点,则访问完毕,否则执行第五步;
第五步:返回到该节点的父节点,并执行第三步骤。
扫描整个树结构的过程也即是顺序遍历树的过程。
树结构的数据存放在表中,数据之间的层次关系即父子关系,通过表中的列与列间的关系来描述,如EMP表中的EMPNO和MGR。EMPNO表示该雇员的编号,MGR表示领导该雇员的人的编号,即子节点的MGR值等于父节点的EMPNO值。在表的每一行中都有一个表示父节点的MGR(除根节点外),通过每个节点的父节点,就可以确定整个树结构。
在SELECT命令中使用CONNECT BY 和START WITH 子句可以查询表中的树型结构关系。其命令格式如下:
SELECT 。。。 CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2} [START WITH];
其中:CONNECT BY子句说明每行数据将是按层次顺序检索,并规定将表中的数据连入树型结构的关系中。PRIORY运算符必须放置在连接关系的两列中某一个的前面。对于节点间的父子关系,PRIOR运算符在一侧表示父节点,在另一侧表示子节点,从而确定查找树结构是的顺序是自顶向下还是自底向上。在连接关系中,除了可以使用列名外,还允许使用列表达式。START WITH 子句为可选项,用来标识哪个节点作为查找树型结构的根节点。若该子句被省略,则表示所有满足查询条件的行作为根节点。
START WITH: 不但可以指定一个根节点,还可以指定多个根节点。 指定多个根节点可以用or。
运算符PRIOR被放置于等号前后的位置,决定着查询时的检索顺序。 PRIOR后的字段也指定一个开始的节点;PRIOR在等号哪侧,哪侧是根节点/父节点。
若prior缺省,则只能查询到符合条件的起始行,并不进行递归查询;
PRIOR被置于CONNECT BY子句中等号的前面时,则强制从根节点到叶节点的顺序检索,即由父节点向子节点方向通过树结构,我们称之为自顶向下的方式。如:
SCOTT@bys1>select level,empno,ename,job,mgr from emp start with empno=7566 or empno=7788 connect by prior empno=mgr;
SCOTT@bys1>select level,empno,ename,job,mgr from emp connect by prior empno=mgr start with empno=7566 or empno=7788;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
1 7788 SCOTT ANALYST 7566
2 7876 ADAMS CLERK 7788
1 7566 JONES MANAGER 7839
2 7788 SCOTT ANALYST 7566
3 7876 ADAMS CLERK 7788
2 7902 FORD ANALYST 7566
3 7369 SMITH CLERK 7902
PIROR运算符被置于CONNECT BY 子句中等号的后面时,则强制从叶节点到根节点的顺序检索,即由子节点向父节点方向通过树结构,我们称之为自底向上的方式。例如:
SCOTT@bys1>select level,empno,ename,job,mgr from emp start with empno=7788 connect by empno=priormgr;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
1 7788 SCOTT ANALYST 7566
2 7566 JONES MANAGER 7839
3 7839 KING PRESIDENT
在自顶向下查询树结构时,不但可以从根节点开始,还可以定义任何节点为起始节点,以此开始向下查找。这样查找的结果就是以该节点为开始的结构树的一枝。
在具有树结构的表中,每一行数据都是树结构中的一个节点,由于节点所处的层次位置不同,所以每行记录都可以有一个层号。层号根据节点与根节点的距离确定。不论从哪个节点开始,该起始根节点的层号始终为1,根节点的子节点为2, 依此类推。
在对树结构进行查询时,可以去掉表中的某些行,也可以剪掉树中的一个分支,使用WHERE子句来限定树型结构中的单个节点,以去掉树中的单个节点,但它却不影响其后代节点(自顶向下检索时)或前辈节点(自底向顶检索时)。
象在其它查询中一样,在树结构查询中也可以使用ORDER BY 子句,改变查询结果的显示顺序,而不必按照遍历树结构的顺序
借用一张图:
从图中可以看到,使用WHERE字句删除的只是单个节点,节点下的树结构依然存在。
而在CONNECT BY中通过增加条件,可以删除节点及节点下的树结构。
如下两条SQL语句:
SCOTT@bys1>select level,empno,ename,job,mgr from emp start with mgr is null connect by prior empno=mgr;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
1 7839 KING PRESIDENT
2 7566 JONES MANAGER 7839
3 7788 SCOTT ANALYST 7566
4 7876 ADAMS CLERK 7788
3 7902 FORD ANALYST 7566
4 7369 SMITH CLERK 7902
2 7698 BLAKE MANAGER 7839
3 7499 ALLEN SALESMAN 7698
3 7521 WARD SALESMAN 7698
3 7654 MARTIN SALESMAN 7698
3 7844 TURNER SALESMAN 7698
3 7900 JAMES CLERK 7698
2 7782 CLARK MANAGER 7839
3 7934 MILLER CLERK 7782
使用WHERE过滤,可以看到empno=7788的行没显示,empno=7788行的子节点显示了
SCOTT@bys1>select level,empno,ename,job,mgr from emp where empno!=7566 start with mgr is null connect by prior empno=mgr;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
1 7839 KING PRESIDENT
3 7788 SCOTT ANALYST 7566
4 7876 ADAMS CLERK 7788
3 7902 FORD ANALYST 7566
4 7369 SMITH CLERK 7902
2 7698 BLAKE MANAGER 7839
3 7499 ALLEN SALESMAN 7698
3 7521 WARD SALESMAN 7698
3 7654 MARTIN SALESMAN 7698
3 7844 TURNER SALESMAN 7698
3 7900 JAMES CLERK 7698
2 7782 CLARK MANAGER 7839
3 7934 MILLER CLERK 7782
13 rows selected.
可以用WHERE过滤年根节点的7839 KING,其它子节点的员工可以显示。
SCOTT@bys1>select level,empno,ename,job,mgr from emp where empno!=7839 start with mgr is null connect by prior empno=mgr;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
2 7566 JONES MANAGER 7839
3 7788 SCOTT ANALYST 7566
4 7876 ADAMS CLERK 7788
3 7902 FORD ANALYST 7566
4 7369 SMITH CLERK 7902
2 7698 BLAKE MANAGER 7839
3 7499 ALLEN SALESMAN 7698
3 7521 WARD SALESMAN 7698
3 7654 MARTIN SALESMAN 7698
3 7844 TURNER SALESMAN 7698
3 7900 JAMES CLERK 7698
2 7782 CLARK MANAGER 7839
3 7934 MILLER CLERK 7782
13 rows selected.
使用CONNECT BY中的条件,empno!=7566;将此条数据和属于它的子节点都过滤了。
SCOTT@bys1>select level,empno,ename,job,mgr from emp start with mgr is null connect by prior empno=mgr andempno!=7566;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
1 7839 KING PRESIDENT
2 7698 BLAKE MANAGER 7839
3 7499 ALLEN SALESMAN 7698
3 7521 WARD SALESMAN 7698
3 7654 MARTIN SALESMAN 7698
3 7844 TURNER SALESMAN 7698
3 7900 JAMES CLERK 7698
2 7782 CLARK MANAGER 7839
3 7934 MILLER CLERK 7782
9 rows selected.
使用CONNECT BY中的条件,empno!=7839;来过滤7839 KING,发现并没有将此节点及所有子节点过滤。--可能是都过滤了语句就没意义了。
SCOTT@bys1>select level,empno,ename,job,mgr from emp start with mgr is null connect by prior empno=mgr and empno!=7839;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
1 7839 KING PRESIDENT
2 7566 JONES MANAGER 7839
3 7788 SCOTT ANALYST 7566
4 7876 ADAMS CLERK 7788
3 7902 FORD ANALYST 7566
4 7369 SMITH CLERK 7902
2 7698 BLAKE MANAGER 7839
3 7499 ALLEN SALESMAN 7698
3 7521 WARD SALESMAN 7698
3 7654 MARTIN SALESMAN 7698
3 7844 TURNER SALESMAN 7698
3 7900 JAMES CLERK 7698
2 7782 CLARK MANAGER 7839
3 7934 MILLER CLERK 7782
14 rows selected.
三、关于层次查询的执行计划和性能探讨
有的文档中说到层次查询会多次访问表来执行递归查询。通过执行下面两条SQL语句及执行计划来看,执行计划并没有多次访问。---是语句不够复杂?
在CONNECT BY中加入过滤条件,从执行计划可以看到执行一次全表扫描,然后用CONNECT BY中过滤条件进行过滤。
BYS@bys1>select level,empno,ename,job,mgr from scott.emp start with mgr is null connect by prior empno=mgr and empno!=7839;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
1 7839 KING PRESIDENT
2 7566 JONES MANAGER 7839
3 7788 SCOTT ANALYST 7566
4 7876 ADAMS CLERK 7788
3 7902 FORD ANALYST 7566
4 7369 SMITH CLERK 7902
2 7698 BLAKE MANAGER 7839
3 7499 ALLEN SALESMAN 7698
3 7521 WARD SALESMAN 7698
3 7654 MARTIN SALESMAN 7698
3 7844 TURNER SALESMAN 7698
3 7900 JAMES CLERK 7698
2 7782 CLARK MANAGER 7839
3 7934 MILLER CLERK 7782
14 rows selected.
Elapsed: 00:00:00.01
Execution Plan
----------------------------------------------------------
Plan hash value: 763482334
------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 14 | 546 | 4 (25)| 00:00:01 |
|* 1 | CONNECT BY NO FILTERING WITH START-WITH| | | | | |
| 2 | TABLE ACCESS FULL | EMP | 14 | 308 | 3 (0)| 00:00:01 |
------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - access("MGR"=PRIOR "EMPNO")
filter("EMPNO"<>7839 AND "MGR" IS NULL)
Statistics
----------------------------------------------------------
0 recursive calls
0 db block gets
7 consistent gets
0 physical reads
0 redo size
1032 bytes sent via SQL*Net to client
419 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
2 sorts (memory)
0 sorts (disk)
14 rows processed
从执行计划可以看到执行一次全表扫描,然后用CONNECT BY中过滤条件进行过滤,再用WHERE中条件过滤。
BYS@bys1>select level,empno,ename,job,mgr from scott.emp where empno!=7839 start with mgr is null connect by prior empno=mgr;
LEVEL EMPNO ENAME JOB MGR
---------- ---------- ---------- --------- ----------
2 7566 JONES MANAGER 7839
3 7788 SCOTT ANALYST 7566
4 7876 ADAMS CLERK 7788
3 7902 FORD ANALYST 7566
4 7369 SMITH CLERK 7902
2 7698 BLAKE MANAGER 7839
3 7499 ALLEN SALESMAN 7698
3 7521 WARD SALESMAN 7698
3 7654 MARTIN SALESMAN 7698
3 7844 TURNER SALESMAN 7698
3 7900 JAMES CLERK 7698
2 7782 CLARK MANAGER 7839
3 7934 MILLER CLERK 7782
13 rows selected.
Elapsed: 00:00:00.01
Execution Plan
----------------------------------------------------------
Plan hash value: 3008947215
-------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
-------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 14 | 546 | 4 (25)| 00:00:01 |
|* 1 | FILTER | | | | | |
|* 2 | CONNECT BY NO FILTERING WITH START-WITH| | | | | |
| 3 | TABLE ACCESS FULL | EMP | 14 | 308 | 3 (0)| 00:00:01 |
-------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("EMPNO"<>7839)
2 - access("MGR"=PRIOR "EMPNO")
filter("MGR" IS NULL)
Statistics
----------------------------------------------------------
1 recursive calls
0 db block gets
7 consistent gets
0 physical reads
0 redo size
1004 bytes sent via SQL*Net to client
419 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
2 sorts (memory)
0 sorts (disk)
13 rows processed