一个select语句,就是一个查询语句:
select 字段或表达式 from 数据源 where XX 条件判断;
上述select部分,from部分,where部分,往往都是一些“数据”或数据的组合;比如:
from部分,当然就是“表”,或“表的连接结果”,他们也是数据,只是通常为“表数据”;
则,这些数据部分,也可以通过一种“预先”的查询结果来代替,比如:
如果将该“select 5000”的子查询语句,替换为“select出来所有商品的平均价”,就具有了现实含义:
可见,所谓子查询,就是在一个查询语句(select语句)中的内部,某些位置,又出现的“查询语句”。
则有两个概念:
主查询:
子查询:
通常,子查询是为主查询服务的,而,通常,都是子查询获得一定的结果数据之后,才去执行主查询;
在形式上,可以有如下表达:
selelct 字段或表达式或子查询 [as 别名] from 表名或链接结果或子查询 where 字段或表达式或子查询的条件判断
即可以在这几个位置出现子查询(其中having其实也可以,因为它跟where是一样含义);
表子查询 :
一个子查询返回的结果理论上是“多行多列”的时候。此时可以当做一个“表”来使用,通常是放在from后面。
行子查询 :
一个子查询返回的结果理论上是“一行多列”的时候。此时可以当做一个“行”来使用,通常放在“行比较语法”中;
行比较语法类似这样:where row(字段1,字段2) = (select 行子查询)
列子查询 :
一个子查询返回的结果理论上是“多行一列”的时候。此时可以当做“多个值”使用,类似这种:(5, 17, 8, 22)。
标量子查询:
一个子查询返回的结果理论上是“一行一列”的时候。此时可以当做“一个单个值”使用,类似这种:select 5as c1; 或select ...where a = 17,或select ... where b > 8;即上述“单个数据值”,可以用标量子查询来代替;
作为主查询的结果数据:
select c1,(select f1 from tab2) as f11 from tab1; #这里子查询应该只有一个数据(一行一列,标量子查询)
作为主查询的条件数据:
select c1 from tab1 where c1 in (select f1 from tab2); #这里子查询可以是多个数据(多行一列,列子查询)
作为主查询的来源数据:select c1 from (select f1 as c1, f2 from tab2) as t2; #这里子查询可以是任意查询结果(表子查询)。
形式:
操作数 比较运算符 (标量子查询);
说明:
操作数,其实就是比较运算符的2个数据之一而已,通常就是一个字段名;
select .... from XXX where id > 5;
举例:
找出最高价的商品;
select * from product where price = (select max(price) from product );
以前用的in的用法:
XX in (值1,值2,值3,....);
则in子查询为:
XX in (列子查询)
举例:
找出所有类别名称中带“电”这个字的所有商品;
可以分两步思考:
select protype_id from product_type where protype_name like ‘%电%’;
结果为:
然后,将此结果,当做“in”的数据项来使用,去找出商品:
select * from product where protype_id in(
select protype_id from product_type where protype_name like ‘%电%’
);
形式:
操作数 比较运算符 any (列子查询);
含义:
当某个操作数(字段) 对于该列子查询的其中任意一个值,满足该比较运算符,则就算是满足了条件;
即:只要有一个值满足,就算是满足;
进一步解释:
假设表1(tab1)有数据为:
id, name
1 ‘aa’,
5 ‘bb’
11 ‘cc’
假设表2(tab2)有数据为:
f1 f2
3 ‘x1’
6 ‘x2’
12 ‘x3’
则:
select * from tab1 where id > any (select f1 from tab2);
则可以取出的结果数据有:
5 ‘bb’
11 ‘cc’
形式:
操作数 比较运算符 all (列子查询);
含义:
当某个操作数(字段) 对于该列子查询的所有数据值,都满足该比较运算符,才算满足了条件;
即:要求全部都满足,才算是满足;
进一步解释:
假设表1(tab1)有数据为:
id, name
1 ‘aa’,
5 ‘bb’
11 ‘cc’
假设表2(tab2)有数据为:
f1 f2
3 ‘x1’
6 ‘x2’
12 ‘x3’
则:
select * from tab2 where f1 > all ( select id from tab1 );
结果是:
12 ‘x3’
举例1:
查询出所有非最高价的商品;
思考第一步:
select price from product;
思考第二步:这些非最高价的商品的价格,只是会小于上述“所有价格”中的某一个;
select * from product where price < any ( select price from product );
举例2:
查询出所有最高价的商品;
思考:最高价的商品价格,有一个特征:大于等于“所有价格”:
select * from product where price >= all ( select price from product );
一句话:some是any的同义词。
形式:
where exists( 子查询 )
含义:
该子查询如果“有数据”,则exists的结果是true,否则就是false
说明:
因为,exists子查询的该含义,造成主查询往往出现这样的情形:要么全都取出,要么都不取出。
如果局限于这个含义(使用情形),其基本就失去了它的现实使用意义。
但:
实际应用中,该子查询,往往都不是独立的子查询,而是会需要跟“主查询”的数据源(表),建立某种关系——通常就是连接关系。建立的方式是“隐式的”,即没有在代码上体现关系,但却在内部有其连接的“实质”。
此隐式连接方式,通常就体现在子查询中的where条件语句中,使用了主查询表中的数据(字段);
举例:
查询商品表中其类别名称中带“电”这个字的所有商品;
结果就是我们想要的:
注意:
1,这种子查询语句,没法“独立存在(独立运行)”,而是必须跟主查询一起使用;
2,其他子查询,是可以独立运行的,而且会得到一个运行的结果。
3,该子查询中的条件,应该设定为跟主查询的某个字段有一定的关联性判断,通常该判断就是这两个表的“本来该有的连接条件”
最后一个结论:
如果一个查询需求,可以使用连接查询的,也可以使用子查询得到,则通常推荐使用连接插叙,效率归更高。