Union和Union All的区别

假设我们有一个表Student,包括以下字段与数据:

drop table student;

create table student
(
id int primary key,
name nvarchar2(50) not null,
score number not null
);

insert into student values(1,'Aaron',78);
insert into student values(2,'Bill',76);
insert into student values(3,'Cindy',89);
insert into student values(4,'Damon',90);
insert into student values(5,'Ella',73);
insert into student values(6,'Frado',61);
insert into student values(7,'Gill',99);
insert into student values(8,'Hellen',56);
insert into student values(9,'Ivan',93);
insert into student values(10,'Jay',90);
commit;

首先,我们来看一下UNION的例子:

SQL> select *
  2  from student
  3  where id<4
  4  union
  5  select *
  6  from student
  7  where id>2 and id<6
  8  ;


        ID NAME                                SCORE
---------- ------------------------------ ----------
         1 Aaron                                  78
         2 Bill                                   76
         3 Cindy                                  89
         4 Damon                                  90
         5 Ella                                   73


SQL>

如果换成Union All连接两个结果集,则结果如下:

SQL> select *
  2  from student
  3  where id<4
  4  union all
  5  select *
  6  from student
  7  where id>2 and id<6
  8  ;


        ID NAME                                SCORE
---------- ------------------------------ ----------
         1 Aaron                                  78
         2 Bill                                   76
         3 Cindy                                  89
         3 Cindy                                  89

         4 Damon                                  90
         5 Ella                                   73
6 rows selected.

可以看到,Union和Union All的区别之一在于对重复结果的处理。

 

接下来,我们交换一个两个SELECT语句的顺序,看看结果是怎样的。


SQL> select *
  2  from student
  3  where id>2 and id<6
  4  union
  5  select *
  6  from student
  7  where id<4
  8  ;


        ID NAME                                SCORE
---------- ------------------------------ ----------
         1 Aaron                                  78
         2 Bill                                   76
         3 Cindy                                  89
         4 Damon                                  90
         5 Ella                                   73


SQL> select *
  2  from student
  3  where id>2 and id<6
  4  union all
  5  select *
  6  from student
  7  where id<4
  8  ;


        ID NAME                                SCORE
---------- ------------------------------ ----------
         3 Cindy                                  89
         4 Damon                                  90
         5 Ella                                   73
         1 Aaron                                  78
         2 Bill                                   76
         3 Cindy                                  89
6 rows selected.

可以看到,对于UNION来说,交换两个SELECT语句的顺序后结果仍然是一样的,这是因为UNION会自动排序。而UNION ALL在交换了SELECT语句的顺序后结果则不相同,因为UNION ALL不会对结果自动进行排序。

 

那么这个自动排序的规则是什么呢?我们交换一下SELECT后面选择字段的顺序(前面使用SELECT *相当于SELECT ID,NAME,SCORE),看看结果如何:


SQL> select score,id,name
  2  from student
  3  where id<4
  4  union
  5  select score,id,name
  6  from student
  7  where id>2 and id<6
  8  ;
     SCORE         ID NAME
---------- ---------- ------------------------------
        73          5 Ella
        76          2 Bill
        78          1 Aaron
        89          3 Cindy
        90          4 Damon

可是看到,此时是按照字段SCORE来对结果进行排序的(前面SELECT *的时候是按照ID进行排序的)。

 

那么有人会问,如果我想自行控制排序,能不能使用ORDER BY呢?当然可以。不过在写法上有需要注意的地方:


select score,id,name
from student
where id > 2 and id < 7
union
select score,id,name
from student
where id < 4
union
select score,id,name
from student
where id > 8
order by id desc

order by子句必须写在最后一个结果集里,并且其排序规则将改变操作后的排序结果。对于Union、Union All、Intersect、Minus都有效。

 

其他的集合操作符,如Intersect和Minus的操作和Union基本一致,这里一起总结一下:

 

Union,对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序

Union All,对两个结果集进行并集操作,包括重复行,不进行排序;

Intersect,对两个结果集进行交集操作,不包括重复行,同时进行默认规则的排序;

Minus,对两个结果集进行差操作,不包括重复行,同时进行默认规则的排序。

 

可以在最后一个结果集中指定Order by子句改变排序方式。


你可能感兴趣的:(Union和Union All的区别)