3.增删改查--连接查询

关系型数据库的一个特点就是,多张表之间存在关系,以致于我们可以连接多张表进行查询操作,所以连接查询会是关系型数据库中最常见的操作。

连接查询主要分为三种,交叉连接、内连接和外连接,我们一个个说。

1、交叉连接

交叉连接其实连接查询的第一个阶段,它简单表现为两张表的笛卡尔积形式,具体例子:


如果你没学过数学中的笛卡尔积概念,你可以这样简单的理解这里的交叉连接:

两张表的交叉连接就是一个连接合并的过程,T1 表中的每一行会分别与 T2 表的每一行做一个组合连接并单独生成一行。例如 T1 的第一行会与 T2 的第一行合并生成一行,会与 T2 的第二行再合并生成一行,T2 的第三行合并生成一行,接着再以 T1 的第二行为基础重复上述动作。

应该不难理解,我们看实现交叉连接的语法是什么样的。

交叉连接使用关键字 CROSS JOIN 进行连接,例如:

select * from table1 cross join table2

也可以按照 ANSI SQL:1989 规范中指定的,使用逗号进行交叉连接,例如:

select* from table1,table2

通过交叉连接,我们可以两张表的数据进行一个结合,但是你会发现同时也产生了很多冗余的垃圾数据行,所以我们往往也会结合 where 子句对结果集进行一个条件筛选

例如我们有这么两张表:

Students表:


departs 表:


如果我们现在需要查询一个学生的学院信息,我们就需要连接两个表,而我们的交叉连接会为我们产生太多冗余数据行,我们可以使用 where 子句对笛卡尔积后的结果集进行一个条件筛选。

select * from students,departs where students.departId = departs.id

这样就过滤了那些冗余的垃圾数据行,得到我们需要的有效数据。

但是我们仍然需要说一下,虽然交叉连接允许结合 where 子句过滤冗余数据,但是笛卡尔积本身就造成了很大的资源消耗,对于这种情况,内连接会有更好效率体现,同样能实现该需求。

总归一句,笛卡尔积式的交叉连接谨慎使用。

2、内连接

内连接也可以理解为条件连接,它使用关键字 INNER JOIN 连接两张表并使用 ON 筛选器筛选组合合适的数据行。基本语法如下:

select * from table1 inner join table2 on [条件]

我们同样以上述的 students 和 departs 表举例子,看这条 SQL:

select * from students inner join departs on Students.departId = departs.id;

会得到同样的结果:

我们也说了,虽然交叉连接也实现同样的效果,但实现原理是不同的,效率也是不一样的。交叉连接通过笛卡尔积返回结果集再结合 where 子句剔除冗余数据行,而内连接的 ON 筛选器工作在笛卡尔积过程中,只有符合条件才能合并生成新的数据行。

这两者的效率是不同的,内连接的效率显然是大于等于交叉连接的,所以我们也建议了尽量使用内连接取代交叉连接的使用。

3、外连接

我们说内连接主要是两个步骤的结合,笛卡尔积加 ON 筛选器,一般情况下也是内连接使用的最为频繁。外连接其实是基于内连接的两个步骤,额外新增了另一个步骤,进一步苛刻化查询操作,我们依然以上述的学生表和学院表营造这么一个场景:

我们的学生表中保存了学生的个人信息以及所属的学院外键编号,假设其中有部分学生的学院还未分配,即为NULL。

那么我现在需要查询出所有的学生及其所属部门信息,包括那些未知学院信息的学生,请问你怎么做?

这个问题的核心点在于,我不仅要满足连接条件成功合并的数据行,还要那些未成功匹配的行,也就是说学生表的所有行都得出现。

使用左外连接即可实现:

我们改一下 students 表中数据,departs 表中数据不变:


我们执行 SQL :

select * from students left outer join departs on students.departId = departs.id;

得到结果:

你看,左连接相当于以左表为基准,成功连接匹配的就列出其对应的学院信息,不能匹配的就填充为 NULL。

当然,如果你想以右表为基准,你可以使用右连接,关键词 right outer join/on。

除此之外,还有一种全外连接,这种模式下没有以谁为基准,两边表的所有行都得出现。我们举个例子:

两边的表都在看,自己哪些行成功的条件匹配了,哪些没有,没有成功匹配的行会在最后强制出现,未匹配的字段赋值为 NULL。

这就是外连接的本质,希望你理解了。

你可能感兴趣的:(3.增删改查--连接查询)