目录
建立的两个表如下:
多个表的连接查询一般可以通过以下两种方式实现:
(1)使用单表查询的SQL命令,在from 子句中指明连接的表名,在where 子句中指明连接的列名及连接条件。
(2)使用 join 子句 ,具体语法格式如下:
内连接查询
外连接查询
左外连接查询
右外连接查询
交叉查询
交叉查询与左外连接,右外连接的区别
1.为什么我们需要使用连接查询呢?
在日常生活中,数据往往存储在多个不同表中,当我们需要的数据存储在不同表中时,这时我们需要对多个表进行查询才能得到我们需要的数据。
当一个查询需要对多个表进行操作时称为连接查询,其中包含内连接查询,外连接查询,交叉查询和自连接查询。
为能够更清楚的了解这些查询,我们先举个例子。
首先我们先建立两张表
drop table if exists `user_profile`;
drop table if exists `question_practice_detail`;
CREATE TABLE `user_profile` (
`device_id` int NOT NULL,
`gender` varchar(14) NOT NULL,
`age` int ,
`university` varchar(32) NOT NULL,
`gpa` float,
`active_days_within_30` int
);
CREATE TABLE `question_practice_detail` (
`device_id` int NOT NULL,
`question_id`int NOT NULL,
`result` varchar(32) NOT NULL
);
INSERT INTO user_profile VALUES(2138,'male',21,'北京大学',3.4,7);
INSERT INTO user_profile VALUES(3214,'male',null,'复旦大学',4.0,15);
INSERT INTO user_profile VALUES(6543,'female',20,'北京大学',3.2,12);
INSERT INTO user_profile VALUES(2315,'female',23,'浙江大学',3.6,5);
INSERT INTO user_profile VALUES(5432,'male',25,'山东大学',3.8,20);
INSERT INTO user_profile VALUES(2131,'male',28,'山东大学',3.3,15);
INSERT INTO user_profile VALUES(4321,'male',28,'复旦大学',3.6,9);
INSERT INTO question_practice_detail VALUES(2138,111,'wrong');
INSERT INTO question_practice_detail VALUES(3214,112,'wrong');
INSERT INTO question_practice_detail VALUES(3214,113,'wrong');
INSERT INTO question_practice_detail VALUES(6543,111,'right');
INSERT INTO question_practice_detail VALUES(2315,115,'right');
INSERT INTO question_practice_detail VALUES(2315,116,'right');
INSERT INTO question_practice_detail VALUES(2315,117,'wrong');
INSERT INTO question_practice_detail VALUES(5432,118,'wrong');
INSERT INTO question_practice_detail VALUES(5432,112,'wrong');
INSERT INTO question_practice_detail VALUES(2131,114,'right');
INSERT INTO question_practice_detail VALUES(5432,113,'wrong');
用户信息表 user_profile,其中device_id指终端编号(认为每个用户有唯一的一个终端),gender指性别,age指年龄,university指用户所在的学校,gpa是该用户平均学分绩点,active_days_within_30是30天内的活跃天数。
第一行表示:用户的常用信息为使用的设备id为2138,性别为男,年龄21岁,北京大学,gpa为3.4,在过去的30天里面活跃了7天
答题情况明细表 question_practice_detail,其中question_id是题目编号,result是答题结果。
第一行表示用户的常用信息为使用的设备id为2138,在question_id为111的题目上,回答错误
例如我们要查找 device_id 为 2138 的用户信息和答题情况,我们可以使用以下语法
select a.device_id,a.gender,a.age,a.university,a.gpa,a.active_days_within_30,b.question_id,b.result
from user_profile as a , question_practice_detail as b
WHERE a.device_id = b.device_id and a.device_id = 2138
查询结果如下:
select [all | distinct] <列名> [[as] <列别名>] [ , N]
[into <新表名>]
from <表名1> [ [as] <表别名>]
[inner | left | right | full | cross] join
<表名2> [[as] <表别名2>]
on <连接条件>
[where <条件1>]
[group by <列名1> [ having <条件2>] ]
[order by [列名] [asc | desc] ]
各种参数含义:
①into表示将查询结果装入新表,<新表名>即为新表的名称。
②inner join称为内连接,用于查询满足连接条件的元组。当 join 关键字前省略连接方式时,默认为此连接。
③left join为左外连接,用于查询左边数据表的全部元组和右边数据表满足连接条件的元组,不符合连接条件的数据自动填入 null。
④right join 称为右外连接,用于查询右边数据表的全部元组和左边数据表满足连接条件的元组,不符合连接条件的数据自动填入null。
⑤full join称为全外连接,用于查询左右两边数据表中的所有元组(各只出现一 次),不符合连接条件的数据自动填入null。
⑥cross join称为交叉查询,用于将两个数据表的元组逐个匹配,生成新的元组。
接下来我们举个例子
用内连接查看所有用户信息和答题情况
select a.device_id,a.gender,a.age,a.university,a.gpa,a.active_days_within_30,b.question_id,b.result
from user_profile as a inner join question_practice_detail as b
on a.device_id = b.device_id
结果如下:
a.device_id = b.device_id 为连接条件,device_id为连接字段,当连接字段间的比较运算符为"="时,为等值连接,其他情况称为非等值连接。
于查询左边数据表的全部元组和右边数据表满足连接条件的元组,不符合连接条件的数据自动填入 null
select a.device_id,a.gender,a.age,a.university,a.gpa,a.active_days_within_30,b.question_id,b.result
from user_profile as a left join question_practice_detail as b
on a.device_id = b.device_id
对比上面的内连接我们发现,左外连接比内连接 的查询结果多了一行,为什么会多一行呢,我们接下来讲解。
连接外左查询的原理就是,将左边的表格作为匹配的初始表,对右边的表进行匹配,到匹配到满足连接条件的值( a.device_id = b.device_id)时,则右边的数据都会被返回到左边。
但是,当我们依次遍历进行匹配时,会出现一些特色情况,正如我们举的例子那样,当我们左边的表有.device_id 而右边的表没有.device_id,这时候就会自动填入null。即(于查询左边数据表的全部元组和右边数据表满足连接条件的元组,不符合连接条件的数据自动填入 null)
用于查询右边数据表的全部元组和左边数据表满足连接条件的元组,不符合连接条件的数据自动填入null。
select a.device_id,a.gender,a.age,a.university,a.gpa,a.active_days_within_30,b.question_id,b.result
from user_profile as a right join question_practice_detail as b
on a.device_id = b.device_id
原理和左外连接查询同理,匹配过程图如下:
应匹配到11条数据,我们看看结果,将结果进行对比,发现符合事实。
用于将两个数据表的元组逐个匹配,生成新的元组,所得查询结果的行数是两个数据表行数的乘积(7*11),列数是两个列表数之和(我们的代码select了字段,因此有差异),相当于两个数据表做了广义笛卡儿积运算。
原理图如下:
即依次对每个a表 的device 进行11次匹配,得到7*11个返回数据。
输出结果如下图所示:
一共返回77条查询值。
自连接查询与全外连接查询(full join)在实际中很少使用,因此不做介绍。
交叉查询相当于广义笛卡儿积运算,左,右外连接查询出来的数据是交叉查询的子集。(即查询出满足连接条件的笛卡儿积子集)