mysql中left join的误解及笛卡尔积解释

首先,说下自己一直以来的误区:
left join(左外连接)查询,已左表A为基础表,关联右表B查询,最多只会返回A表里面满足条件的记录。
这种想法是错误的,返回的记录条数和两表的关联条件有关。

比如:

select   A.id,A.name,B.id,B.name   from  A  left   join  B   on   A.name = B.name 

如果name在关联表B中不是唯一字段(唯一字段,可以直接用来确定唯一的一条记录的字段,比如主键),
那么返回的结果可能多于A表中满足条件的记录。

究其原因,只要是关联查询,首先都是进行笛卡尔积,然后根据连接条件和where条件进行条件过滤
如果只是对查询结果的单表进行统计,一定要记得对结果进行去重.
示例:2.1
mysql中left join的误解及笛卡尔积解释_第1张图片
可以看到,由于B表中张三关联2个职位,所以尽管是通过A表进行左外关联查询,但是最后实际查询的结果,却大于A表中实际满足条件的记录数。

所以,通过关联查询来进行数据统计的时候,一定要记得去重。

比如查询经理职位的用户的id集合:

select distinct A.id A left join B on A.name = B.name and b.zhiwei = ‘经理’

示例:2.1
Select * From A left join B on A.aid = B.bid;
mysql中left join的误解及笛卡尔积解释_第2张图片

left join是以A表的记录为基础的,A可以看成左表,B可以看成右表,left join是以左表为准的。 换句话说,左表A的记录将会全部表示出来,而右表B只会显示符合搜索条件的记录(例子中为: A.aid = B.bid),B表记录不足的地方均为NULL.

A表所有记录都会显示,A表中没有被匹配的行(如aid=5、6的行)相应内容则为NULL。
返回的记录数一定大于A表的记录数,如A表中aid=7行被B表匹配了3次(因为B表有三行bid=7)。
注意:在Access中A.aid、B.bid不能缩写成aid、bid,否则会提示“不支持链接表达式”,这一点不同于Where查询

笛卡尔积
如果A表有20条记录,B表有30条记录,则二者关联后的笛卡尔积工20*30=600条记实录。也就是说A表中的每条记录都会于B表的所有记录关联一次,三种关联方式实际上就是对“笛卡尔积”的处理方式不同。

你可能感兴趣的:(数据库)