1.联结表 JOIN
我认为 Ligaya Turmelle 的关于SQL联合(join)语句的帖子对于新手开发者来说是份很好的材料。SQL 联合语句好像是基于集合的,用韦恩图来解释咋一看是很自然而然的。不过正如在她的帖子的回复中所说的,在测试中我发现韦恩图并不是十分的匹配SQL联合语法。
不过我还是喜欢这个观点,所以我们来看看能不能用上韦恩图。假设我们有下面两张表。表A在左边,表B在右边。我们给它们各四条记录。
id name id name
-- ---- -- ----
1 Pirate 1 Rutabaga
2 Monkey 2 Pirate
3 Ninja 3 Darth Vader
4 Spaghetti 4 Ninja
我们用过name字段用几种不同方式把这些表联合起来,看能否得到和那些漂亮的韦恩图在概念上的匹配。
SELECT * FROM TableA
INNER JOIN TableB
ON TableA.name = TableB.name
id name id name
-- ---- -- ----
1 Pirate 2 Pirate
3 Ninja 4 Ninja
|
|
内联合(inner join)只生成同时匹配表A和表B的记录集。(如下图)
SELECT * FROM TableA
FULL OUTER JOIN TableB
ON TableA.name = TableB.name
id name id name
-- ---- -- ----
1 Pirate 2 Pirate
2 Monkey null null
3 Ninja 4 Ninja
4 Spaghetti null null
null null 1 Rutabaga
null null 3 Darth Vader
全外联合(full outer join)生成表A和表B里的记录全集,包括两边都匹配的记录。如果有一边没有匹配的,缺失的这一边为null。(如下图)
SELECT * FROM TableA
LEFT OUTER JOIN TableB
ON TableA.name = TableB.name
id name id name
-- ---- -- ----
1 Pirate 2 Pirate
2 Monkey null null
3 Ninja 4 Ninja
4 Spaghetti null null
左外联合(left outer join)生成表A的所有记录,包括在表B里匹配的记录。如果没有匹配的,右边将是null。(如下图)
SELECT * FROM TableA
LEFT OUTER JOIN TableB
ON TableA.name = TableB.name
WHERE TableB.id IS null
id name id name
-- ---- -- ----
2 Monkey null null
4 Spaghetti null null
为了生成只在表A里而不在表B里的记录集,我们用同样的左外联合,然后用where语句排除我们不想要的记录。(如下图)
SELECT * FROM TableA
FULL OUTER JOIN TableB
ON TableA.name = TableB.name
WHERE TableA.id IS null
OR TableB.id IS null
id name id name
-- ---- -- ----
2 Monkey null null
4 Spaghetti null null
null null 1 Rutabaga
null null 3 Darth Vader
为了生成对于表A和表B唯一的记录集,我们用同样的全外联合,然后用where语句排除两边都不想要的记录。(如下图)
还有一种笛卡尔积或者交叉联合(cross join),据我所知不能用韦恩图表示:
SELECT * FROM TableA
CROSS JOIN TableB
这个把“所有”联接到“所有”,产生4乘4=16行,远多于原始的集合。如果你学过数学,你便知道为什么这个联合遇上大型的表很危险。
【2013-06-17 更新】下图由 Moffatt 在 2008 年制作(点击可查看大图)。PS:Jeff Atwood 的文章写于 2007 年。
2.组合查询UNION
前面的都是从一个或多个表中返回数据的单条SELECT 语句。MYSQL也允许执行多个查询(多条SELECT语句),并将结果作为单条查询结果集返回。这些组合查询通常称为 并 union 或复合查询
有两种情况需要使用组合查询
1 在单个查询中从不同的表返回累世结构的数据
2 对单个表执行多个查询,按单个查询返回数据
组合查询和多个WHERE条件 多数情况下,组合相同表的两个查询完成的工作与具有多个WHERE子句完成的工作相同,换句话说,任何具有多个WHERE子句的SELECT语句 都可以作为一个组合查询给出。
创建组合查询
可用UNION操作符来组合数条SQL查询。给出多条SELECT语句,将它们的结合组合成单个结果返回
使用UNION
使用很简单,在多条SELECT语句之间放上关键词UNION。
例如:需要价格不大于5元,但是又要包含供应商1002和1001的所有产品,(不考虑价格)
SELECT vend_id ,prod_id , prod_price FROM products WHERE prod_price <= 5
UNION
SELECT vend_id ,prod_id , prod_price FROM products WHERE vend_id IN (1001,1002)
OR语句也能实现上面的查询
SELECT vend_id ,prod_id , prod_price FROM products
WHERE prod_price <= 5 OR vend_id IN (1001,1002)
从上面这个简单的例子中,使用UNION可能比使用WHERE子句更为复杂。 但对于更复杂的过滤条件,或者从多个表而不是单个表中检索数据的情形,使用UNION肯会使处理更简单
UNION规则
正如所见,并是非常容易使用的,但在进行并时有几条规则需要注意
1 UNION必须由两条或两条以上的SELECT语句组成,语句之间用关键字UNION分隔
2 UNION中的每个查询必须包含相同的列、表达式或聚集函数(不过各列不需要以相同的次序列出)
3 列数据类型必须兼容:类型不完全相同,但不想是DBMS可以隐含滴转换的类型。
包含或取消重复的行
如果SELECT语句中返回的行相同,UNION会自动的去除重复的行。这是他的默认行为,但是如果需要,可以改变它,可以使用UNION ALL 而不是UNION
SELECT vend_id ,prod_id , prod_price FROM products WHERE prod_price <= 5
UNION ALL
SELECT vend_id ,prod_id , prod_price FROM products WHERE vend_id IN (1001,1002)
对组合查询结果排序
SELECT语句的输出用ORDER BY子句排序。在UNION组合查询时,只能使用一条ORDER BY子句,它必须出现在最后一条SELECT语句之后。
SELECT vend_id ,prod_id , prod_price FROM products WHERE prod_price <= 5
UNION ALL
SELECT vend_id ,prod_id , prod_price FROM products WHERE vend_id IN (1001,1002)
GROUP BY vend_id,prod_price;