SQL是建立在关系型数据库基础上的一种语言。关系型数据库的典型数据结构就是数据表,这些数据表的组成都是结构化的(Structured)。可以把关系模型理解成一个二维表格模型,这个二维表格是由行(row)和列(column)组成的。每一个行就是一条数据,每一列就是数据在某一维度的属性。
正是因为在数据库中,表的组成是基于关系模型的,所以一个表就是一个关系。一个数据库中可以包括多个表,也就是存在多种数据之间的关系。而我们之所以能使用SQL语言对各个数据表进行复杂查询,核心就在于连接,它可以用一条SELECT语句在多张表之间进行查询。可以理解为,关系型数据库的核心之一就是连接。
SQL有两个主要的标准,不同的标准连接操作也是不同的。分别是SQL92和SQL99。92和99代表了标准提出的时间。
笛卡尔乘积是一个数学运算。假设我有两个集合X和Y,那么X和Y的笛卡尔积就是X和Y的所有可能组合,也就是第一个对象来自于X,第二个对象来自于Y的所有可能。
我们假定player表的数据是集合X,先进行SQL查询,再假定team表的数据为集合Y,同样需要进行SQL查询。接着我们再来看一下两张表的笛卡尔积的结果。
SELECT * FROM player; // 37条
SELECT * FROM team; // 3条
SELECT * FROM player, team; // 37*3=111条
笛卡尔积也称为交叉连接,英文是CROSS JOIN,它的作用就是可以把任意表进行连接,即使这两张表不相关。但我们通常进行连接还是需要筛选的,因此你需要在连接后面加上WHERE子句,也就是作为过滤条件对连接数据进行筛选。比如后面要讲到的等值连接。
两张表的等值连接就是用两张表中都存在的列进行连接。我们也可以对多张表进行等值连接。针对player表和team表都存在team_id这一列,我们可以用等值连接进行查询。
SQL:SELECT player_id, t1.team_id, player_name, height, team_name FROM player AS t1, team AS t2 WHERE t1.team_id = t2.team_id;
需要注意的是,如果我们使用了表的别名,在查询字段中就只能使用别名进行代替,不能使用原有的表名,不然会报错。
当我们进行多表查询的时候,如果连接多个表的条件是等号时,就是等值连接,其他的运算符连接就是非等值查询。
除了查询满足条件的记录以外,外连接还可以查询某一方不满足条件的记录。两张表的外连接,会有一张是主表,另一张是从表。如果是多张表的外连接,那么第一张表是主表,即显示全部的行,而剩下的表则显示对应连接的信息。在SQL92中采用(+)表示从表所在的位置,而在SQL92中,只有左外连接和右外连接,没有全外连接。
什么是左外连接,什么是右外连接呢?
SQL:SELECT * FROM player, team WHERE player.team_id = team.team_id(+);
相当于SQL99中的:
SQL:SELECT * FROM player LEFT JOIN team ON player.team_id = team.team_id;
SQL:SELECT * FROM player, team WHERE player.team_id(+) = team.team_id;
相当于SQL99中的:
SQL:SELECT * FROM player RIGHT JOIN team ON player.team_id = team.team_id;
自连接可以对多个表进行操作,也可以对同一个表进行操作。也就是说查询条件使用了当前表的字段。比如我们想要查看比布雷克·格里芬高的球员都有谁,以及他们的对应身高:
SQL:SELECT b.player_name, b.height FROM player as a , player as b WHERE a.player_name = '布雷克-格里芬' and a.height < b.height;
如果不用自连接的话,需要采用两次SQL查询。首先需要查询布雷克·格里芬的身高。
SQL:SELECT height FROM player WHERE player_name = '布雷克-格里芬';
运行结果为2.08。
然后再查询比2.08高的球员都有准,以及他们的对应身高:
SQL:SELECT player_name, height FROM player WHERE height > 2.08;
运行结果和采用自连接的运行结果是一致的。
SQL92和SQL99是经典的SQL标准,也分别叫做SQL-2和SQL-3标准。也正是在这两个标准发布之后,SQL影响力越来越大,甚至超越了数据库领域。现如今SQL已经不仅仅是数据库领域的主流语言,还是信息领域中信息处理的主流语言。在图形检索、图像检索以及语音检索中都能看到SQL语言的使用。
除此以外,我们使用的主流RDBMS,比如MySQL、Oracle、SQL Server、DB2、PostgreSQL等都支持SQL语言,也就是说它们的使用符合大部分SQL标准,但很难完全符合,因为这些数据库管理系统都在SQL语言的基础上,根据自身产品的特点进行了扩充。即使这样,SQL语言也是目前所有语言中半衰期最长的,在1992年,Windows3.1发布,SQL92标准也同时发布,如今我们早已不使用Windows3.1操作系统,而SQL92标准却一直延续至今。