【SQL 必知必会】- 第十一课 使用子查询

目录

子查询

利用子查询进行过滤

格式化SQL

只能是单列

子查询和性能

作为计算字段使用子查询

注意:完全限定列名

提示:不止一种解决方案


子查询

        SELECT 语句是SQL 的查询。我们迄今为止所看到的所有SELECT 语句都是简单查询,即从单个数据库表中检索数据的单条语句。

        SQL 还允许创建子查询(subquery),即嵌套在其他查询中的查询。


利用子查询进行过滤

SELECT cust_id
FROM Orders
WHERE order_num IN (SELECT order_num
                    FROM OrderItems
                    WHERE prod_id = 'RGAN01');

        在SELECT 语句中,子查询总是从内向外处理。在处理上面的SELECT 语句时,DBMS 实际上执行了两个操作。

        首先,它执行下面的查询:

SELECT order_num FROM orderitems WHERE prod_id='RGAN01'

        此查询返回两个订单号:20007 和20008。然后,这两个值以IN 操作符要求的逗号分隔的格式传递给外部查询的WHERE 子句。外部查询变成:

SELECT cust_id FROM orders WHERE order_num IN (20007,20008)

格式化SQL

        包含子查询的SELECT 语句难以阅读和调试,它们在较为复杂时更是如此。如上所示,把子查询分解为多行并进行适当的缩进,能极大地简化子查询的使用。

        顺便一提,这就是颜色编码起作用的地方,好的DBMS 客户端正是出于这个原因使用了颜色代码SQL。

        可见,在WHERE 子句中使用子查询能够编写出功能很强且很灵活的SQL语句。对于能嵌套的子查询的数目没有限制,不过在实际使用时由于性能的限制,不能嵌套太多的子查询。


只能是单列

        作为子查询的SELECT 语句只能查询单个列。企图检索多个列将返回错误。

SELECT cust_id
FROM Orders
WHERE order_num IN (SELECT order_num, order_id
                    FROM OrderItems
                    WHERE prod_id = 'RGAN01');

        上述的语句就会发生错误,在子查询中出现了两个列,但是外层查询的条件只有一个列,不匹配导致错误的发生,想要匹配两个列可以这么写:

SELECT cust_id
FROM Orders
WHERE order_num IN (SELECT order_num
                    FROM OrderItems
                    WHERE prod_id = 'RGAN01')
AND   order_id IN (SELECT order_id
                    FROM OrderItems
                    WHERE prod_id = 'RGAN01');

子查询和性能

        这里给出的代码有效,并且获得了所需的结果。但是,使用子查询并不总是执行这类数据检索的最有效方法。更多的论述,请参阅第12课,其中将再次给出这个例子。


作为计算字段使用子查询

SELECT cust_name,
        cust_state,
        (SELECT COUNT(*)
        FROM Orders
        WHERE Orders.cust_id = Customers.cust_id) AS orders
FROM Customers
ORDER BY cust_name;

        这条SELECT 语句对Customers 表中每个顾客返回三列:cust_name、cust_state 和orders。orders 是一个计算字段,它是由圆括号中的子查询建立的。该子查询对检索出的每个顾客执行一次。在此例中,该子查询执行了5 次,因为检索出了5 个顾客。

        子查询中的WHERE 子句与前面使用的WHERE 子句稍有不同,因为它使用了完全限定列名, 而不只是列名( cust_id )。它指定表名和列名(Orders.cust_id 和Customers.cust_id)。下面的WHERE 子句告诉SQL,比较Orders 表中的cust_id 和当前正从Customers 表中检索的cust_id:

WHERE Orders.cust_id = Customers.cust_id

        用一个句点分隔表名和列名,在有可能混淆列名时必须使用这种语法。在这个例子中,有两个cust_id 列:一个在Customers 中,另一个在Orders 中。如果不采用完全限定列名,DBMS 会认为要对Orders 表中的cust_id 自身进行比较。因为

SELECT COUNT(*) FROM Orders WHERE cust_id = cust_id

        总是返回Orders 表中订单的总数,而这个结果不是我们想要的:

SELECT cust_name,
    cust_state,
    (SELECT COUNT(*)
    FROM Orders
    WHERE cust_id = cust_id) AS orders
FROM Customers
ORDER BY cust_name;

        虽然子查询在构造这种SELECT语句时极有用,但必须注意限制有歧义的列。

        还可以使用表别名的形式为栏位进行区分,例如给表1别名 a,给表2别名 b,使用 a.字段 = b.字段来区分字段名称。


注意:完全限定列名

        你已经看到了为什么要使用完全限定列名,没有具体指定就会返回错误结果,因为DBMS 会误解你的意思。有时候,由于出现冲突列名而导致的歧义性,会引起DBMS 抛出错误信息。例如,WHERE 或ORDER BY 子句指定的某个列名可能会出现在多个表中。好的做法是,如果在SELECT 语句中操作多个表,就应使用完全限定列名来避免歧义。


提示:不止一种解决方案

        正如这一课前面所述,虽然这里给出的样例代码运行良好,但它并不是解决这种数据检索的最有效方法。在后面两课学习JOIN 时,我们还会遇到这个例子。

你可能感兴趣的:(SQL必知必会,sql,数据库,sql必知必会)