我们经常需要汇总数据而不用把它们实际检索出来。这种类型的检索例子有以下几种。
聚集函数: 运行在行组上,计算和返回单个值的函数。
AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。
SELECT AVG(prod_price) AS avg_price
FROM products;
SELECT AVG(prod_price) AS avg_price
FROM products
WHERE vend_id = 1003;
COUNT()函数可用来确定表中行的数目或符合特定条件的行的数目。COUNT()函数有两种使用方式。
SELECT COUNT(*) AS num_cust
FROM customers;
MAX()返回指定列中的最大值,要求指定列名。MAX()函数忽略列值为NULL的行。
对非数值数据使用MAX()时,如果数据按相应的列排序,则MAX()返回最后一行。
MIN()的功能和MAX()功能相反。
SUM()用来返回指定列值的和(总计)。此外,SUM()也可以用来合计计算值。
SELECT SUM(item_price*quantity) AS total_price
FROM orderitems
WHERE order_num = 20005;
SUM()函数忽略列值为NULL的行
以上5个聚集函数都可以如下使用:
SELECT AVG(DISTINCT prod_price) AS avg_price
FROM products
WHERE vend_id = 1003;
注意 ,DISTINCT必须使用列名,不能用于计算或表达式。
实际上,SELECT语句可根据需要包含多个聚集函数,比如:
SELECT COUNT(*) AS num_items, MIN(prod_price) AS price_min,
MAX(prod_price) AS price_max, AVG(prod_price) AS price_avg
FROM products;
有时我们需要把数据分为多个逻辑组,以便能对每个组进行聚集计算。分组是在SELECT语句的GROUP BY子句中建立的。下面是一个例子:
SELECT vend_id, COUNT(*) AS num_prods
FROM products
GROUP BY vend_id;
上面的GROUP BY子句指示MySQL按vend_id排序并分组数据,这导致对每个vend_id而不是整个表计算num_prods。
下面是使用GROUP BY子句的一些重要规定:
MySQL允许过滤分组,规定包括哪些分组,排除哪些分组。过滤分组需要使用HAVING子句(不能使用WHERE,因为WHERE子句过滤的是行,而不是分组)。
HAVING支持所有WHERE操作符。
下面是一个过滤分组的例子,它过滤两个以上订单的分组。
SELECT cust_id, COUNT(*) AS orders
FROM orders
GROUP BY cust_id
HAVING COUNT(*) >= 2;
HAVING与WHERE的差别: 这里有一种理解方法,WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。
也可以同时使用WHERE子句和HAVING子句。
SELECT vend_id, COUNT(*) AS num_prods
FROM products
WHERE prod_price >= 10
GROUP BY vend_id
HAVING COUNT(*) >= 2;
GROUP BY语句的输出并不一定是分组的顺序,所以,如果我们想按照某种顺序排列输出,一定要使用ORDER BY语句。
SELECT order_num, SUM(quantity*item_price) AS ordertotal
FROM orderitems
GROUP BY order_num
HAVING SUM(quantity*item_price) >= 50
ORDER BY ordertotal;