PostgreSQL之SELECT...GROUP BY...HAVING

1.SELECT...GROUP BY的使用

    PostgreSQL9.3官方文档:http://www.postgres.cn/docs/9.3/sql-select.html#SQL-GROUPBY

    SELECT查询在通过了WHERE过滤器之后,生成的输出表可以继续用GROUP BY 子句进行分组,然后用HAVING子句删除一些分组行。 

SELECT select_list  
 FROM ...  
 [WHERE ...]  
 GROUP BY grouping_column_reference [, grouping_column_reference]...  
HAVING condition

    GROUP BY 子句 用于把那些在表中所列出的列上共享相同值的行聚集在一起。 这些列的列出顺序并没有什么关系。 效果是把每组共享相同值的行缩减为一个组行,它代表该组里的所有行。 这样就可以删除输出里的重复和/或计算应用于这些组的聚集。 比如:

highgo=#  create table tests1(id int primary key,name varchar,num int);
highgo=# insert into tests1 values(1,'yy',3),(2,'ws',2),(3,'yy',6);
highgo=# select * from tests1;
 id | name | num
----+------+-----
  1 | yy   |   3
  2 | ws   |   2
  3 | yy   |   6
(3 行记录)
highgo=# select name from tests1 group by name;
 name
------
 ws
 yy
(2 行记录)

    通常,如果一个表被分了组,那么没有在分组中引用的字段都不能引用,除了在聚集表达式中以外。 一个带聚集表达式的例子是: 

highgo=# select name,sum(num) from tests1 group by name;
 name | sum
------+-----
 ws   |   2
 yy   |   9
(2 行记录)

    这里的 sum 是一个聚集函数,它在整个组上计算一个数值。 有关可用的聚集函数的更多信息可以在 Section 9.15 中找到。 
    注意: 没有聚集表达式的分组实际上计算了一个字段中独立数值的集合。 我们也可以用 DISTINCT 子句实现。


2.常用的聚合函数

    PostgreSQL9.3中文文档:http://www.postgres.cn/docs/9.3/functions-aggregate.html

函数 参数类型 返回类型 描述
avg(expression) smallint, int,       bigint, real, double       precision, numeric, or interval 对于任何整数类型输入,结果都是numeric类型。   对于任何浮点输入,结果都是double precision类型。   否则和输入数据类型相同。 所有输入值的均值(算术平均)
bit_and(expression) smallint, int, bigint, or       bit 和参数数据类型相同 所有非 NULL 输入值的按位与(AND),如果全部输入值皆为 NULL ,那么结果也为 NULL 。
bit_or(expression) smallint, int, bigint, or       bit 和参数数据类型相同 所有非 NULL 输入值的按位或(OR),如果全部输入值皆为 NULL ,那么结果也为 NULL 。
bool_and(expression) bool bool 如果所有输入值都是真,则为真,否则为假。
bool_or(expression) bool bool 如果至少有一个输入值为真,则为真,否则为假。
count(*)   bigint 输入行数
count(expression) 任意 bigint 计算所有输入行中满足expression不为 NULL 的行数。
every(expression) bool bool 等效于bool_and
json_agg(record) record json 聚合记录作为JSON对象数组
max(expression) 任意数组、数值、字符串、日期/时间类型 和参数数据类型相同 有输入行中expression的最大值
min(expression) 任意数组、数值、字符串、日期/时间类型 和参数数据类型相同 所有输入行中expression的最小值
        string_agg(expression,                    delimiter)       (text, text) or (bytea, bytea) 和参数数据类型相同 输入值连接成为一个字符串,用分隔符分开
sum(expression) smallint, int,       bigint, real, double       precision, numeric, or       interval 对于smallint或int输入,输出类型为bigint。   对于bigint输入,输出类型为numeric,对于浮点数输入,   输出类型为double precision。否则和输入数据类型相同。 所有输入行的expression总和。


3.HAVING子句的使用 

    如果一个表已经用GROUP BY子句分了组,然后你又只对其中的某些组感兴趣, 那么就可以用HAVING子句,它很象WHERE子句,用于删除一个分了组的表中的一些组。 语法是: 

SELECT select_list FROM ... [WHERE ...] GROUP BY ... HAVING boolean_expression

    在 HAVING 子句中的表达式可以引用分组的表达式和未分组的表达式(后者必须涉及一个聚集函数)。

highgo=# select name,sum(num) from tests1 group by name having sum(num)>5;
 name | sum
------+-----
 yy   |   9
(1 行记录)


 4.HAVING子句与WHERE子句的区别

  HAVING去除了一些不满足条件的组行。它与WHERE 不同:WHERE在使用GROUP BY之前过滤出单独的行, 而HAVING过滤由GROUP BY创建的行。 在condition 里引用的每个字段都必须无歧义地引用一个分组的行,除非引用出现在一个聚合函数里。

  HAVING的出现把查询变成一个分组的查询,即使没有GROUP BY 子句也这样。这一点和那些包含聚合函数但没有GROUP BY子句的查询里发生的事情是一样的。 所有选取的行都被认为会形成一个单一的组,而SELECT 列表和HAVING子句只能从聚合函数里面引用表的字段。 这样的查询在HAVING条件为真的时候将发出一个行,如果为非真,则返回零行。


参考博客:http://lvmy.iteye.com/blog/793428

你可能感兴趣的:(PostgreSQL之SELECT...GROUP BY...HAVING)