Hive基础知识(十三):Hive的Group by语句与Having语句

1. Group By 语句

GROUP BY 语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。

1)案例实操:

(1)计算 emp 表每个部门的平均工资

hive (default)> select deptno,avg(sal) from emp group by deptno;

(2)计算 emp 每个部门中平均薪资大于2000,及部门平均薪资。

hive (default)> select deptno,avg(sal) avg_sal from emp group by deptno having avg_sal > 1500; 
#另一种低效的写法
hive (default)> select deptno,avg_sal from(select deptno,avg(sal) avg_sal from emp group by deptno) t1 where avg_sal>1500;

(3)计算 emp 每个部门中每个岗位的最高薪水

select t.deptno, t.job, max(t.sal) max_sal from emp t group by t.deptno, t.job;

2. Having 语句

1)having 与 where 不同点

(1)where 后面不能写分组函数,而 having 后面可以使用分组函数。

(2)having 只用于 group by 分组统计语句。

2)案例实操

(1)求每个部门的平均薪水大于2000 的部门

hive (default)> select deptno, avg(sal) avg_sal from emp group by deptno  having avg_sal > 2000;

你可能感兴趣的:(大数据,hive,hadoop,数据仓库)