hive中where和having的区别和sort by 与order by的区别

hive中where和having的区别和sort by 与order by的区别

where 和having的区别:

where 作用在 分组(group by)和聚集(sum等)计算之前,选取哪些行。
	where条件中不能包含 聚集函数。
	(where条件中不能跟 重命名字段)
having作用在 分组(group by)之后,对分组后计算的数据进行过滤
	having必须放在 group by 之后
错误使用:
hive (myhive)> select * from student having st_age < 20。

order by与sort by的区别:

Sort By:每个MapReduce内部进行排序,对全局结果集来说不是排序。

1)设置reduce个数

hive (default)> set mapreduce.job.reduces=3;
2)查看设置reduce个数
hive (default)> set mapreduce.job.reduces;
3)根据部门编号降序查看员工信息
hive (default)> select * from emp sort by deptno desc;
4)将查询结果导入到文件中(按照部门编号降序排序)
hive (default)> insert overwrite local directory ‘/opt/module/datas/sortby-result’ select * from emp sort by deptno desc;

Order By:全局排序,一个MapReduce

1)使用 ORDER BY 子句排序
ASC(ascend): 升序(默认)
DESC(descend): 降序
2)ORDER BY 子句在SELECT语句的结尾。
3)案例实操
(1)查询员工信息按工资升序排列
hive (default)> select * from emp order by sal;
(2)查询员工信息按工资降序排列
hive (default)> select * from emp order by sal desc;

你可能感兴趣的:(Hive)