Hive中关键字group by、order by 、distribute by、sort by 、cluster by的区别

首先得明确分组和排序是两个概念

  1. GROUP BY
    GROUP BY语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。
select t.deptno, avg(t.sal) avg_sal from emp t group by t.deptno;
  1. Order By
    Order By:全局排序,只有一个Reducer,
    ASC(ascend): 升序(默认)
    DESC(descend): 降序
select 

你可能感兴趣的:(Hive,hive,大数据)