hive排序

mr中不指定reduce时默认是1,而hive会自动调节reduce数量,hive的切片是256,多少切片多少reduce.

1.order by 全局排序,只会有一个reduce

2.reduce 内部排序

可以指定reduce个数(分区个数)

1.sort by

每个reduce的内部排序

2.distribute by

分区,默认hash规则

3.cluster

cluster =1+2 但是 1+2可以自定规则而cluster不可以

你可能感兴趣的:(hive,hive,hadoop,数据仓库)