hive中的四种排序对比

order by

全局排序,只有一个reducer。

sort by

区内排序,每个reducer内部排序,需要指定分区原则,因此与distribute by 连用。

distribute by

分区排序。

cluster by

当 distribute by 的字段和 sort by 的字段相同时,可代替 distribute by 和 sort by 。

你可能感兴趣的:(Hive)