hive 中 order by, sort by, distribute by, cluster by 的区别【详细】
文章目录OrderBy(全局排序)SortBy(每个reduce内部排序)DistributeBy(指定分区规则)ClusterBy(分区字段和排序字段相同时使用)SortBy和DistributeBy使用案例1.假设我们有一个名为sales的表,包含以下字段:product_id、sale_date、quantity和revenue。我们想要按照product_id进行排序,并将数据按照prod