hive 分通总结

总结分析:

1. 定义了桶,但要生成桶的数据,只能是由其他表通过insert into 或是insert overwrite ,若表有分区只能使用insert overwrite

2. 定义桶可以使用整型字段或是string类型字段

3.  若表没有定义桶也可以进行随机抽样

4. 必须先set hive.enforce.bucketing = true才可以将数据正常写入桶中, 若没有使用hive.enforce.bucketing属性, 则需要设置和分桶个数相匹配的reducer个数, 同时SELECT后添加CLUSTER BY

你可能感兴趣的:(hive)