【大数据之路5-2】Hive 全调优

Hive 全调优

      • 1. 调优概述
      • 2. 调优具体细节
        • 1. Hive 建表设计层面
          • 1. 利用分区表优化
          • 2. 利用分桶表优化
          • 3. 选择合适的文件存储格式
          • 4. 选择合适的压缩格式
        • 2. HQL 语法和运行参数层面
          • 1. 查看 Hive 执行计划
          • 2. 列裁剪
          • 3. 谓词下推
          • 4. 分区裁剪
          • 5. 合并小文件
          • 6. 合理设置 MapTask 并行度
          • 7. 合理设置 ReduceTask 并行度
          • 8. Join 优化
          • 9. 启用 MapJoin
          • 10. Join 数据倾斜优化
          • 11. CBO 优化

你可能感兴趣的:(大数据,hive,hadoop,调优,数据倾斜)