Hive必知必会

这是Hive知识点的一个大纲,后续会不断地更新完善,做到对Hive相关知识点有一个比较全面的总结归纳,争取2020年7月之前完成

环境搭建

  1. Hive集群环境搭建
  2. Hive源码阅读环境

Hive架构

  • Hive整体架构
  • Hive存储格式
  • Hive数据类型
  • 执行引擎

DDL

  • DDL-数据库操作
  • DDL-内部表&外部表
  • DDL-分区表&分桶表

DML

  • DML-数据导入、导出、Update、Delete、Merge

DQL

  • select ... from
  • where
  • group by ... having ...
  • join
  • order by、sort by、distribute by
  • 窗口函数

UDF

  • UDF 和 GenericUDF
  • UDAF 和 UDTF

优化

  • 执行计划
  • map-side join
  • 大表join
  • 数据倾斜

参考资料

  1. 官网:https://cwiki.apache.org/confluence/display/Hive/Home
  2. 一起学hive:http://lxw1234.com/archives/2015/06/238.htm
  3. Hive必知必会:https://zhuanlan.zhihu.com/p/66705332

你可能感兴趣的:(Hive必知必会)