Hive 快速入门

Hive 目前已经成为 Hadoop 大数据离线分析的标准工具,Hive 入门比较容易,但是深入还是有些困难。本次分享目的是带领大家快速入门 Hive,侧重于实用应用,并有一些原理和优化的内容。本场 Chat 的主要内容包括:

  • Hive介绍
  • 数据类型
  • DDL语法
  • DML语法
  • HQL语法
  • 连接
  • 排序
  • 自定义函数
  • Hive执行原理
  • Hive性能优化
  • Hive高级知识

实录提要:

  • 和 Hive 类似的工具还有哪些,能否做一个简单的比较和使用场景分析?
  • Hive 有好的活跃社区推荐吗?
  • Hive 与 SparkSQL 的目标与实现机制主要有何差异?适用场景有分别吗?
  • 想知道如何进行 Hive SQL 的查询优化,有没有相关书籍推荐?
  • 关于更新目标表,有哪几种比较好的处理方法?
  • 推荐下关于 Hive 转 Mapreduce 原理或优化 Hive SQL 的书籍或博客之类的资料?
  • Hive 的运维难度相比同类工具,难易程度?

阅读全文: http://gitbook.cn/gitchat/activity/5923fe6cdcac8b4e79ddf889

您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。

FtooAtPSkEJwnW-9xkCLqSTRpBKX

你可能感兴趣的:(Hive 快速入门)