Hive架构原理以及部署教程

◆了解Hive架构原理

◆了解Hive和RDBMS的对比

Hive架构原理

Hive架构原理 - 知乎

Hive 是基于 Hadoop 的数据仓库工具,它提供了类 SQL 查询语言 HQL(Hive Query Language),可以将 SQL 语句转化为 MapReduce 任务进行数据处理。

Hive 的架构可以分为三层:

  1. 用户接口层:Hive 提供了 CLI(Command Line Interface)和 JDBC/ODBC 接口,用户可以通过这些接口向 Hive 发送 HQL 查询语句。
  2. 元数据层:Hive 的元数据存储在关系型数据库中,包括表的元数据、分区信息、表的属性等。Hive 通过 Hive Metastore 组件管理元数据,支持多种元数据存储方式,如 Derby、MySQL 等。
  3. 执行引擎层:Hive 执行引擎将 HQL 查询语句转化为 MapReduce 任务进行数据处理。在执行引擎层中,还包括了优化器和执行器两个组件。优化器会对 HQL 查询语句进行优化,提高查询效率;执行器负责执

你可能感兴趣的:(hadoop搭建管理教程,hadoop,hive,大数据)