Hive架构原理

hive是hadoop的数据仓库处理工具,可以将一些整理后的结构化的数据文件映射一张可供查询的表。Hive底层提供了mapreduce模板,将HQL转化为mapreduce程序,Hive处理的数据保存在hdfs上,执行计算程序通过mapreduce,程序运行在yarn上。

  1. hdfs的结构化文件是底层如何映射的成一张可供查询的表?

首选,hive的元数据保存在mysql中,记录hive的创建的表、库等信息。通过把hdfs上的文件导入到hive之前创建的表中

 hadoop fs -put stu.txt /user/hive/warehouse/xxx.db/xxx_表/

 

 

你可能感兴趣的:(HIVE,hive,大数据)