Hive、HDFS和hadoop关系

Hive构建在Hadoop上
HQL中对查询语句的解释、优化、生成查询计划是由Hive完成的所有的数据存储在Hadoop上。
询计划被转化为 MapReduce 任务,在 Hadoop 中执行(有些查询没有 MR 任务,如:select * from table)
Hadoop和Hive都是用UTF-8编码的

Hadoop三大组件:
分布式文件系统:HDFS —— 实现将文件分布式存储在很多的服务器上
分布式运算编程框架:MapReduce——实现多台机器的分布式并行运算。
分布式资源调度平台:YARN —— 帮用户调度大量的mapreduce程序,并合理分配运算资源

你可能感兴趣的:(大数据及服务器运维,hive,hadoop)