hive中sql 转换成 mapreduce 过程

hive中sql 转换成 mapreduce 过程_第1张图片

说明:

当启动MapReduce程序时,Hive本身是不会生成MapReduce算法程序的
需要通过一个表示“Job执行计划”的XML文件驱动执行内置的、原生的Mapper和Reducer模块
Hive通过和JobTracker通信来初始化MapReduce任务,不必直接部署在JobTracker所在的管理节点上执行
通常在大型集群上,会有专门的网关机来部署Hive工具。网关机的作用主要是远程操作和管理节点上的JobTracker通信来执行任务
数据文件通常存储在HDFS上,HDFS由名称节点管理
 

 

 

你可能感兴趣的:(hive,hive,sql,mr过程)