YARN 工作原理

1、Hadoop2新增了YARN,YARN的引入主要有两个方面的变更:

其一、HDFS的NameNode可以以集群的方式部署,增强了NameNode的水平扩展能力和高可靠性,水平扩展能力对应HDFS Federation,高可靠性对应HA。

其二、MapReduce将Hadoop1时代的JobTracker中的资源管理任务生命周期管理拆分成两个独立的组件,资源管理对应ResourceManager,任务生命周期管理对应ApplicationMaster。

2、YARN on HDFS

HDFS的典型结构与HDFS二次结构对比


Hadoop1的HDFS结构示意图
Hadoop2的HDFS结构示意图


HDFS Federation
HA

3、MapReduce on YARN的工作原理


你可能感兴趣的:(YARN 工作原理)