[大数据学习笔记]MapReduce和Yarn基本介绍

MapReduce是什么?有什么特点?

MapReduce是基于Google发布的MapReduce论文设计开发,用于大规模数据集(大于1TB)的并行计算,

Cluster Infrastructure、Software Framework、Programming Model & Methodology)。

特点如下:

易于编程:程序员仅需要描述做什么,具体怎么做交由系统的执行框架处理。

良好的扩展性:可通过添加节点以扩展集群能力。

高容错性:通过计算迁移或数据迁移等策略提高集群的可用性与容错性。

什么是Yarn?

Apache Hadoop YARN(Yet Another Resource Negotiator),Hadoop资源管理器,一个通用资源管理系统,为上层提供统一的资源管理和调度,为集群在利用率、资源统一管理和数据共享等方面带来巨大好处。

 

你可能感兴趣的:(大数据)