hadoop各模块含义及对应的配置

HDFS模块

  • NameNode

NameNode是主节点,存储文件的元数据,如文件名,文件目录结构,文件属性,以及每个文件的块列表和块所在的DataNode等。NameNode的元数据中的一部分存放在内存中的,在进程当中,另一部分存放在本地磁盘(fsimage:镜像文件和edits:编辑日志)

core-site.xml中配置

<property>
    <name>fs.defaultFSname>
    <value>hdfs://localhost:8020value>
property>
  • DataNodes

在本地文件系统存储文件块数据,以及块的校检

slaves文件中配置

  • Secondary NameNode

用来监控HDFS状态的后台程序,每隔一段时间获取一次快照

hdfs-site.xml中配置

<property>
    <name>dfs.namenode.secondary.http-addressname>
    <value>localhost:50090value>
property>

YARN模块

  • ResourceManager

处理客户端请求;启动/监控ApplicationMaster;监控NodeManager;资源分配与调度

yarn-site.xml配置

<property>
    <name>yarn.resourcemanager.hostnamename>
    <value>localhostvalue>
property>
  • NodeManagers

单个节点上的资源管理;处理来自ResourceManager的命令;处理来自ApplicationMaster的命令

slaves文件中的配置

  • ApplicationMaster

数据切分;为应用程序申请资源,并分配给内部任务;任务监控与容错

  • Container

对任务运行环境的抽象,封装了CPU、内存等多维资源以及环境变量、启动命令等任务运行相关的信息

MapReduce

  • 历史日志HistoryServer

可以查看mapreduce程序执行的历史日志

<property>
        <name>mapreduce.jobhistory.addressname>
        <value>localhost:10020value>
    property>

    <property>
        <name>mapreduce.jobhistory.webapp.addressname>
        <value>localhost:19888value>
    property>

你可能感兴趣的:(大数据)