MapReduce配置 & YARN集群部署

MapReduce配置 & YARN集群部署_第1张图片1:编辑mapred-env.sh;添加如下配置

#设置jdk路径
export JAVA_HOME=/opt/module/jdk
#设置JobHistoryServer进程内存为1G
export HADOOP_JOB_HISTORYSERVER_HEAPSIZE=1000
#设置日志级别为INFO
export HADOOP_MAPRED_ROOT_LOGGER=INFO,RFA

2:编辑mapred-site.xml;添加如下配置


mapreduce.framework.name
yarn
MapReduce的运行框架设置为YARN



mapreduce.jobhistory.address
master:10020
历史服务器通讯端口为master:10020



mapreduce.jobhistory.webapp.address
master:19888
历史服务器web的端口为master:19888



mapreduce.jobhistory.intermediate-done-dir
/data/mr-history/tmp
历史信息在HDFS的记录临时路径



mapreduce.jobhistory.done-dir
/data/mr-history/done
历史信息在HDFS的记录路径



yarn.app.mapreduce.am.env
HADOOP_MAPRED_HOME=$HADOOP_HOME
MAPREDUCE HOME 设置为HADOOP_HOME



mapreduce.map.env
HADOOP_MAPRED_HOME=$HADOOP_HOME
MAPREDUCE HOME 设置为HADOOP_HOME



mapreduce.reduce.env
HADOOP_MAPRED_HOME=$HADOOP_HOME
MAPREDUCE HOME 设置为HADOOP_HOME

3:编辑yarn-env.sh;添加如下配置

#设置jdk路径的环境变量
export JAVA_HOME=/opt/module/jdk
#设置hadoop_home的环境变量
export HADOOP_HOME=/opt/module/hadoop
#设置配置文件路径的环境变量
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
#设置日志文件路径的环境变量
export HADOOP_LOG_DIR=$HADOOP_HOME/logs

4:yarn-site.xml;添加如下配置:


yarn.resourcemanager.hostname
master
Resourcemanager设置在master节点



yarn.nodemanager.local-dirs
/data/nm-local
nodemanager中间数据本地存储路径



yarn.nodemanager.log-dirs
/data/nm-log
NodeManager 数据日志本地存储路径



yarn.nodemanager.aux-services
mapreduce_shuffle
为mapreduce程序开启shuffle服务



yarn.log.server.url
http://master:19888/jobhistory/logs
历史服务器url



yarn.web-proxy.address
master:8089
代理服务器主机和端口



yarn.log-aggregation-enable
true
开启日志聚合



yarn.nodemanager.remote-app-log-dir
/tmp/logs
程序日志HDFS的存储路径



yarn.resourcemanager.Scheduler.class
org.apache.hadoop.yarn.server.resourcemanager.Scheduler.fair.FairScheudler
选择公平调度器

分发

scp mapred-env.sh mapred-site.xml yarn-env.sh yarn-site.xml slave1:`pwd`/
scp mapred-env.sh mapred-site.xml yarn-env.sh yarn-site.xml slave2:`pwd`/

分发完成就可以启动YARN的相关进程了

start-all.sh

在当前机器也可以单独启动或停止进程

$HADOOP_HOME/bin/yarn --daemon start|stop resourcemanager|nodemanager|proxyserver

历史服务器启动和停止

$HADOOP_HOME/bin/mapred --daemon start|stop historyserver

MapReduce配置 & YARN集群部署_第2张图片

你可能感兴趣的:(mapreduce,数据库,大数据)