博主syst1m 带你 acquire knowledge!
✨博客首页——syst1m的博客
《CTF专栏》超级详细的解析,宝宝级教学让你从蹒跚学步到健步如飞
《大数据专栏》大数据从0到秃头,从分析到决策,无所不能❕
《python面向对象(人狗大战)》突破百万的阅读量,上过各种各样的官方大型专栏,python面向对象必学之一!
希望本文能够给读者带来帮助,更好地理解这个问题或解决你的困惑
1.3 环境概述
hadoop YARN分布式资源调度,会启动ResourceManager进程作为管理节点,NodeManager进程作为工作节点,ProxyServer,JobHistoryServer这两个辅助节点
有三台服务器,其中node1配置较高,集群如下:
额外配置
配置好文件之后,和之前的HDFS一样分发文件到root2,root3,分发到其他的服务器节点中
scp mapred-env.sh mapred-site.xml yarn-env.sh yarn-site.xml root2:`pwd`/
scp mapred-env.sh mapred-site.xml yarn-env.sh yarn-site.xml root3:`pwd`/
分发完成配置文件,就可以启动YARN的相关进程了
集群启动命令介绍:
一键启动YARN集群:$HADOOP_HOME/sbin/start-yarn.sh
会基于yarn-site.xml中配置的yarn.resourcemanager.hostname来决定哪台机器上启动resourcemanager
会基于workers文件配置的主机启动NodeManager
一键停止YARN集群:$HADOOP_HOME/sbin/stop-yarn.sh
在当前机器,单独启动或停止进程
$HADOOP_HOME/bin/yarn --daemon start|stop resourcemanager | nodemanager | proxyserver
start和stop决定启动和停止
历史服务器启动和停止
$HADOOP_HOME/bin/mapred --daemon start | stop | historyserver
在root1服务器,以hadoop用户执行
首先执行:$HADOOP_HOME/sbin/start-yarn.sh
之后执行$HADOOP_HOME/bin/mapred --daemon start historyserver(历史服务器)
今天的MapReduuce配置&YARN集群部署,算是大数据学习路上的必经之路,虽然说配置文件中的内容非常多,其实分段理解,还不算什么特别难的的东西,跟着教程慢慢来,注意中间的配置文件内容别出错了,启动就直接ok了,最后看到这样的web页面也是成就感满满