Hadoop集群配置及其高可用方案

实验配置五台虚拟机server1-5都是rhel6.5版本 所有虚拟机建立hadoop用户 uid gid一致 密码相同 以server1为例


获取安装包hadoop-2.7.3.tar.gz  jdk-7u79-linux-x64.tar.gz解压安装  注意是在hadoop用户下
Hadoop集群配置及其高可用方案_第1张图片
下载解压相关软件
Hadoop集群配置及其高可用方案_第2张图片
修改环境变量,使hadoop运行在java平台之上


Hadoop集群配置及其高可用方案_第3张图片
修改java变量




单节点部署
创建文件夹 将数据导入文件夹中

wordcount 统计单词算法

查看统计结果



伪节点部署
配置文件系统

Hadoop集群配置及其高可用方案_第4张图片
配置文件保存的份数

Hadoop集群配置及其高可用方案_第5张图片
设置ssh免密码认证
Hadoop集群配置及其高可用方案_第6张图片

[hadoop@server1 hadoop]$ scp -r /home/hadoop/.ssh/  hadoop@server2:~
[hadoop@server1 hadoop]$ scp -r /home/hadoop/.ssh/  hadoop@server3:~
[hadoop@server1 hadoop]$ scp -r /home/hadoop/.ssh/  hadoop@server4:~
[hadoop@server1 hadoop]$ scp -r /home/hadoop/.ssh/  hadoop@server5:~

配置datanode节点

返回值为0表示格式化成功

启动服务 查看进程状态
Hadoop集群配置及其高可用方案_第7张图片

##网页测试  浏览器访问 http://172.25.62.1:50070/
Hadoop集群配置及其高可用方案_第8张图片
Hadoop集群配置及其高可用方案_第9张图片
创建目录上传

点击最右边的  点击第一个查看目录

Hadoop集群配置及其高可用方案_第10张图片
Hadoop集群配置及其高可用方案_第11张图片
上传文件至服务端

再次查看

使用命令查看结果


删除并查看其显示结果
Hadoop集群配置及其高可用方案_第12张图片
Hadoop集群配置及其高可用方案_第13张图片
Hadoop集群配置及其高可用方案_第14张图片

Hadoop集群配置及其高可用方案_第15张图片
Hadoop集群配置及其高可用方案_第16张图片

高级配置mapred配置

Hadoop集群配置及其高可用方案_第17张图片


启动服务  并查看
Hadoop集群配置及其高可用方案_第18张图片
查看是否成功   浏览器访问http://172.25.62.1:8088/cluster/cluster
Hadoop集群配置及其高可用方案_第19张图片


分布式配置   先停止伪节点
停止伪节点
Hadoop集群配置及其高可用方案_第20张图片
切换到超级用户

Hadoop集群配置及其高可用方案_第21张图片
配置共享存储  刷新查看是否成功
Hadoop集群配置及其高可用方案_第22张图片
客户端server2安装服务  并设置开机自动挂载   注意启动顺序

Hadoop集群配置及其高可用方案_第23张图片
Hadoop集群配置及其高可用方案_第24张图片
server3与server2一样  注意服务启动顺序

[root@server3 ~]# yum install -y nfs-utils rpcbind
[root@server3 ~]# /etc/init.d/rpcbind start
[root@server3 ~]# /etc/init.d/nfs start
[root@server3 ~]# chkconfig rpcbind on
[root@server3 ~]# mount 172.25.62.1:/home/hadoop/  /home/hadoop/
[root@server3 ~]# df -h

查看是否成功

配置datanode节点
Hadoop集群配置及其高可用方案_第25张图片
配置备份存储2份

Hadoop集群配置及其高可用方案_第26张图片
格式化namenode节点

返回值为0表示正常
Hadoop集群配置及其高可用方案_第27张图片
启动服务并查看
Hadoop集群配置及其高可用方案_第28张图片
datanode节点查看服务
Hadoop集群配置及其高可用方案_第29张图片

查看节点是否存在并正常挂载



在线添加节点server4

[root@server4 ~]# yum install -y nfs-utils rpcbind
[root@server4 ~]# /etc/init.d/rpcbind start
[root@server4 ~]# /etc/init.d/nfs start
[root@server4 ~]# chkconfig rpcbind on
[root@server4 ~]# mount 172.25.62.1:/home/hadoop/  /home/hadoop/
[root@server4 ~]# df -h

免密启动服务  并查看进程
Hadoop集群配置及其高可用方案_第30张图片
Hadoop集群配置及其高可用方案_第31张图片
查看其是否加入存储体系中


节点数据迁移
Hadoop集群配置及其高可用方案_第32张图片
查看是否上传成功
Hadoop集群配置及其高可用方案_第33张图片
查看节点的存储状态

Hadoop集群配置及其高可用方案_第34张图片
配置下线

Hadoop集群配置及其高可用方案_第35张图片
配置下线用户为server3

使配置生效

查看server3的状态如果是Decommissioned则表示迁移完成 否则表示未完成


同时可以发现其他节点存储增加了  
Hadoop集群配置及其高可用方案_第36张图片
关闭datanode节点

开启其他节点的nodemanager服务
Hadoop集群配置及其高可用方案_第37张图片


HDFS高可用   原理待补充
先关闭之前的服务
Hadoop集群配置及其高可用方案_第38张图片
配置服务

Hadoop集群配置及其高可用方案_第39张图片
删除原有配置

server1到server4都清空配置以免影响
Hadoop集群配置及其高可用方案_第40张图片
Hadoop集群配置及其高可用方案_第41张图片

安装服务zookeeper  总节点数为奇数个
server1到server5都获取安装包

指定对应的ID



server3和server4上如下操作
Hadoop集群配置及其高可用方案_第42张图片
Hadoop集群配置及其高可用方案_第43张图片
server2.3.4上启动服务



查看哪个是leader



看到server3是leader  在leader上启动服务并查看相关配置

输入quit退出
Hadoop集群配置及其高可用方案_第44张图片

配置集群
 配置指定hdfs的namenode 为master(名称随意)指定zookeeper 集群主机地址(server2,server3,server4的IP地址)

Hadoop集群配置及其高可用方案_第45张图片
编辑hdfs-site.xml文件

A 指定hdfs的nameservices为master
Hadoop集群配置及其高可用方案_第46张图片
B 定义namenode节点(server1,server5)
Hadoop集群配置及其高可用方案_第47张图片
C 指定namenode元数据在journalNode上存放的位置

D 指定journalnode在本地磁盘存放数据的位置

E 开启namenode 失败自动切换,及自动切换实现方式,隔离机制方式以及使用sshfence 隔离机制需要ssh免密以及隔离机制超时时间等参数
Hadoop集群配置及其高可用方案_第48张图片





dfs.nameservices
masters


dfs.ha.namenodes.masters
h1,h2


dfs.namenode.rpc-address.masters.h1
172.25.62.1:9000


dfs.namenode.http-address.masters.h1
172.25.62.1:50070


dfs.namenode.rpc-address.masters.h2
172.25.62.5:9000


dfs.namenode.http-address.masters.h2
172.25.62.5:50070


dfs.namenode.shared.edits.dir
qjournal://172.25.62.2:8485;172.25.62.3:8485;172.25.62.4:8485/masters


dfs.journalnode.edits.dir
/tmp/journaldata


dfs.ha.automatic-failover.enabled
true




dfs.ha.fencing.methods

sshfence
shell(/bin/true)



dfs.ha.fencing.ssh.private-key-files
/home/hadoop/.ssh/id_rsa


dfs.ha.fencing.ssh.connect-timeout
30000


配置server5进行挂载

Hadoop集群配置及其高可用方案_第49张图片
启动日志服务器server2 server3 server4
Hadoop集群配置及其高可用方案_第50张图片
Hadoop集群配置及其高可用方案_第51张图片
Hadoop集群配置及其高可用方案_第52张图片
格式化HDFS集群


将生成的数据发送到另一个高可用节点server5
Hadoop集群配置及其高可用方案_第53张图片
免密在之前已经做过  没做过的话执行下面的命令

启动zkfc服务    格式化zookeeper

启动hdfs集群
Hadoop集群配置及其高可用方案_第54张图片
查看server1和server5   server2.3.4的状态
server1状态和server5一致  234状态一致

Hadoop集群配置及其高可用方案_第55张图片
Hadoop集群配置及其高可用方案_第56张图片
在浏览器查看   server1为master  server5为standby
http://172.25.62.1:50070/dfshealth.html#tab-overview
Hadoop集群配置及其高可用方案_第57张图片
http://172.25.62.5:50070/dfshealth.html#tab-overview
Hadoop集群配置及其高可用方案_第58张图片
模拟故障切换

在浏览器查看namenode为server5    server1不可连接
http://172.25.62.5:50070/dfshealth.html#tab-overview
Hadoop集群配置及其高可用方案_第59张图片
再次启动server1的namenode  master依然是server5
Hadoop集群配置及其高可用方案_第60张图片
浏览器再次查看
Hadoop集群配置及其高可用方案_第61张图片

yarn高可用

Hadoop集群配置及其高可用方案_第62张图片



##指定yarn的框架为mapreduce


mapreduce.framework.name
yarn

##配置可以在nodemanager上运行mapreduce程序

yarn.nodemanager.aux-services
mapreduce_shuffle

##激活RM高可用

yarn.resourcemanager.ha.enabled
true

##指定RM的集群ID

yarn.resourcemanager.cluster-id
RM_CLUSTER

##定义RM节点

yarn.resourcemanager.ha.rm-ids
rm1,rm2


yarn.resourcemanager.hostname.rm1
172.25.62.1


yarn.resourcemanager.hostname.rm2
172.25.62.5

##激活RM自动恢复

yarn.resourcemanager.recovery.enabled
true

##配置RM状态信息存储方式  有memstore和ZKstore

yarn.resourcemanager.store.class
org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore

##配置zookeeper存储时,指定zookerper集群的地址

yarn.resourcemanager.zk-address
172.25.62.2:2181,172.25.62.3:2181,172.25.62.4:2181

启动服务
Hadoop集群配置及其高可用方案_第63张图片
另一个节点server5需要手动启动
Hadoop集群配置及其高可用方案_第64张图片
在浏览器访问
http://server1:8088/cluster/cluster
Hadoop集群配置及其高可用方案_第65张图片
http://server5:8088/cluster/cluster
Hadoop集群配置及其高可用方案_第66张图片
yarn故障测试
在server1上断开主节点
Hadoop集群配置及其高可用方案_第67张图片
查看状态  server5接管资源
Hadoop集群配置及其高可用方案_第68张图片
再次启动server1
Hadoop集群配置及其高可用方案_第69张图片
再次访问  还是server5在处理
Hadoop集群配置及其高可用方案_第70张图片
服务的关闭
server1上
Hadoop集群配置及其高可用方案_第71张图片
server5节点上
Hadoop集群配置及其高可用方案_第72张图片
server2.3.4关闭的方法一样
Hadoop集群配置及其高可用方案_第73张图片

你可能感兴趣的:(hadoop,zookeeper,yarn)