hadoop 集群的配置

 

在经过几天折腾,终于将hadoop环境搭建成功,整个过程中遇到各种坑,反复了很多遍,光虚拟机就重新安装了4、5次,接下来就把搭建的过程详细叙述一下

0.相关工具:

  

1,系统环境说明:

我这边给出我的集群环境是由一台主节点master和2台从节点slave组成:  

master 192.168.137.122
slave1 192.168.137.123
slave2 192.168.137.124

四个节点上均是CentOS7.0系统

2,虚拟机设置

  这里用的是 VMware12.1,虚拟CentOS7环境,虚拟机环境配置如下:     

系统配置:

虚拟机:一个master,slave1, slave2
网络设置:共享主机IP
内存:每个虚拟机配置1024M内存
分区:自动
软件选择:最小安装,注意选择开发工具
用户设置:密码都设置为:hadoophadoop, 不创建任何用户,操作时使用root直接进行

     完成VMware安装后先设置,先在物理机中设置VMnet1、VMnet8 为自动获取IP 如下图所示:

并将3台虚拟机网络连接方式都设置为:NAT模式,否则虚拟无法上网

3,环境安装

插入CentOS7系统盘,选择第一项进入系统安装,稍后会弹出设置界面:

这里我们把环境设置为:基础设施服务器,否则会各种 "command not found..."他提供了,hadoop服务的基础环境

下面是选择"安装位置",这里我直接默认了,接下来很重要,设置网路和主机名,折腾好了,就不用安装完系统后在使用命令设置了

hadoop 集群的配置_第1张图片

主机名的位置,添写"master",点击右侧"配置",在出现的网络设置中选择"IPv4设置",在出现的"方法"中选择手动,点击添加,设置"master"对应的IP,出现如下界面:

其余两台slave,设置一致,如果虚拟直接拷贝的,可以使用下列命令方法设置

1)修改主机名(分别在3台虚拟机修改为:master、slave1、slave2):  

vi /etc/hostname

   进入编辑状态后按"Insert"直接修改主机名,完成后,按"ESC",然后按住Shift 按两次Z保存退出

2)修改IP地址(分别在3台虚拟机修改为:192.168.137.122,192.168.137.123,192.168.137.124):

vi /etc/sysconfig/network-scripts/ifcfg-eno16777736(虚拟机的网卡一般默认都是ifcfg-eno16777736)

 增加以下内容:

BOOTPROTO=static          #设置为静态IP
ONBOOT=yes                #打开网卡
IPADDR=192.168.137.122    #设置IP,对应上面给出的四个IP地址,这里是master的IP
NETMASK=255.255.255.0     #设置子网掩码
GATEWAY=192.138.137.2     #设置网关

系统安装完成后需要设置root账号密码,这里我没有添加新用户,所以后续设置均通过root账号完成。

4,配置host

通过下列命令打开hosts文件,修改hosts配置,3台机器都需要

vi /etc/hosts

加入下列代码

192.168.137.122 master
192.168.137.123 slave1
192.168.137.124 slave2

在完成以上步骤后reboot重启3台虚拟机:reboot

5,SSH无密码验证配置

  每台机器可以生成自己的一对公司钥,私钥自己保存。将本机作为服务器,要通过无密钥SSH访问本机的机器作为客户端,首先将服务器的公钥放到客户端,客户端将此公钥放到authorized_keys中,可以将authorized_keys认为是公钥的字典文件,因为可以放多个服务器的公钥进去,即可实现无密钥SSH访问。

  Hadoop运行过程中,需要管理远端Hadoop守护进程,在Hadoop启动以后,NameNode是通过SSH(Secure Shell)来启动和停止各个DataNode上的各种守护进程的。这就必须在节点之间执行指令的时候是不需要输入密码的形式,故我们需要配置SSH运用无密码公钥认证的形式,这样NameNode使用SSH无密码登录并启动DataName进程,同样原理,DataNode上也能使用SSH无密码登录到NameNode。

在各节点上生成各自SSH秘钥对(这里秘钥类型为rsa,也可以设置为安全性更高的dsa),以master为例。

创建秘钥文件使用下列命令

ssh-keygen -t rsa 

截图说明如下:

hadoop 集群的配置_第2张图片

(参数说明参考:http://killer-jok.iteye.com/blog/1853451)

在本机上生成authorized_keys,并验证能否对本机进行SSH无密码登陆

hadoop 集群的配置_第3张图片

在其余所有节点都生成自己的authorized_keys之后,通过ssh-copy-id命令拷贝各自的公钥到其他节点,公钥会加入到对方机器的authorized_keys文件中,可以将authorized_keys认为是公钥的字典文件,因为可以放多个服务器的公钥进去,即可实现无密钥SSH访问。下面以slave1节点为例,将master节点的公钥复制到slave1节点中并加入到授权的key中,并验证是否配置成功。

在slave1中生成秘钥文件

将master节点的公钥复制到slave1节点中并测试连接

在slave中使用 more 查看完成公钥复制后的文件

6,安装jdk环境设置

WinSCP是一个很好用的工具可以在windows物理机与虚拟之间传递文件

hadoop 集群的配置_第4张图片

输入连接虚拟机机的IP,用户名,密码,链接成功后,上传jdk与hadoop到"/usr/local"目录下(这里目录可随意指定,稍后会登陆到虚拟机解压安装)

hadoop 集群的配置_第5张图片

 使用 tar -zvxf jdk-8u91-lunux-x64.tar.gz 解压

 

通过mv修改文件夹名称

配置jdk环境变量

vi /etc/profile

在尾部,加入下面内容: 

hadoop 集群的配置_第6张图片

(当然这里也可以使用WinSCP在windows 中修改。)

保存退出后,执行下列命令 让更改及时生效

source /etc/profile

然后,执行下列命令验证安装成功

java -version

如果显示的版本与我们安装的版本一致,即安装成功

7,安装hadoop环境设置

 使用 tar -zvxf hadoop-2.7.2.tar.gz 解压

移动到安装目录,我这里是"home/hadoop",可自定义

hadoop 集群的配置_第7张图片

配置hadoop环境变量,还是修改刚刚配置jdk环境变量的文件

vi /etc/profile

在尾部,加入下面内容: 

保存退出后,执行下列命令 让更改及时生效

source /etc/profile

然后,执行下列命令验证安装成功

hadoop version

正常会显示版本信息

hadoop 集群的配置_第8张图片

配置 ~/hadoop/etc/hadoop下的hadoop-env.sh、yarn-env.sh、mapred-env.sh

使用命令:

 

vi /home/hadoop/etc/hadoop/hadoop-env.sh

 

修改JAVA_HOME

使用命令: 

vi /home/hadoop/etc/hadoop/yarn-env.sh

 修改JAVA_HOME

使用命令: 

vi /home/hadoop/etc/hadoop/mapred-env.sh

修改JAVA_HOME

hadoop 集群的配置_第9张图片

配置系统目录:Hadoop程序存放目录为/home/hadoop/,可以将程序和数据目录分开,可以更加方便的进行配置的同步,具体目录的配置如下所示:

l  在每个节点上创建程序存储目录/home/hadoop/,用来存放Hadoop程序文件。

l  在每个节点上创建数据存储目录/home/hadoop/hdfs,用来存放集群数据。

l  在主节点node上创建目录/home/hadoop/hdfs/name,用来存放文件系统元数据。

l  在每个从节点上创建目录/home/hadoop/hdfs/data,用来存放真正的数据。

l  所有节点上的日志目录为/home/hadoop/logs。

l  所有节点上的临时目录为/home/hadoop/tmp。

执行命令mkdir -p  /home/hadoop/logs,为还没有的目录创建,后面以此类推

hadoop 集群的配置_第10张图片

8, 修改hadoop配置文件

Hadoop2.7.2配置文件在hadoop/etc/hadoop目录下,配置文件也被分成了4个主要的配置文件需要配置其中包含:core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml。core-site.xml和hdfs-site.xml是站在HDFS角度上配置文件;core-site.xml和mapred-site.xml是站在MapReduce角度上配置文件。 

 

core-site.xml

<configuration>
       <property>
                <name>fs.defaultFS</name>
                <value>hdfs://master:8020</value>
             <description> 设定 namenode 的 主机名 及 端口 </description>
       </property>
       <property>
                <name>io.file.buffer.size</name>
                <value>131072</value>
        <description> 设置缓存大小 </description>
        </property>
       <property>
               <name>hadoop.tmp.dir</name>
               <value>file:/home/hadoop/tmp</value>
               <description> 存放临时文件的目录 </description>
       </property>
</configuration>

hdfs-site.xml

<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/home/hadoop/hdfs/name</value>
        <description> namenode 用来持续存放命名空间和交换日志的本地文件系统路径 </description> 
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/home/hadoop/hdfs/data</value>
        <description> DataNode 在本地存放块文件的目录列表,用逗号分隔 </description> 
    </property>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
        <description> 设定 HDFS 存储文件的副本个数,默认为3 </description>
    </property>
    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>
</configuration>

mapred-site.xml

<configuration>  
    property>
        <name>mapreduce.framework.name</name>
                <value>yarn</value>
                <final>true</final>
        </property>
    <property>
        <name>mapreduce.jobtracker.http.address</name>
        <value>master:50030</value>
    </property>
    <property>
            <name>mapreduce.jobhistory.address</name>
            <value>master:10020</value>
    </property>
    <property>
            <name>mapreduce.jobhistory.webapp.address</name>
            <value>master:19888</value>
    </property>
        <property>
                <name>mapred.job.tracker</name>
                <value>http://master:9001</value>
        </property>
</configuration>  

yarn-site.xml

<configuration>
        <property>
               <name>yarn.nodemanager.aux-services</name>
               <value>mapreduce_shuffle</value>
        </property>
        <property>                                                                
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
               <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
        <property>
               <name>yarn.resourcemanager.address</name>
               <value>master:8032</value>
       </property>
       <property>
               <name>yarn.resourcemanager.scheduler.address</name>
               <value>master:8030</value>
       </property>
       <property>
            <name>yarn.resourcemanager.resource-tracker.address</name>
             <value>master:8031</value>
      </property>
      <property>
              <name>yarn.resourcemanager.admin.address</name>
               <value>master:8033</value>
       </property>
       <property>
               <name>yarn.resourcemanager.webapp.address</name>
               <value>master:8088</value>
       </property>
</configuration>

 9,设置hadoop集群

master上配置好的hadoop所在文件夹"/home/hadoop"复制到所有的Slave的"/home"目录下,而不必每台机器都要安装设置,用下面命令格式进行。
例如:从"master"到"slave1"复制配置Hadoop的文件:

scp –r /home/hadoop root@slave1:/home/

复制完成后在master上配置节点信息(其余节点不需要),使用下列命令

vi /home/hadoop/etc/hadoop/slaves

去掉"localhost",每行只添加一个主机名或者IP地址

10,格式化HDFS文件系统

输入命令:

cd /home/hadoop
hadoop namenode -format

如果不出错大致会显示如下信息:

hadoop 集群的配置_第11张图片

次数如产生错误,基本都是配置文件的问题,诸如不识别中文,配置文件中指定的路径不存在,等等,请认真检查配置文件

11,启动hadoop服务

cd /home/hadoop
sbin/start-all.sh

如无异常显示如下内容

hadoop 集群的配置_第12张图片

命令“sbin/stop-all.sh”停止hadoop服务

12,服务验证

  • java自带的小工具jps查看进程

  在master应该输出以下信息(端口号仅供参考)

  

  在slave应该输出以下信息(端口号仅供参考)

  

  若不显示DataNode进程,表示DataNode节点启动失败,这里可以在slave节点中查看日子中的错误  

more /home/hadoop/logs/hadoop-root-datanode-slave2.log

  hadoop 集群的配置_第13张图片

  根据日志得知 datanode的clusterID 和 namenode的clusterID 不匹配将slave节点中/home/hadoop/hdfs/data/current/VERSION文件中的clusterID 修改为与master中的一致重新启动服务即可。 

  • 通过网页查看

  先使用下面命令关闭防火墙

systemctl stop firewalld 

  输入以下网页, http://192.168.137.122:50070/dfshealth.html#tab-overview 进入hadoop管理首页

 

PS:参考文献

  http://www.cnblogs.com/baiboy/p/4639474.html
  http://www.tuicool.com/articles/mQfInyZ
  http://www.centoscn.com/image-text/install/2014/1121/4158.html
http://blog.csdn.net/circyo/article/details/46724335
http://blog.csdn.net/xw13106209/article/details/6855294

 

你可能感兴趣的:(hadoop 集群的配置)