Hadoop搭建

配置ssh免密登陆

前提：master和slave节点配置相同。

本环境中已默认安装了SSH服务，所以我们只需要对其进行配置即可。

1、生成密钥命令：

ssh-keygen -P ""

image

在/root/.ssh目录下可以看到有authorized_keys、id_rsa、id_rsa.pub三个文件

cd /root/.ssh

ls

image

2、将master的公钥id_rsa.pub复制到master、slave1、slave2的authorized_keys里面，这样就可以让master免密钥登录到master、slave1、slave2。

首先对master自身做免密，如下

ssh-copy-id [email protected]

image

image

测试ssh连接到master

ssh master

image

测试完毕，退出连接使用exit命令。

image

使用同样的方法让master节点能够免密登录到slave1、和slave2。

ssh-copy-id [email protected]

安装hadoop

1、切换到hadoop压缩包所在位置，解压文件

cd /opt

tar -zxvf /opt/hadoop-2.7.3.tar.gz -C /opt

image

2、配置环境变量

编辑/etc/profile文件，在PATH参数后面追加hadoop路径

vim /etc/profile

编辑如下：

export JAVA_HOME=/opt/jdk1.8.0_111

export PATH=PATH:/opt/hadoop-2.7.3/bin:/opt/hadoop-2.7.3/sbin

export CLASSPATH=.:JAVA_HOME/lib/tools.jar

image

使配置文件生效

source /etc/profile

![image](http://upload-images.jianshu.io/upload_images/3517338-099caa0f07e165d9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1

3、配置分布式环境

集群/分布式模式需要修改

/opt/hadoop-2.7.3/etc/hadoop中的七个配置文件，slaves、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、hadoop-env.sh、yarn-env.sh，其中文件

mapred-site.xml （需要先重命名，默认文件名为 mapred-site.xml.template）

切换到/opt/hadoop-2.7.3/etc/hadoop目录下

cd /opt/hadoop-2.7.3/etc/hadoop

ls

image

重命名mapred-site.xml.template为mapred-site.xml

mv mapred-site.xml.template mapred-site.xml

image

ls

image

3.1、文件 slaves，将作为 DataNode 的主机名写入该文件，每行一个，默认为

localhost，分布式配置可以保留 localhost，也可以删掉，让 Master 节点仅作为

NameNode 使用。这里让 master 节点仅作为 NameNode 使用，因此将文件中原来的

localhost 删除，添加两行内容：Slave1和Slave2。

编辑slaves文件

vim slaves

编辑如下：

slave1

slave2

image

3.2、编辑文件 core-site.xml，改为下面的配置

vim core-site.xml

配置文件编辑如下:

fs.defaultFS

hdfs://master:9000

hadoop.tmp.dir

/opt/tmp

image

3.3、编辑文件 hdfs-site.xml，其中dfs.replication 一般设为 3吧，但我们有两个

Slave 节点，所以 dfs.replication 的值还是设为 2。

vim hdfs-site.xml

配置文件编辑如下

dfs.namenode.secondary.http-address

master:9001

dfs.replication

dfs.namenode.name.dir

/opt/dfs/name

dfs.datanode.data.dir

/opt/dfs/data

image

3.4、编辑文件 yarn-site.xml

vim yarn-site.xml

 
  
  
  
 yarn.nodemanager.aux-services 
 mapreduce_shuffle 
  
  
  
 yarn.nodemanager.aux-services.mapreduce.shuffle.class 
 org.apache.hadoop.mapred.ShuffleHandler 
  
  
  
 yarn.resourcemanager.hostname 
 master

image

3.5、编辑文件 mapred-site.xml

vim mapred-site.xml

mapreduce.framework.name

yarn

true

mapreduce.jobhistory.address

master:10020

mapreduce.jobhistory.webapp.address

master:19888

image

3.6、修改hadoop-env.sh文件下面java的路径

vim hadoop-env.sh

配置文件编辑如下：

export JAVA_HOME=/opt/jdk1.8.0_111

image

3.7、修改yarn-env.sh文件，修改JAVA_HOME值

vim yarn-env.sh

配置文件编辑如下：

export JAVA_HOME=/opt/jdk1.8.0_111

image

前提：安装hadoop时，master和slave节点配置文件完全相同，这里介绍了master的安装及配置。Slave可以通过手动配置，配置时请参考master，也可通过scp命令将master配置文件拷贝到slave的相同目录下，如：

scp -r /opt/hadoop-2.7.3 root@slave1:/opt

scp -r /opt/hadoop-2.7.3 root@slave2:/opt

将master节点的配置文件拷贝到slave节点，其中 scp -r 表示拷贝目录。

启动hadoop

前提：启动hadoop时，在master节点上面启动。

1、第一次启动需要在master的hadooop安装目录（/opt/hadoop-2.7.3）下执行format。

cd /opt/hadoop-2.7.3

./bin/hdfs namenode -format

image

2、启动hadoop命令，在master的hadooop安装目录的sbin（/opt/hadoop-2.7.3/sbin）下执行。

cd /opt/hadoop-2.7.3/sbin/

ls

image

2.1、启动命令

start-all.sh

image

jps查看集群进程

在hadoop集群开启的状态下，执行jps命令查看集群相关进程是否已完全启动。

master节点：
启动验证，master节点上应该有4个进程，分别是Jps、NameNode、SecondaryNameNode、ResourceManager，则表示master节点上面启动hadoop成功。

jps

image

Slave1节点：
启动验证，slave1节点上应该有3个进程，分别是Jps、DataNode、NodeManager。

jps

image

Slave2节点：
启动验证，slave1节点上应该有3个进程，分别是Jps、DataNode、NodeManager。

jps

image

浏览器访问hadoop

1、打开desktop节点

，登录之后（密码为123456），在浏览器上面输入

http://images.handge.cn:50070

，可以查看hadoop集群的概况。注：这里的images.handge.cn是主节点的IP，50070是NameNode默认的端口号。

image

2、打开desktop节点

，登录之后在浏览器上面输入

http://images.handge.cn:8088

，查看hadoop集群中节点的情况。注：这里的images.handge.cn是主节点的IP，8088是默认的ResourceManager的端口号。

image

3、在hadoop集群的概况页面中，点击上方菜单栏里面的Datanodes，可以查看Datanode的详细信息。

image

eclipse配置

说明：Eclipse的配置需要在Desktop节点上，登录默认的密码是123456。

安装插件
eclipse想要运行在hadoop集群上，需要安装hadoop-eclipse-plugin插件。首先需要将/opt目录下的hadoop-eclipse-plugin-2.6.0.jar包复制到eclipse的目录的plugins下面。

1、登录之后，在左边菜单栏点击终端图标，如下：

image

1.1、在终端切换到root

su

image

1.2、将/opt目录下的hadoop-eclipse-plugin-2.6.0.jar包复制到eclipse的目录的plugins下。

scp /opt/hadoop-eclipse-plugin-2.6.0.jar /opt/eclipse/plugins

image
环境配置