Hadoop-2.5.1集群安装配置笔记

Hadoop-2.5.1集群安装配置笔记

1.环境

1.1.虚拟机


准备3台虚拟机,安装Centos 64-bit操作系统,采用最小安装。

(本来想多跑几台虚拟机,但本人笔记本电脑内存有限,最多只能同时跑3个虚拟机)

虚拟机一律配置静态IP地址,配置域名解析,各虚拟机时间同步。

192.168.17.100 nameNode

192.168.17.101 dataNode1

192.168.17.102 dataNode2



2.安装

2.1.安装前


2.1.1.安装wget和ssh

用于下载和ssh登录


[html] view plaincopy在CODE上查看代码片派生到我的代码片

  1. yum -y install wget  

  2.   

  3. yum -y install openssh*  



2.1.2.安装JDK、配置环境变量

略...


2.1.3.配置ssh公钥密钥自动登录

在hadoop集群环境中,nameNode节点,需要能够ssh无密码登录访问dataNode节点

进入SSH目录:


[plain] view plaincopy在CODE上查看代码片派生到我的代码片

  1. [root@nameNode ~]# cd .ssh  

  2. [root@nameNode .ssh]#   


生成公钥密钥对:


[plain] view plaincopy在CODE上查看代码片派生到我的代码片

  1. [root@nameNode /]# ssh-keygen -t rsa    

  2. Generating public/private rsa key pair.    

  3. Enter file in which to save the key (/root/.ssh/id_rsa):    

  4. Enter passphrase (empty for no passphrase):    

  5. Enter same passphrase again:    

  6. Your identification has been saved in /root/.ssh/id_rsa.    

  7. Your public key has been saved in /root/.ssh/id_rsa.pub.    

  8. The key fingerprint is:    

  9. 98:3c:31:5c:23:21:73:a0:a0:1f:c6:d3:c3:dc:58:32 root@gifer    

  10. The key's randomart image is:    

  11. +--[ RSA 2048]----+    

  12. |.   E.=.o        |    

  13. |.o = @ o .       |    

  14. |. * * =          |    

  15. | o o o =         |    

  16. |  .   = S        |    

  17. |       .         |    

  18. |                 |    

  19. |                 |    

  20. |                 |    

  21. +-----------------+    


看到图形输出,表示密钥生成成功,目录下多出两个文件

私钥文件:id_raa
公钥文件:id_rsa.pub

将公钥文件id_rsa.pub内容放到authorized_keys文件中:


  1. cat id_rsa.pub >> authorized_keys  


将公钥文件authorized_keys分发到各dataNode节点:


  1. scp authorized_keys  root@dataNode:/root/.ssh/  

验证ssh无密码登录:


  1. [root@nameNode .ssh]# ssh root@dataNode1  

  2. Last login: Sun Sep 21 11:38:05 2014 from 192.168.17.1  

看到以上输出,表示配置成功!如果还提示需要输出密码访问,表示配置失败!


2.2.开始安装

下载最新版本hadoop-2.5.1


  1. wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.5.1/hadoop-2.5.1.tar.gz  


解压


  1. tar -zxf hadoop-2.5.1.tar.gz  


2.3.配置文件

进入配置文件目录:cd hadoop-2.5.1/etc/hadoop

2.3.1.core-site.xml


[html] view plaincopy在CODE上查看代码片派生到我的代码片

  1. <configuration>  

  2.     <property>  

  3.         <name>hadoop.tmp.dir</name>  

  4.         <value>/home/hadoop/tmp</value>  

  5.         <description>Abase for other temporary directories.</description>  

  6.     </property>  

  7.     <property>  

  8.         <name>fs.defaultFS</name>  

  9.         <value>hdfs://nameNode:9000</value>  

  10.     </property>  

  11.     <property>  

  12.         <name>io.file.buffer.size</name>  

  13.         <value>4096</value>  

  14.     </property>  

  15. </configuration>  

2.3.2.hdfs-site.xml

[html] view plaincopy在CODE上查看代码片派生到我的代码片

  1. <configuration>  

  2.     <property>  

  3.         <name>dfs.nameservices</name>  

  4.         <value>hadoop-cluster1</value>  

  5.     </property>  

  6.     <property>  

  7.         <name>dfs.namenode.secondary.http-address</name>  

  8.         <value>nameNode:50090</value>  

  9.     </property>  

  10.     <property>  

  11.         <name>dfs.namenode.name.dir</name>  

  12.         <value>file:///home/hadoop/dfs/name</value>  

  13.     </property>  

  14.     <property>  

  15.         <name>dfs.datanode.data.dir</name>  

  16.         <value>file:///home/hadoop/dfs/data</value>  

  17.     </property>  

  18.     <property>  

  19.         <name>dfs.replication</name>  

  20.         <value>2</value>  

  21.     </property>  

  22.     <property>  

  23.         <name>dfs.webhdfs.enabled</name>  

  24.         <value>true</value>  

  25.     </property>  

  26. </configuration>  


2.3.3.mapred-site.xml



  1. <configuration>  

  2.     <property>  

  3.         <name>mapreduce.framework.name</name>  

  4.         <value>yarn</value>  

  5.     </property>  

  6.     <property>  

  7.         <name>mapreduce.jobtracker.http.address</name>  

  8.         <value>nameNode:50030</value>  

  9.     </property>  

  10.     <property>  

  11.         <name>mapreduce.jobhistory.address</name>  

  12.         <value>nameNode:10020</value>  

  13.     </property>  

  14.     <property>  

  15.         <name>mapreduce.jobhistory.webapp.address</name>  

  16.         <value>nameNode:19888</value>  

  17.     </property>  

  18. </configuration>  


2.3.4.yarn-site.xml


[html] view plaincopy在CODE上查看代码片派生到我的代码片

  1. <configuration>  

  2.   

  3. <!-- Site specific YARN configuration properties -->  

  4.     <property>  

  5.         <name>yarn.nodemanager.aux-services</name>  

  6.         <value>mapreduce_shuffle</value>  

  7.     </property>  

  8.     <property>  

  9.         <name>yarn.resourcemanager.address</name>  

  10.         <value>nameNode:8032</value>  

  11.     </property>  

  12.     <property>  

  13.         <name>yarn.resourcemanager.scheduler.address</name>  

  14.         <value>nameNode:8030</value>  

  15.     </property>  

  16.     <property>  

  17.         <name>yarn.resourcemanager.resource-tracker.address</name>  

  18.         <value>nameNode:8031</value>  

  19.     </property>  

  20.     <property>  

  21.         <name>yarn.resourcemanager.admin.address</name>  

  22.         <value>nameNode:8033</value>  

  23.     </property>  

  24.     <property>  

  25.         <name>yarn.resourcemanager.webapp.address</name>  

  26.         <value>nameNode:8088</value>  

  27.     </property>  

  28. </configuration>  


2.3.5.slaves


  1. dataNode1  

  2. dataNode2  


2.3.6.修改JAVA_HOME

分别在文件hadoop-env.sh和yarn-env.sh中添加JAVA_HOME配置

vi hadoop-env.sh

  1. export JAVA_HOME=/usr/java/jdk1.7.0_65  

vi yarn-env.sh


  1. export JAVA_HOME=/usr/java/jdk1.7.0_65  2.4.格式化文件系统

格式化文件系统:


  1. bin/hdfs namenode -format  

2.5.启动、停止服务

现在可以启动服务了

2.5.1.启动



  1. [root@nameNode sbin]# ./start-dfs.sh  



  1. [root@nameNode sbin]# ./start-yarn.sh  

2.5.2.停止


  1. [root@nameNode sbin]# ./stop-dfs.sh  



  1. [root@nameNode sbin]# ./stop-yarn.sh  


3.验证

3.1.查看启动的进程


  1. [root@nameNode sbin]# jps  


  1. 7854 Jps  

  2. 7594 ResourceManager  

  3. 7357 NameNode  


3.2.通过浏览器访问

http://192.168.17.100:50070/



http://192.168.17.100:8088/



你可能感兴趣的:(hadoop)