简单的HDFS集群部署流程

环境说明和准备
--------------------------------------------------

所需软件:

JDK-1.6.0.32
HADOOP- 1.0.3


环境说明:

集群中包括4个节点:1个Master,3个Salve,节点之间局域网连接,可以相互ping通,节点IP地址分布如下:

简单的HDFS集群部署流程_第1张图片

安装centOS5.5操作系统

管理员/密码:root/pku218
用户:hadoop/hadoop


******************************************************************************************************************

详细配置流程:
--------------------------------------------------

************************
JDK的安装
************************


1.root登陆,在/usr下建一个java文件夹和一个hadoop文件夹,默认用户和组是root,需要修改文件夹的属性,使其属于hadoop:
chown –R hadoop:hadoop hadoop
chown –R hadoop:hadoop java


简单的HDFS集群部署流程_第2张图片


2.将软件分别copy至文件夹中
简单的HDFS集群部署流程_第3张图片



3.解压JDK: ./jdk-6u32-linux-i586.bin
简单的HDFS集群部署流程_第4张图片


4. 配置环境变量:
  
    1) 切换到root下
    2) vim /etc/profile
    3) 再最后添加:
    exports JAVA_HOME=/usr/java/jkd1.6.0_32(这个视jdk的安装路径而定)
    exports CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH
    exports PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
    4) 保存后,重启电脑
    5) 完成后查看:java –version,正常情况下如下图,应该是安装后的版本:


简单的HDFS集群部署流程_第5张图片


************************
配置IP和修改主机名
************************


1.root身份登录:vim /etc/sysconfig/network-script/ifcfg-eth0

2.在其中添加如下信息:

BROADCAST=192.168.0.255
IPADDR=192.168.0.X
NETMASK=255.255.255.0
NETWORK=192.168.0.0
GATEWAY=192.168.0.1


简单的HDFS集群部署流程_第6张图片

3.重启电脑

4.在终端输入/sbin/ifconfig查看IP配置情况,配置正确如下图显示:

简单的HDFS集群部署流程_第7张图片

注意,四台电脑分别配置IP


5.在root下,在终端输入hostname new-hostname(输入自己定义的名称,比如slave1)

6.在root下,修改/etc/sysconfig/network中的HOSTNAME为自定义名称

简单的HDFS集群部署流程_第8张图片

7.切换回hadoop用户状态下





************************
配置SSH
************************


master和slave都要安装ssh

1. 终端输入:ssh-keygen –t rsa –P ‘’
注意,ssh和-keygen之间没有空格,rsa后面是大写P,最后两个单引号之间也没有空格



2.提示输入文件名保存key值,直接回车在slave的主文件夹下进入.ssh,
可以查看到两个文件,修改.ssh文件夹的权限: chmod –R 700 .ssh

简单的HDFS集群部署流程_第9张图片



3. 在master终端输入: scp ~/.ssh/id_rsa.pub 远程用户名@远程服务器ip:~/
注意:这时候需要输入slave的密码
简单的HDFS集群部署流程_第10张图片



4. 在slave终端输入: cat id_rsa.pub >> ~/.ssh/authorized_keys 
   在~/.ssh下产生一个authorized_keys文件


5. 修改authorized_keys权限到600:  chmod 600 authorized_keys


6. 切换到root身份,编辑配置文件: vim /etc/ssh/sshd_config


注意,第三行AuthorizedkeysFile后面应跟绝对路径:
/home/hadoop/.ssh/authorized_keys


简单的HDFS集群部署流程_第11张图片


7.在slave的root身份下,启动/sbin/service服务,如下图:



8.在master的root身份下,启动/sbin/service服务,同上

9.从master测试能否直接登录slave而不需要密码,在master终端输入:
ssh 用户名@ip地址  ---比如:ssh [email protected]


10.测试成功后,在master终端中exit出来




************************
安装HADOOP
************************


1.在slave的hadoop用户状态下,进入/usr/hadoop,建立一个新文件tmp.然后在hadoop文件夹下直接解压hadoop1.0.3
tar –zxvf hadoop.xxx.tar.gz


2.进入hadoop1.0.3文件夹,进入其中的src:
     1) 进入core文件夹,拷贝core_default.xml到hadoop1.0.3下的conf目录
     2) 进入hdfs文件夹,拷贝hdfs_default.xml到hadoop1.0.3下的conf目录
     3) 进入mapred文件夹,拷贝mapred_default.xml到hadoop1.0.3下的conf目录


简单的HDFS集群部署流程_第12张图片



3. 进入conf目录,删除其中的core-site.xml,hdfs-site.xml,mapred-site.xml,并同时把刚才加入的三个xxx.default.xml文件的文件名改成xxx-site.xml(就是替换而已)

4.修改conf目录下的hadoop-env.sh文件
1) 把export JAVA_HOME前的#去掉
2) 修改JAVA_HOME的内容为我们之前设置的JAVA_HOME的值即可


5.修改core-site.xml中的的内容:
     1) 修改hadoop.tmp.dir这个property的value,改成刚才我们建立的tmp文件夹的绝对路径

简单的HDFS集群部署流程_第13张图片

    2) 修改fs.default.name这个property的value,改成hdfs://192.168.0.2:9000

简单的HDFS集群部署流程_第14张图片


6. 修改hdfs-site.xml的内容:
修改dfs.replicaion这个property的value为1

简单的HDFS集群部署流程_第15张图片


7. 修改mapred-site.xml的内容:
修改mapred.job.tracker这个property的value为http://192.168.0.2:9001





8.在conf目录下,修改文件masters的内容,该为192.168.0.2,如图:


简单的HDFS集群部署流程_第16张图片


9.进入到hadoop1.0.3目录下

10.初始化,在slave终端输入: bin/hadoop namenode –format

简单的HDFS集群部署流程_第17张图片


11.配置完毕

你可能感兴趣的:(hadoop)