hadoop_4 分布式配置


--------------系统准备--------------------
测试firefox,ifconfig等功能,确保系统是ok的

sudo su root
gedit /etc/hosts 修改内容如下:
192.168.52.134 master
192.168.52.135 slave1
192.168.52.136 slave2

hostname master
gedit /etc/hostname master
把原来的Ubuntu删掉,不要用#注释,直接删掉,因为#没用,修改内容:
master

测试firefox  ping主机

------------安装---------------------

拷贝hadoop 和 jdk
sudo  -s ./jdk-6u41-linux-i586.bin

修改profile文件
sudo gedit /etc/profile
export JAVA_HOME=/home/tristan/jdk1.6.0_02 
export PATH=$PATH:/home/tristan/jdk1.6.0_02/bin 
export PATH=$PATH:/home/tristan/hadoop/bin 

修改profile文件
sudo gedit /etc/profile
export JAVA_HOME=/home/tristan/jdk1.6.0_41 
export PATH=$PATH:/home/tristan/jdk1.6.0_41/bin 
export PATH=$PATH:/home/tristan/hadoop/bin 

config hadoop xml
------hadoop-env.sh--------
export JAVA_HOME=/home/tristan/jdk1.6.0_41

------core-site.xml----
<property>  
  <name>fs.default.name</name>  
  <value>hdfs://master:9000</value>   
 </property>  

------mapred-site.xml------
     <property>   
      <name>mapred.job.tracker</name>  
      <value>master:9001</value>   
     </property>  

----hdfs-site.xml-----
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/home/tristan/name/</value> 
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/tristan/data/</value>
</property>

格式化namenode
hadoop namenode -format

测试
java -version
hadoop fs -ls /

--------------配置 启动 ---------------
hadoop-daemon.sh start namenode 
hadoop-daemon.sh start datanode 
hadoop-daemon.sh start secondarynamenode 
hadoop-daemon.sh start jobtracker 
hadoop-daemon.sh start tasktracker 
 
访问路径 
http://localhost:50070/dfshealth.jsp 
http://localhost:50030/jobtracker.jsp

运行wordcount实例
hadoop jar hadoop-examples-1.0.4.jar wordcount /sample/testA /result/testA

----------------clone第2 3台机器---------------------
配置ip文件slave1 slave2
确保能和master ping通
-----------------SSH-----------------
安装SSH
sudo apt-get install ssh

查看.ssh文件夹
ls -a /home/tristan

生成秘钥
ssh-keygen -t dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

验证
ssh -version
ssh localhost

复制到slave机器上
scp authorized_keys slave1:~/.ssh/

ssh slave1
ssh slave2

start-all.sh
stop-all.sh


-----------其他------------
如果slave1停掉了,在web界面中,live node还是为2
需要重新跑下start-all.sh。 live node 就变成1了


hadoop dfsadmin -refreshNodes
是为了在master段动态删除node

由于slave1 slave2 和master配置类似,而且可以用master端通过ssh控制
故只备份master的虚拟机就ok

你可能感兴趣的:(hadoop)