Hadoop伪分布式集群搭建

一、切换到root用户

su - root

二、关闭selinux:vim /etc/selinux/config

SELINUX=disabled

三、切换到hadoop用户,配置免密登陆。

cd 进入hadoop用户的家目录

ssh-keygen -t rsa [输入完后连按4个回车]

ssh node100 [yes,输入hadoop用户的密码]

ssh-copy-id node100 [输入hadoop用户的密码]

四、解压安装jdk和hadoop

可新建一个module文件夹,将jdk与hadoop解压到该文件夹下。

五、编辑环境变量:vim ~/.bash_profile

在文件末尾添加

JAVA_HOME=jdk所在文件夹名称

HADOOP_HOME=hadoop所在文件夹名称

PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export JAVA_HOME

export HADOOP_HOME

export PATH

六、重新加载该文件,使环境变量生效

source ~/.bash_profile

java -version

hadoop version

七、修改hadoop的配置文件:cd /opt/module/hadoop-2.7.3/etc/hadoop

1.vim ./hadoop-env.sh

export JAVA_HOME=jdk所在文件夹名称

2.vim ./mapred-env.sh

export JAVA_HOME=jdk所在文件夹名称

3.vim ./yarn-env.sh

export JAVA_HOME=jdk所在文件夹名称

4.vim ./core-site.xml

       

       

                fs.defaultFS

                hdfs://node100:9000

       

       

       

                hadoop.tmp.dir

                /opt/module/hadoopdata

       

5.vim ./hdfs-site.xml

       

       

                dfs.replication

                1

       

       

       

                dfs.namenode.secondary.http-address

                node100:50090

       

6.cp ./mapred-site.xml.template ./mapred-site.xml

vim ./mapred-site.xml

   

   

        mapreduce.framework.name

        yarn

   

7.vim ./yarn-site.xml

       

       

                yarn.nodemanager.aux-services

                mapreduce_shuffle

       

       

       

                yarn.resourcemanager.hostname

                node100

       

       

       

                yarn.nodemanager.vmem-check-enabled

                false

       

八、格式化hadoop集群

hdfs namenode -format

九、启动/关闭hadoop集群

启动hadoop集群:start-all.sh

关闭hadoop集群:stop-all.sh

十一、验证集群

192.168.5.100:50070

192.168.5.100:8088

十二、Hadoop的wordcount

1.vim word.txt

hello python

hello java

hello scala

hello world

welcome to beijing

2.wordcount测试

hadoop fs -mkdir /test

hadoop fs -put ./word.txt /test

hadoop jar /opt/module/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /test/word.txt /output

hadoop fs -cat /output/part-r-00000

你可能感兴趣的:(Hadoop伪分布式集群搭建)