hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考

首先在vm上安装一台Linux系统虚拟机,安装方法可以在网上查找

下面是安装好虚拟机之后的操作

可以下载一个finallshell工具,操作更方便

链接:https://pan.baidu.com/s/1dAdk7qvX4uEN2KLWZ5VHQw

提取码:9527

JDK1.8下载

链接:https://pan.baidu.com/s/1ElO1vHFRb6HR5ijRj2j_og 
提取码:9527

先在虚拟机系统上如下操作:

查看自己的IP

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第1张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第2张图片

登录虚拟机

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第3张图片

修改静态IP

首先找到/etc/sysconfig/network-scripts/下的ifcfg-ens33配置文件

vi /etc/sysconfig/network-scripts/ifcfg-ens33

把 BOOTPROTO = “dhcp” 改成 BOOTPROTO = “static” 表示静态获取,然后把 UUID 注释掉,把 ONBOOT 改为 yes,表示开机自动静态获取,然后在最后追加比如下面的配置:

IPADDR=192.168.241.161  #自己的ip地址,前9位和自己前面查看的相同,后三位可以150左右的值,我写了161,至于为什么可以网上查找

NETMASK=255.255.255.0

GATEWAY=192.168.241.2

DNS1=114.114.114.114

DNS2=8.8.8.8

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第4张图片

IPADDR就是静态IP,NETMASK是子网掩码,GATEWAY就是网关或者路由地址

重启网络服务
centos6的网卡重启方法:service network restart
centos7的网卡重启方法:systemctl restart network

然后用自己设置的IPADDR=192.168.241.161  #自己的ip地址

连接finallshell

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第5张图片

修改主机名 vi /etc/hostname

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第6张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第7张图片  

断开连接 shutdown -r

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第8张图片

重新连接

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第9张图片

检查是否有jdk

rpm -qa | grep jdk

rpm -qa | grep java

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第10张图片

进入opt文件夹创建software和apps文件夹用来存储软件包和解压包

cd /opt/

mkdir software

mkdir apps

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第11张图片

将安装包放入software文件夹中

然后进入software

 cd software

执行解压命令解压到apps文件夹

 tar -zxvf jdk-8u333-linux-x64.tar.gz -C /opt/apps/

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第12张图片

解压完成进入apps文件夹

 cd ..

cd apps/

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第13张图片

改名为jdk

 mv jdk1.8.0_333 jdk

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第14张图片

配置环境变量

vi /etc/profile

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第15张图片

按i 编辑

export JAVA_HOME=/opt/apps/jdk

export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/lib

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第16张图片

按esc键退出编辑模式

按:wq 按回车保存退出

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第17张图片

生效配置文件

source /etc/profile

检查配置文件

java -version

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第18张图片

显示Java版本证明配置成功

也可以用执行java_home 方式验证

echo $JAVA_HOME

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第19张图片

安装hadoop

安装包放到software文件夹中

进入software文件夹

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第20张图片

将安装包安装到apps文件夹下面

tar -zxvf hadoop-2.7.6.tar.gz -C /opt/apps/

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第21张图片

安装完成后,进入apps文件夹中,改名为hadoop

cd ..

cd apps/

mv hadoop-2.7.6 hadoop

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第22张图片

配置环境变量

vi /etc/profile

export HADOOP_HOME=/opt/apps/hadoop

export PATH=$PATH:$JAVA_HOME/bin:$JAVA_HOME/lib:$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第23张图片

保存退出

生效配置文件

source /etc/profile

检查配置情况

hadoop version

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第24张图片

显示hadoop版本,单节点版配置成功

接下来

伪分布式搭建

关闭防火墙

systemctl stop firewalld

systemctl disable firewalld.service

systemctl status firewalld

 vi /etc/selinux/config

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第25张图片

配置镜像文件

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第26张图片

免密登录认证

生成公钥私钥

ssh-keygen -t rsa

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第27张图片

对localhost免密操作

第一次需要输入登录密码

ssh-copy-id root@localhost

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第28张图片

检查免密是否成功

ssh localhost

直接登录证明已成功

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第29张图片

退出exit

伪分布式文件配置

cd $HADOOP_HOME/etc/hadoop

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第30张图片

首先

vi core-site.xml

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第31张图片

写入配置信息

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第32张图片

        fs.defaultFS

        hdfs://localhost

 

进入

vi hdfs-site.xml 进行配置

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第33张图片

伪分布式配置副本数是1

接下来环境搭建

vi hadoop-env.sh

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第34张图片

export JAVA_HOME=/opt/apps/jdk      jdk的路径

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第35张图片

集群格式化及启动

 格式化 hadoop sbin 文件夹下

 hdfs namenode -format

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第36张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第37张图片

节点启动

start-dfs.sh

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第38张图片

查看是否启动成功

jps

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第39张图片

了解部分:

文件默认存储位置

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第40张图片

more slaves 所有的奴隶

  存放所有的datanode 的ip

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第41张图片

伪分布式测试案例

创建hadoop下data文件夹 words.txt文件 并写入内容

cd hadoop

mkdir data

cd data

touch words.txt

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第42张图片

vi words.txt

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第43张图片

写入下面单词保存退出用于测试

hello world

how are you

fine,think you

创建input文件夹

hdfs dfs -mkdir /input

查看input文件夹是否创建成功

hdfs dfs -ls /

将words.txt导入input文件夹

hdfs dfs -put ~/hadoop/data/words.txt /input

也可以用

hdfs dfs -put /root/hadoop/data/words.txt /input

~与/root作用相同 代表当前用户的家目录

检查是否导入成功

hdfs dfs -ls /input

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第44张图片

查看文件内容

hdfs dfs -cat /input/words.txt

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第45张图片

Hadoop官网文档 可以查看相关命令操作介绍

Apache Hadoop 2.7.6 –

执行测试

cd $HADOOP_HOME/share/hadoop/mapreduce

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第46张图片

 hadoop jar hadoop-mapreduce-examples-2.7.6.jar wordcount /input/ /output1

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第47张图片

查看output1文件是否被创建

hdfs dfs -ls /

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第48张图片

打开output1文件

 hdfs dfs -ls /output1

查看part-r-00000文件

hdfs dfs -cat /output1/part-r-00000

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第49张图片

打开浏览器看后台存储

192.168.241.161:50070

ip地址 端口号

http://192.168.241.161:50070/dfshealth.html#tab-overview

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第50张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第51张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第52张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第53张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第54张图片

伪分布式搭建完成

接下来

在此基础上搭建全分布式

检查防火墙是否关闭

 systemctl status firewalld

查看IP是否已设置

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第55张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第56张图片

IPADDR=192.168.241.161

NETMASK=255.255.255.0

GATEWAY=192.168.241.2

DNS1=114.114.114.114

DNS2=8.8.8.8

配置映射

vi /etc/hosts

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第57张图片

192.168.241.161  master

192.168.241.162  slave1

192.168.241.163  slave2

查看jdk是否安装配置

java -version

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第58张图片

查看hadoop是否安装配置

hadoop version

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第59张图片

配置core-site.xml文件

cd $HADOOP_HOME/

cd etc/hadoop

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第60张图片

vi core-site.xml

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第61张图片

        fs.defaultFS

        hdfs://master:8020

 

        hadoop.tmp.dir

        /opt/apps/tmp

 

    hadoop.proxyuser.root.hosts

    *

    hadoop.proxyuser.root.groups

    *

配置  hdfs-site.xml文件

vi hdfs-site.xml

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第62张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第63张图片

 

        dfs.namenode.name.dir

        file://${hadoop.tmp.dir}/dfs/name

  

 

        dfs.datanode.data.dir

        file://${hadoop.tmp.dir}/dfs/data

  

 

        dfs.replication

        3

  

 

        dfs.blocksize

        134217728

  

 

        dfs.namenode.secondary.http-address

        slave1:50090

  

 

        fs.checkpoint.dir

        file:///${hadoop.tmp.dir}/checkpoint/dfs/cname

  

 

        fs.checkpoint.edits.dir

        file:///${hadoop.tmp.dir}/checkpoint/dfs/cname

  

 

        dfs.http.address

        master:50070

  

配置mapred-site.xml文件

复制新建mapred-site.xml文件

cp mapred-site.xml.template mapred-site.xml

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第64张图片

vi mapred-site.xml

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第65张图片

        mapreduce.framework.name

        yarn

  

        mapreduce.jobhistory.address

        master:10020

  

        mapreduce.jobhistory.webapp.address

        master:19888

  

配置yarn-site.xml文件

vi yarn-site.xml

        yarn.nodemanager.aux-services

        mapreduce_shuffle

  

        yarn.resourcemanager.hostname

        master

  

        yarn.nodemanager.aux-services.mapreduce_shuffle.class

        org.apache.hadoop.mapred.ShuffleHandler

  

        yarn.resourcemanager.address

        master:8032

  

  yarn.resourcemanager.scheduler.address

        master:8030

  

        yarn.resourcemanager.resource-tracker.address

        master:8031

  

        yarn.resourcemanager.admin.address

        master:8033

  

        yarn.resourcemanager.webapp.address

        master:8088

  

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第66张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第67张图片

配置hadoop-env.sh文件

vi hadoop-env.sh

export JAVA_HOME=/opt/apps/jdk

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第68张图片

配置yarn-env.sh 环境文件

vi yarn-env.sh

 export JAVA_HOME=/opt/apps/jdk

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第69张图片

配置slaves文件

 vi slaves

master

slave1

slave2

将localhost删掉。我忘记删了

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第70张图片

重启机器

shutdown -r now

配置完成开始克隆

刚配置好的虚拟机名单击右键>管理>克隆

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第71张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第72张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第73张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第74张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第75张图片

 克隆成功后记得下面操作,每台克隆机都要操作,地址不要相同,我的三台是

161、162、163

修改静态IP

首先找到/etc/sysconfig/network-scripts/下的ifcfg-ens33配置文件

vi /etc/sysconfig/network-scripts/ifcfg-ens33

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第76张图片

每台克隆的虚拟机都更改好IPaddr后,可以连接到finalshell上方便操作

修改主机名 vi /etc/hostname

 

将默认的localhost改为slave1,另一台改为slave2

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第77张图片

 

Master上设置免密登录

设置slave1免密登录

ssh-copy-id root@slave1

并验证

ssh slave1

同样完成slave2

ssh-copy-id root@slave2

ssh slave2

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第78张图片

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第79张图片

接下来设置时间同步

下载安装ntp 和ntpdate服务器

yum -y install ntp ntpdate

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第80张图片

三台机器都要安装上

配置/etc/ntp.conf文件

vi /etc/ntp.conf

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第81张图片

后面的直接复制进去替换原文件就可以了

driftfile /var/lib/ntp/drift

logfile /var/log/ntpd.log

restrict default nomodify notrap nopeer noquery

restrict 127.0.0.1

restrict ::1

restrict 192.168.241.0 mask 255.255.255.0 nomodify notrap

server 0.asia.pool.ntp.org iburst

server 1.asia.pool.ntp.org iburst

server 2.asia.pool.ntp.org iburst

server 3.asia.pool.ntp.org iburst

server 127.127.1.0 iburst

fudge 127.127.1.0 stratum 10

restrict 0.asia.pool.ntp.org nomodify notrap noquery

restrict 1.asia.pool.ntp.org nomodify notrap noquery

restrict 2.asia.pool.ntp.org nomodify notrap noquery

restrict 3.asia.pool.ntp.org nomodify notrap noquery

includefile /etc/ntp/crypto/pw

keys /etc/ntp/keys

disable monitor

接下来ntp服务器初始化

systemctl enable ntpd

systemctl enable ntpdate

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第82张图片

检查是否启动

systemctl is-enabled ntpdate

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第83张图片

启动ntp 并检查对应进程

systemctl start ntpd

ps -ef | grep ntpd

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第84张图片

查看ntp的情况

ntpq -p

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第85张图片

执行同步并测试

hwclock -w

ntpstat

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第86张图片

接下来去salve1配置客户端服务器

设置定时器

crontab -e

10 23 * * * (/usr/sbin/ntpdate -u 192.168.241.161 && /sbin/hwclock -w) &> /var/log/ntpdate.log

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第87张图片

ntpdate进行初始化

systemctl enable ntpdate

执行格式化

hdfs namenode -format

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第88张图片

启动集群

start-dfs.sh

启动失败可以尝试下面操作后再启动

vi /etc/ssh/ssh_config #在最后面添加如下语句即可 StrictHostKeyChecking no UserKnownHostsFile /dev/null

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第89张图片

jps查看情况

启动yarn

start-yarn.sh

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第90张图片

查看日志文件

cd /opt/apps/hadoop/logs

more hadoop-root-datanode-master.log

浏览器打开http://192.168.241.161:50070/

案例测试

hadoop/data文件夹中创建测试文件vi poetry1.txt

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第91张图片

hello world

how are you

再创建第二个文件

vi poetry2.txt

fine,thank you

ok, good bye

创建文件夹 input

hdfs dfs -mkdir /input

上传到分布式文件系统 input中

hdfs dfs -put /root/hadoop/data/poetry*.txt /input

查看是否上传成功

hdfs dfs -ls /input

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第92张图片

执行程序自带应用

进入应用文件夹

cd $HADOOP_HOME/share/hadoop/mapreduce

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第93张图片

执行应用程序

 hadoop jar hadoop-mapreduce-examples-2.7.6.jar wordcount /input /output1

执行成功查看执行结果

hdfs dfs -ls /output1

hdfs dfs -cat /output1/part-r-00000

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第94张图片

网页查看效果

hadoop集群在vm虚拟机Linux系统下的搭建单、伪、全分布式搭建参考_第95张图片

stop-dfs.sh

stop-yarn.sh

注意事项

每次运行结束 Hadoop 后,都要执行 stop-all.sh 关掉Hadoop所有服务。下次想重新运行 Hadoop,不用再格式化 NameNode ,直接启动 Hadoop 即可

到这里基本OK了,干了几天的结果,希望对各位有所帮助,呀买碟、奥利给

你可能感兴趣的:(hadoop集群安装配置,linux,分布式,hadoop)