Hadoop-3.3.6完全分布式集群搭建

目录

1.克隆两台虚拟机,作为从机使用

2.从机ip设置

3.Xshell连接

5.配置环境变量

6.配置hadoop-env.sh文件及其他重要文件

7.分发文件

8.启动hadoop集群并测试

9.访问web界面

10.运行官方案例



1.克隆两台虚拟机,作为从机使用

右击创建好的虚拟机hadoop base,选择管理-克隆-点击下一步-虚拟机中的当前状态-下一步-创建完整克隆-下一步-设置克隆机名称,安装位置-完成。

2.从机ip设置

启动两台从机,打开终端,修改主机名称分别为ljl01,ljl02。设置静态ip,与主节点ljl的hosts文件保持一致,设置成功重启网络。

Hadoop-3.3.6完全分布式集群搭建_第1张图片

3.Xshell连接

打开Xshell7,左上角新建文件,在弹出框设置两个从节点的名称和ip地址,然后连接,随后输入root账号密码完成连接。Hadoop-3.3.6完全分布式集群搭建_第2张图片

4.配置免密登录

回到主节点ljl,执行ssh-keygen -t rsa命令

Hadoop-3.3.6完全分布式集群搭建_第3张图片

把公钥复制到各个节点,第一次登陆会让你输入密码

Hadoop-3.3.6完全分布式集群搭建_第4张图片

Hadoop-3.3.6完全分布式集群搭建_第5张图片

对自己也需要设置免密登录

Hadoop-3.3.6完全分布式集群搭建_第6张图片

测试免密登录是否配置成功

Hadoop-3.3.6完全分布式集群搭建_第7张图片

测试成功之后,exit回到ljl节点

5.配置环境变量

在上一节,jdk和hadoop的环境变量都以配置好

Hadoop-3.3.6完全分布式集群搭建_第8张图片

6.配置hadoop-env.sh文件及其他重要文件

首先进入hadoop所在配置文件目录/usr/local/src/Hadoop-3.3.6/etc/hadoop,在此目录打开终端。

 vim Hadoop-env.sh

Hadoop-3.3.6完全分布式集群搭建_第9张图片

修改core-site.xml, vim core-site.xml

Hadoop-3.3.6完全分布式集群搭建_第10张图片

修改hdfs-site.xml文件

Hadoop-3.3.6完全分布式集群搭建_第11张图片

修改yarn-site.xml文件

Hadoop-3.3.6完全分布式集群搭建_第12张图片

修改mapred-site.xml文件

Hadoop-3.3.6完全分布式集群搭建_第13张图片

修改workers

Hadoop-3.3.6完全分布式集群搭建_第14张图片

7.分发文件

cd /usr/local/src
# 分发jdk,$PWD:获取当前所在目录的绝对路径
scp -r jdk1.8.0_211 root@ljl01:$PWD
scp -r jdk1.8.0_211 root@ljl02:$PWD
# 分发hadoop
scp -r hadoop-3.3.6 root@ljl01:$PWD
scp -r hadoop-3.3.6 root@ljl02:$PWD
# 分发/etc/hosts
scp /etc/hosts root@ ljl01:/etc/
scp /etc/hosts root@ ljl02:/etc/
# 分发/etc/profile
scp /etc/profile root@ ljl01:/etc/
scp /etc/profile root@ ljl02:/etc/

Hadoop-3.3.6完全分布式集群搭建_第15张图片

然后在两个从节点上执行 source /etc/profile

Hadoop-3.3.6完全分布式集群搭建_第16张图片

Hadoop-3.3.6完全分布式集群搭建_第17张图片

8.启动hadoop集群并测试

启动hdfs

start-dfs.sh

Hadoop-3.3.6完全分布式集群搭建_第18张图片

启动yarn

start-yarn.sh

Hadoop-3.3.6完全分布式集群搭建_第19张图片

jps 分别查看三个节点的进程

Hadoop-3.3.6完全分布式集群搭建_第20张图片Hadoop-3.3.6完全分布式集群搭建_第21张图片

Hadoop-3.3.6完全分布式集群搭建_第22张图片

9.访问web界面

主节点的地址+端口号(如:192.168.10.100:9870)

Hadoop-3.3.6完全分布式集群搭建_第23张图片

10.运行官方案例

统计每个单词出现的频率

vi words.txt 然后添加如下内容

hadoop hdfs hdfs Hadoop
mapreduce mapreduce Hadoop
hdfs Hadoop yarn yarn

hdfs dfs -mkdir /input #在hdfs上创建文件夹

hdfs dfs -put words.txt /input/  #把words.txt上传到dfs的input 文件夹中

后运行wordcount

Hadoop-3.3.6完全分布式集群搭建_第24张图片

hdfs dfs -ls /output #查看结果

Hadoop-3.3.6完全分布式集群搭建_第25张图片

集群搭建结束。

你可能感兴趣的:(分布式,hadoop,大数据)