Linux修改hadoop配置文件及启动hadoop集群详细步骤

目录

一、配置Hadoop环境

1.查看Hadoop解压位置

2.配置环境变量

3.编辑环境变量

4.重启环境变量

5.查看Hadoop版本,查看成功就表示Hadoop安装成功了

二、修改配置文件

1.检查三台虚拟机:

2.切换到配置文件目录

3.修改 hadoop-env.sh 文件

4.修改 core-site.xml 文件

5.修改 mapred-site.xml 文件

6.修改 hdfs-site.xml 文件

7.修改 yarn-site.xml 文件

8.修改 workers 文件

三、给hadoop2、hadoop3分发文件

1.到存放hadoop的文件夹下

2.1.给hadoop2和hadoop3拷贝文件和环境变量

2.2.给hadoop2和hadoop3创建软连接

2.3.检查hadoop2和hadoop3是否拷贝成功

2.4.如果没有拷贝成功就将hadoop2和hadoop3的hadoop文件夹删除,然后在拷贝一次

四、修改脚本文件

1.切换到hadoop的sbin目录下

2.修改 start-dfs.sh 脚本文件

3.修改 stop-dfs.sh 脚本文件

4.修改 start-yarn.sh 脚本文件

5.修改 stop-yarn.sh 脚本文件

 五、启动hadoop集群

1.格式化HDFS

2.启动hadoop

3.启动yarn

4.查看进程

5.关闭防火墙

6.访问Hadoop的web网站

7.停止hadoop

8.停止yarn

9.启动hadoop和yarn遇到的问题

六、编辑启动和停止脚本文件

1.进入脚本文件目录

2.编写集群控制文件

3.给 hadoop.sh 授权

4.启动集群,查看进程

5.停止集群,查看进程

七、编辑同步执行命令脚本

1.编辑

2.给 xcall.sh 授权

3.执行脚本

4.脚本的另一种写法


一、配置Hadoop环境

1.查看Hadoop解压位置

pwd

2.配置环境变量

vim /etc/profile

3.编辑环境变量

“/opt/server/hadoop”填自己Hadoop的存放位置。

export HADOOP_HOME=/opt/server/hadoop
export PATH=$PATH:$HADOOP_HOME/bin

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第1张图片

4.重启环境变量

source /etc/profile

5.查看Hadoop版本,查看成功就表示Hadoop安装成功了

hadoop version

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第2张图片

二、修改配置文件

1.检查三台虚拟机:

是否都安装了jdk和hadoop并且配置了环境变量,确保虚拟机之间都能互相ping通以及两两之间能够ssh免密登陆,都完成了网卡、主机名、hosts文件等配置。

ip地址 主机名 节点

192.168.147.200

hadoop 主节点

192.168.147.201

hadoop2 子节点

192.168.147.203

hadoop3 子节点

2.切换到配置文件目录

cd /opt/server/hadoop/etc/hadoop

3.修改 hadoop-env.sh 文件

路径改成自己的jdk安装路径(vim命令用不了就用vi)

vim hadoop-env.sh

export JAVA_HOME=/opt/server/jdk

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第3张图片

4.修改 core-site.xml 文件

vim core-site.xml



                      fs.defaultFS
                      
                      hdfs://hadoop:8020
          
                      
          
                      hadoop.tmp.dir
                      /opt/server/hadoop/data
          

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第4张图片

5.修改 mapred-site.xml 文件

vim mapred-site.xml



       
              mapreduce.framework.name
              yarn
       

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第5张图片

6.修改 hdfs-site.xml 文件

vim hdfs-site.xml



              
                            dfs.replication
                            3
              
              
              
                            dfs.namenode.secondary.http-address
                            hadoop2:50090
              

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第6张图片

7.修改 yarn-site.xml 文件

vim yarn-site.xml



           
           
                      yarn.resourcemanager.hostname
                      hadoop
           
           
                      yarn.nodemanager.aux-services
                      mapreduce_shuffle
           


Linux修改hadoop配置文件及启动hadoop集群详细步骤_第7张图片

8.修改 workers 文件

vim workers

hadoop
hadoop2
hadoop3

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第8张图片

三、给hadoop2、hadoop3分发文件

1.到存放hadoop的文件夹下

cd /opt/server/

2.1.给hadoop2和hadoop3拷贝文件和环境变量

scp -r hadoop-3.2.4/ root@hadoop2:/opt/server/hadoop-3.2.4/
scp /etc/profile root@hadoop2:/etc/profile

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第9张图片

2.2.给hadoop2和hadoop3创建软连接

ln -s hadoop-3.2.4/ hadoop

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第10张图片

2.3.检查hadoop2和hadoop3是否拷贝成功

hadoop的配置文件拷贝给了hadoop2和hadoop3,在hadoop2打开workers。

vim workers

hadoop2的workers没被修改,说明没拷贝成功。 

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第11张图片

2.4.如果没有拷贝成功就将hadoop2和hadoop3的hadoop文件夹删除,然后在拷贝一次

rm -rf hadoop-3.2.4

 Linux修改hadoop配置文件及启动hadoop集群详细步骤_第12张图片

 重复2.1的操作

四、修改脚本文件

1.切换到hadoop的sbin目录下

脚本文件都在sbin文件下。

cd /opt/server/hadoop/sbin

2.修改 start-dfs.sh 脚本文件

vim start-dfs.sh

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第13张图片

3.修改 stop-dfs.sh 脚本文件

vim stop-dfs.sh

HDFS_DATANODE_USER=root
HADOOP_SECURE_DN_USER=hdfs
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第14张图片

4.修改start-yarn.sh 脚本文件

vim start-yarn.sh

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

4.修改 start-yarn.sh 脚本文件

vim start-yarn.sh

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第15张图片

5.修改 stop-yarn.sh 脚本文件

vim stop-yarn.sh

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第16张图片

 五、启动hadoop集群

1.格式化HDFS

hadoop namenode -format
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第17张图片

2.启动hadoop

启动hadoop和yarn一定要在sbin目录下。 

./start-dfs.sh

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第18张图片

3.启动yarn

./start-yarn.sh

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第19张图片

4.查看进程

jps

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第20张图片

5.关闭防火墙

#关闭
systemctl stop firewalld.service
#查看
systemctl status firewalld.service
#防火墙失效设置
systemctl disable firewalld.service

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第21张图片

6.访问Hadoop的web网站

 ip+端口

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第22张图片

7.停止hadoop

./stop-dfs.sh

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第23张图片

8.停止yarn

./stop-yarn.sh

第一次停止yarn可能会出现以下情况:

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第24张图片

再输入一次命令就好了 

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第25张图片

9.启动hadoop和yarn遇到的问题

ERROR: JAVA_HOME is not set and could not be found.

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第26张图片

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第27张图片

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第28张图片

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第29张图片

出错的原因是2.3的hadoop配置文件没有成功拷贝给hadoop2和hadoop3,解决办法在2.4。

六、编辑启动和停止脚本文件

1.进入脚本文件目录

cd /opt/script/

如果没有script目录就新建一个。

mkdir script

2.编写集群控制文件

vim hadoop.sh

#! /bin/bash
case $1 in
"start" ) {
/opt/server/hadoop/sbin/start-dfs.sh
/opt/server/hadoop/sbin/start-yarn.sh
};;
"stop") {
/opt/server/hadoop/sbin/stop-dfs.sh
/opt/server/hadoop/sbin/stop-yarn.sh
};;
esac
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第30张图片

3.给 hadoop.sh 授权

chmod 777 hadoop.sh

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第31张图片

4.启动集群,查看进程

./hadoop.sh start

jps

查看hadoop进程 

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第32张图片
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第33张图片

查看hadoop2进程 

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第34张图片

5.停止集群,查看进程

./hadoop.sh stop

jps
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第35张图片
查看hadoop进程
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第36张图片
查看hadoop2进程
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第37张图片

七、编辑同步执行命令脚本

1.编辑

vim xcall.sh


#! /bin/bash

params=$@
hosts=( hadoop hadoop2 hadoop3)
for host in ${hosts[@]}
do
    echo ============ $host: $params ============
    ssh $host "source /etc/profile;$params" 
done
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第38张图片

2.给 xcall.sh 授权

chmod 777 xcall.sh
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第39张图片
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第40张图片

3.执行脚本

查看进程和主机名 

./xcall.sh jps

./xcall.sh hostname

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第41张图片

4.脚本的另一种写法

如果主机名是 hadoop1、hadoop2、hadoop3 可以用以下写法:

#! /bin/bash

params=$@
for (( i=1 ; i<=3 ; i=$i+1)) ; do
     echo ============= hadoop$i $params =============
     ssh hadoop$i "source /etc/profile;$params"
done

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第42张图片

但是 hadoop、hadoop2、hadoop3用这种写法会出现以下结果:

Linux修改hadoop配置文件及启动hadoop集群详细步骤_第43张图片
Linux修改hadoop配置文件及启动hadoop集群详细步骤_第44张图片

你可能感兴趣的:(Linux,linux,hadoop,运维)