搭建完全分布式Hadoop

文章目录

  • 一、Hadoop集群规划
  • 二、在主节点上配置Hadoop
    • (一)登录虚拟机
    • (二)设置主机名
    • (三)主机名与IP地址映射
    • (四)关闭与禁用防火墙
    • (五)配置免密登录
    • (六)配置JDK
    • (七)配置Hadoop
      • 1、上传安装包
      • 2、解压缩安装包
      • 3、配置环境变量
      • 4、编辑Hadoop环境配置文件 - hadoop-env.sh
      • 5、编辑Hadoop核心配置文件 - core-site.xml
      • 6、编辑HDFS配置文件 - hdfs-site.xml
      • 7、编辑MapReduce配置文件 - mapred-site.xml
      • 8、编辑YARN配置文件 - yarn-site.xml
      • 9、编辑数据节点文件 - workers
  • 三、从主节点分发到从节点
    • (一)从master节点分发到slave1节点
      • 1、分发JDK
      • 2、分发Hadoop
      • 3、分发环境配置文件
      • 4、刷新环境配置文件
      • 5、查看jdk和Hadoop版本
      • 6、分发主机名IP地址映射文件
    • (二)从master节点分发到slave2节点
      • 1、分发JDK
      • 2、分发Hadoop
      • 3、分发环境配置文件
      • 4、刷新环境配置文件
      • 5、查看jdk和Hadoop版本
      • 6、分发主机名IP地址映射文件
  • 四、格式化名称节点
  • 五、启动Hadoop集群
  • 六、初试HDFS Shell
  • 七、查看Hadoop WebUI
  • 八、运行MR应用 - 词频统计
  • 九、关闭Hadoop集群

一、Hadoop集群规划

搭建完全分布式Hadoop_第1张图片

二、在主节点上配置Hadoop

(一)登录虚拟机

  • 登录三个虚拟机
    搭建完全分布式Hadoop_第2张图片

(二)设置主机名

搭建完全分布式Hadoop_第3张图片

(三)主机名与IP地址映射

  • 执行命令:vim /etc/hosts
    搭建完全分布式Hadoop_第4张图片

(四)关闭与禁用防火墙

搭建完全分布式Hadoop_第5张图片

(五)配置免密登录

(六)配置JDK

搭建完全分布式Hadoop_第6张图片

export JAVA_HOME=/usr/local/jdk1.8.0_231
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

(七)配置Hadoop

1、上传安装包

  • 上传hadoop安装包
    搭建完全分布式Hadoop_第7张图片
  • 查看hadoop安装包
    搭建完全分布式Hadoop_第8张图片

2、解压缩安装包

  • 执行命令:tar -zxvf hadoop-3.3.4.tar.gz -C /usr/local
    搭建完全分布式Hadoop_第9张图片
  • 查看解压后的目录
    搭建完全分布式Hadoop_第10张图片

3、配置环境变量

  • 执行命令:vim /etc/profile
    搭建完全分布式Hadoop_第11张图片
export HADOOP_HOME=/usr/local/hadoop-3.3.4
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root
  • 存盘退出,执行命令:source /etc/profile,让配置生效
    搭建完全分布式Hadoop_第12张图片
  • 查看hadoop版本,执行命令:hadoop version
    搭建完全分布式Hadoop_第13张图片

4、编辑Hadoop环境配置文件 - hadoop-env.sh

  • 进入hadoop配置目录,执行命令:cd $HADOOP_HOME/etc/hadoop
    搭建完全分布式Hadoop_第14张图片
  • 执行命令:vim hadoop-env.sh
    搭建完全分布式Hadoop_第15张图片
export JAVA_HOME=/usr/local/jdk1.8.0_231
export HADOOP_HOME=/usr/local/hadoop-3.3.4
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
  • 存盘退出,执行命令:source hadoop-env.sh,让配置生效
    搭建完全分布式Hadoop_第16张图片

5、编辑Hadoop核心配置文件 - core-site.xml

  • 执行命令:vim core-site
    搭建完全分布式Hadoop_第17张图片
<configuration>
    
    <property>
        <name>fs.defaultFSname>
        <value>hdfs://master:9000value>
    property>
    
    <property>
        <name>hadoop.tmp.dirname>
        <value>/usr/local/hadoop-3.3.4/tmpvalue>
    property>
configuration>

6、编辑HDFS配置文件 - hdfs-site.xml

  • 执行命令:vim hdfs-site.xml
    搭建完全分布式Hadoop_第18张图片
<configuration>
    
    <property>
        <name>dfs.namenode.name.dirname>
        <value>/usr/local/hadoop-3.3.4/tmp/namenodevalue>
    property>
    
    <property>
        <name>dfs.datanode.data.dirname>
        <value>/usr/local/hadoop-3.3.4/tmp/datanodevalue>
    property>
    
    <property>
        <name>dfs.namenode.secondary.http-addressname>
        <value>master:50090value>
    property>
    
    
    <property>
        <name>dfs.namenode.http-addressname>
        <value>0.0.0.0:9870value>
    property>
    
    <property>
        <name>dfs.replicationname>
        <value>3value>
    property>
    
    <property>
        <name>dfs.permissions.enabledname>
        <value>falsevalue>
    property>
configuration>

7、编辑MapReduce配置文件 - mapred-site.xml

  • 执行命令:vim mapred-site.xml
    搭建完全分布式Hadoop_第19张图片
<configuration>
    
    <property>
        <name>mapreduce.framework.namename>
        <value>yarnvalue>
    property>
configuration>

8、编辑YARN配置文件 - yarn-site.xml

  • 执行命令:vim yarn-site.xml
    搭建完全分布式Hadoop_第20张图片
<configuration>
    
    <property>
        <name>yarn.resourcemanager.hostnamename>
        <value>mastervalue>
    property>
    
    <property>
        <name>yarn.nodemanager.aux-servicesname>
        <value>mapreduce_shufflevalue>
    property>
    
    <property>
        <name>yarn.nodemanager.vmem-check-enabledname>
        <value>falsevalue>
    property>
configuration>

9、编辑数据节点文件 - workers

  • 执行命令:vim workers
    搭建完全分布式Hadoop_第21张图片

三、从主节点分发到从节点

(一)从master节点分发到slave1节点

1、分发JDK

  • 执行命令:scp -r $JAVA_HOME root@slave1:$JAVA_HOME(注意,拷贝目录,一定要加-r选项)
    搭建完全分布式Hadoop_第22张图片
  • 在slave1节点上查看拷贝的JDK目录
    搭建完全分布式Hadoop_第23张图片

2、分发Hadoop

3、分发环境配置文件

4、刷新环境配置文件

5、查看jdk和Hadoop版本

6、分发主机名IP地址映射文件

(二)从master节点分发到slave2节点

1、分发JDK

2、分发Hadoop

3、分发环境配置文件

4、刷新环境配置文件

5、查看jdk和Hadoop版本

6、分发主机名IP地址映射文件

四、格式化名称节点

五、启动Hadoop集群

六、初试HDFS Shell

七、查看Hadoop WebUI

八、运行MR应用 - 词频统计

九、关闭Hadoop集群

你可能感兴趣的:(数据清洗和预处理,大数据离线分析,分布式,hadoop,大数据)