Hadoop分布式集群搭建

文章目录

  • 虚拟机准备
    • 修改IP、DNS、hostname、hosts
    • 关闭防火墙
    • 建立SSH互信
    • 安装JDK
  • 安装Hadoop
  • Hadoop集群启动及检查
  • Hadoop集群关闭

虚拟机准备

三台虚拟机(1台作为master节点,另外2台作为slave节点),虚拟机系统是centos7.5,并对虚拟机做如下的操作:

修改IP、DNS、hostname、hosts

  1. 使用 vi /etc/sysconfig/network-scripts/ifcfg-网卡名 修改网络环境,需要重启网络服务才生效:systemctl restart network
  2. 使用vi /etc/resolv.conf 修改DNS
  3. 使用 vi /etc/hostname 修改主机名
  4. 修改hosts文件 vi /etc/hosts

关闭防火墙

  1. 使用 systemctl stop firwalld.service 关闭防火墙
  2. 使用 systemctl disabled firewalld.service 关闭防火墙开机启动
  3. 查看防火墙的状态: systemctl status firwalld.service (当显示为inactive说明防火墙关闭)
  4. 关闭内核防火墙
    setenforce 0
    然后:vi /etc/selinux/config
    SELINUX=disabled

建立SSH互信

  1. 使用 ssh-keygen -t rsa 生成公钥和私钥
  2. 把3台机器的公钥id_rsa.pub都写入到authorized_keys 文件中,如果没有authorized_keys 文件,创建该文件并设置权限为600
    ssh-copy-id -i id_rsa.pub -p 22 username@hostname
  3. 检查authorized_keys文件的权限是否为600, 文件夹.ssh是否是700
  4. 使用ssh 计算机名就可以访问其他的机器了

安装JDK

  1. 下载并解压缩JDK
  2. 配置环境变量:vi ~/.bashrc
    添加: export JAVA_HOME=Java_path
    export JRE_HOME=…
    export CLASSPATH=…
    export PATH=…
  3. 使环境变量生效:source ~/.bashrc
  4. 检查java是否安装成功: java -version

安装Hadoop

	--hadoop的版本是2.6.5
  1. 下载并解压缩Hadoop
  2. 配置Hadoop环境变量:vi ~/.bashrc
  3. 环境变量生效:source ~/.bashrc
  4. 配置hadoop.env.sh文件(运行Hadoop脚本中使用的环境变量的配置)
    如果没有其他的需求,只要添加JAVA_HOME就可以
    tip:如果要分离配置文件和安装文件就可以添加HADOOP_CONF_DIRHADOOP_LOG_DIR
  5. 配置yarn.env.sh文件(Yarn的环境变量的配置文件)
    一般情况下只要添加JAVA_HOME就可以
    也可以修改YARN_LOG_DIR
  6. 配置slaves文件(slave节点的配置文件
  7. 配置core-site.xml文件(Hadoop的核心配置文件)
    Hadoop分布式集群搭建_第1张图片
  8. 配置hdfs-site.xml(Hadoop守护进程的配置项)
    Hadoop分布式集群搭建_第2张图片
  9. 配置mapred-site.xml
    在这里插入图片描述
  10. 配置yarn-site.xml文件
    Hadoop分布式集群搭建_第3张图片
  11. 创建需要的文件夹

Hadoop集群启动及检查

  1. 格式化集群: hadoop namenode -formate
  2. 启动集群: start-dfs.sh start-yarn.sh
  3. 检查集群状态:
    使用jps查看节点的进程
    使用hadoop fs -ls / 查看hdfs文件目录
    使用hadoop fs -put source_file hdfs_url
    使用hadoop fs -get hdfs_url path

Hadoop集群关闭

./stop-all.sh

你可能感兴趣的:(Hadoop)