大数据-Hadoop环境搭建

2:环境搭建

在 Hadoop 具体开始前, 先来搭建一下环境

  1. 创建虚拟机
    1. 安装虚拟机 VMWare
    2. 创建虚拟机
    3. 安装 CentOS
    4. 组成集群
  2. 配置每台主机
    1. 关闭防火墙
    2. 关闭 SELinux
    3. 设置主机名
    4. 重启
    5. 设置时钟同步服务
    6. 配置用户权限
    7. 免密登录
  3. 安装辅助软件
    1. JDK
    2. Zookeeper
  4. 安装 Hadoop
    1. 下载并解压
    2. 修改配置
    3. 分发到每个节点
    4. 格式化 HDFS
    5. 启动集群

创建虚拟机

1:通过ISO镜像安装

2: 直接复制安装好的虚拟机

注意事项:windows系统确认所有的关于VmWare的服务都已经启动,

确认好VmWare生成的网关地址,另外确认VmNet8网卡已经配置好了IP地址。

  1. 网络模式
  2. 内存设置
  3. 规划集群, 创建多台虚拟机

1. 网络模式详解

大数据-Hadoop环境搭建_第1张图片

  • 桥接

    • 把虚拟出来的网卡直接连接外部的路由器, 看起来就好像是网络中多出了一台真正的计算机一样
    • 从路由器来看, 虚拟机等同于局域网内其它的物理机
      大数据-Hadoop环境搭建_第2张图片
  • NAT

    • 在宿主机中创建一个子网, 把虚拟机放入子网中, 子网中有一个NAT服务

大数据-Hadoop环境搭建_第3张图片

  • 仅主机
    • 创建子网, 把虚拟机放入这个子网

2. 内存设置

  • 需要三台虚拟机, 并且需要同时运行, 所以总体上的占用为: 每 台 虚 拟 机 内 存 × 3 每台虚拟机内存 \times 3 ×3
  • 在分配的时候, 需要在总内存大小的基础上, 减去1-2G作为系统内存, 剩余的除以3, 作为每台虚拟机的内存

每 台 机 器 的 内 存 = ( 总 内 存 − 4 ) ÷ 3 每台机器的内存 = \left ( 总内存 - 4\right ) \div 3 =(4)÷3

3. 集群规划

IP 主机名 环境配置 安装
192.168.174.100 node01 关防火墙和selinux, host映射, 时钟同步 JDK, NameNode, ResourceManager, Zookeeper
192.168.174.120 node02 关防火墙和selinux, host映射, 时钟同步 JDK, DataNode, NodeManager, Zeekeeper
192.168.174.130 node03 关防火墙和selinux, host映射, 时钟同步 JDK, DataNode, NodeManager, Zeekeeper

4:设置ip和Mac地址

更改mac地址:

vim /etc/udev/rules.d/70-persistent-net.rules

大数据-Hadoop环境搭建_第4张图片

更改IP地址:

vim /etc/sysconfig/network-scripts/ifcfg-eth0

修改主机名(重启后永久生效)

vi /ect/sysconfig/network

HOSTNAME=node01

设置ip和域名映射

vim /etc/hosts

你可能感兴趣的:(大数据)