2.Hadoop环境配置之虚拟机安装配置

1. VMware

1.1 VMware安装

一台电脑本身是可以装多个操作系统的,但是做不到多个操作系统切换自如,所以我们需要一款软件帮助我们达到这个目的,不然数仓项目搭建不起来。
推荐的软件为VMware,VMware可以使用户在一台计算机上同时运行多个操作系统,还可以像Windows应用程序一样来回切换。用户可以如同操作真实安装的系统一样操作虚拟机系统,甚至可以在一台计算机上将几个虚拟机系统连接为一个局域网或者连接到互联网。
以下是VMware Workstation Pro 16的下载安装步骤

1.1.1 下载

下载的官方网址:https://www.vmware.com/cn/products/workstation-pro/workstation-pro-evaluation.html
2.Hadoop环境配置之虚拟机安装配置_第1张图片
下载完成后双击安装包开始安装
image.png

1.2 安装

1.2.1欢迎界面

2.Hadoop环境配置之虚拟机安装配置_第2张图片

1.2.2 同意许可证

2.Hadoop环境配置之虚拟机安装配置_第3张图片

1.2.3 选择安装路径

2.Hadoop环境配置之虚拟机安装配置_第4张图片

1.2.4 用户体检计划

每次开启虚拟机时,会提醒让你更新版本,建议两个都不勾
2.Hadoop环境配置之虚拟机安装配置_第5张图片

1.2.5 快捷方式

建议勾选两个,安装后使用起来会比较方便
2.Hadoop环境配置之虚拟机安装配置_第6张图片

1.2.6 开始安装

2.Hadoop环境配置之虚拟机安装配置_第7张图片

1.2.7 等待安装完成

等待进度条全部走完。

1.2.8 安装完成

输入许可证,激活VMware
注:如果点击的是完成也没关系,后面还是输入许可证的。
2.Hadoop环境配置之虚拟机安装配置_第8张图片

1.2.9 输入许可证

许可证可自行够买。
2.Hadoop环境配置之虚拟机安装配置_第9张图片

1.2.10 VMware安装完毕

2.Hadoop环境配置之虚拟机安装配置_第10张图片

1.2.11 快捷方式

桌面上的快捷方式,双击图标就可以使用。

2. CentOS7下载安装

系统的安装得分两个步骤,第一步得配置一台电脑,选配CPU,内存,磁盘,网卡等硬件。第二步才是安装系统。

2.1 配置电脑

2.1.1 进入VMware

双击VMware图标,打开VMware后看到如下界面:
2.Hadoop环境配置之虚拟机安装配置_第11张图片
点击"创建新的虚拟机"按钮进行新建虚拟机创建。

2.1.2 自定义新的虚拟机

选择自定义(高级)(C)选项,然后点击"下一步"。
2.Hadoop环境配置之虚拟机安装配置_第12张图片

2.1.3 解决虚拟机的兼容性

点击"下一步"。
2.Hadoop环境配置之虚拟机安装配置_第13张图片

2.1.4 选择当前虚拟机的操作系统

先配置电脑,再安装系统。选择"稍后安装操作系统(S)“后单击"下一步”。
2.Hadoop环境配置之虚拟机安装配置_第14张图片

2.1.5 选择虚拟机将来需要安装的系统

因为不同的操作系统需要解决不同的兼容性问题,所以需要选择将来用什么系统,提前做适配。选择"Linux(L)“,版本选择:CentOS 7 64位,然后单击"下一步”。
2.Hadoop环境配置之虚拟机安装配置_第15张图片

2.1.6 命名虚拟机

为虚拟机命名,并且修改存放物理机的目录,然后单击"下一步"。
2.Hadoop环境配置之虚拟机安装配置_第16张图片

2.1.7 处理器配置

2.Hadoop环境配置之虚拟机安装配置_第17张图片
原则就是可以选满(跟物理机的CPU个数相同,但是不能超过)
1) 查看物理机CPU个数(Windows10为例)
将鼠标移至下方任务栏,单击鼠标右键选择"任务管理器",打开任务管理器后选择"性能"选项卡,如图:
2.Hadoop环境配置之虚拟机安装配置_第18张图片
点击"打开资源监视器",在资源管理器中选择"CPU",在右侧栏中拖动滚动条可以查看CPU个数,本机CPU从0~11总共12个。
2.Hadoop环境配置之虚拟机安装配置_第19张图片
2) 设置虚拟机处理器的数量
设置处理器数量和内核数量尽量小于主机内核总数。

2.Hadoop环境配置之虚拟机安装配置_第20张图片

2.1.8 设置虚拟机的内存

内存大小有一定要求,建议2G,不能给太多,后期会有多台虚拟机同时启动
2.Hadoop环境配置之虚拟机安装配置_第21张图片

2.1.9 选择虚拟机上网方式

1) 选择NAT的方式
2.Hadoop环境配置之虚拟机安装配置_第22张图片

2)安装VMware之后物理机的网络适配器信息(会多两个vmnet1和vmnet8)
2.Hadoop环境配置之虚拟机安装配置_第23张图片

注:vmnet8是虚拟机使用NAT模式上网的网卡

2.1.10 选择对应的文件系统的IO方式

选择默认推荐的,点击"下一步"。
2.Hadoop环境配置之虚拟机安装配置_第24张图片

2.1.11 选择磁盘的类型

2.Hadoop环境配置之虚拟机安装配置_第25张图片

2.1.12 选择磁盘的种类

2.Hadoop环境配置之虚拟机安装配置_第26张图片

2.1.13 选择虚拟机的磁盘大小

2.Hadoop环境配置之虚拟机安装配置_第27张图片

2.1.14 虚拟机文件的存放位置

2.Hadoop环境配置之虚拟机安装配置_第28张图片

2.1.15 电脑配置完毕

点击"完成",电脑配置完成。
2.Hadoop环境配置之虚拟机安装配置_第29张图片

2.2 安装系统(CentOS7)

在安装系统之前需要检查自己虚拟机的bios的虚拟化是否打开(大部分的电脑都是打开的,大家可以先尝试直接安装,如果出现错误再去调试,没有出错就不用管了)
以下是查看虚拟机bios是否开启的方式
(1)window10
2.Hadoop环境配置之虚拟机安装配置_第30张图片
(2)window7里面看不到(得去bios里面看)
(3)如果发现bios虚拟化没有开启怎么办,重启电脑,在加载界面时按f1-f10,或者电脑旁边一个小洞,具体怎么进入得去查一下(按照自己电脑的型号去查)
(4)修改虚拟化为开启(thinkpad为例)找到security 里面的VT并改成enabled
2.Hadoop环境配置之虚拟机安装配置_第31张图片
注:如果虚拟化没有开启报的是以下错误:
2.Hadoop环境配置之虚拟机安装配置_第32张图片

2.2.1 下载CentOS7

  1. Linux有很多种版本,我们选择使用:CentOS-7-x86_64-DVD-2009.iso 映像文件
  2. 官方地址:https://www.centos.org/

进入官网后点击"Download"按钮,进入下载页面:
2.Hadoop环境配置之虚拟机安装配置_第33张图片
选择"x86_64"进入镜像源文件的页面:
2.Hadoop环境配置之虚拟机安装配置_第34张图片
官网提供了多种下载文件的镜像源地址,可以自行选择速度较快的镜像源进行下载,本文选用了重庆大学的镜像源地址:https://mirrors.cqu.edu.cn/CentOS/7.9.2009/isos/x86_64/
2.Hadoop环境配置之虚拟机安装配置_第35张图片选择需要下载的版本,进行下载,文件较大,需要耐心等待,下载完成以后就可以进行安装了。

2.2.2 选择CD/DVD的方式安装系统

选择"使用ISO映像文件(M)",点击"浏览"按钮,选择下载好的iso文件。
2.Hadoop环境配置之虚拟机安装配置_第36张图片

点击"开启此虚拟机",进行安装。
2.Hadoop环境配置之虚拟机安装配置_第37张图片

2.2.3 系统安装引导界面

需要将鼠标点击进入界面中,但是鼠标会消失,此刻使用键盘的上下键来控制选项,图标变白了表示当前选中的是哪个选项,然后敲回车,表示执行所选选项。
注意:如果这个时候需要鼠标可以使用ctrl+alt一起按呼出鼠标。
选择"Install CentOS 7",然后点击回车键。
2.Hadoop环境配置之虚拟机安装配置_第38张图片
(1)耐心等待它的安装
2.Hadoop环境配置之虚拟机安装配置_第39张图片
(2)会自动跳转如下界面
选择简体中文。
2.Hadoop环境配置之虚拟机安装配置_第40张图片

2.2.4 需要定制化的内容

日期和时间
2.Hadoop环境配置之虚拟机安装配置_第41张图片
1)调整时间差
2.Hadoop环境配置之虚拟机安装配置_第42张图片
2)安装GHOME(图形化界面的方式)注意图上标注的点击顺序
2.Hadoop环境配置之虚拟机安装配置_第43张图片
3)配置磁盘分区
2.Hadoop环境配置之虚拟机安装配置_第44张图片
(1)手动添加分区
2.Hadoop环境配置之虚拟机安装配置_第45张图片
(2) 添加boot区 给上1G容量后点击添加挂载点
2.Hadoop环境配置之虚拟机安装配置_第46张图片
2.Hadoop环境配置之虚拟机安装配置_第47张图片
(3)添加swap交换分区
2.Hadoop环境配置之虚拟机安装配置_第48张图片
2.Hadoop环境配置之虚拟机安装配置_第49张图片
2.Hadoop环境配置之虚拟机安装配置_第50张图片
(4)配置根(/)目录
2.Hadoop环境配置之虚拟机安装配置_第51张图片
根目录作为存储使用,将剩下的空间都给他(50 - 4 - 1)= 45
2.Hadoop环境配置之虚拟机安装配置_第52张图片
3个分区都配置完毕过后可以点击完成
2.Hadoop环境配置之虚拟机安装配置_第53张图片
(5)分区配置完毕,点击接受更改
2.Hadoop环境配置之虚拟机安装配置_第54张图片
4)关闭kdump,节约内存
2.Hadoop环境配置之虚拟机安装配置_第55张图片
5)修改主机名
2.Hadoop环境配置之虚拟机安装配置_第56张图片
2.Hadoop环境配置之虚拟机安装配置_第57张图片

6)是否打开安全协议(开启与否都可以)
2.Hadoop环境配置之虚拟机安装配置_第58张图片
7)开始安装
2.Hadoop环境配置之虚拟机安装配置_第59张图片
8)安装时间比较长,大概需要10几分钟(设置root用户密码,一定要设置)
2.Hadoop环境配置之虚拟机安装配置_第60张图片
密码设置成什么自己决定,但是不要忘。
2.Hadoop环境配置之虚拟机安装配置_第61张图片

2.2.5 虚拟机的使用引导界面

1) 安装完成 重启虚拟机
2.Hadoop环境配置之虚拟机安装配置_第62张图片
2)进入引导界面(以下内容就按照图片走,就不做过多解释)
2.Hadoop环境配置之虚拟机安装配置_第63张图片
2.Hadoop环境配置之虚拟机安装配置_第64张图片
2.Hadoop环境配置之虚拟机安装配置_第65张图片
2.Hadoop环境配置之虚拟机安装配置_第66张图片
2.Hadoop环境配置之虚拟机安装配置_第67张图片
2.Hadoop环境配置之虚拟机安装配置_第68张图片
2.Hadoop环境配置之虚拟机安装配置_第69张图片
2.Hadoop环境配置之虚拟机安装配置_第70张图片
2.Hadoop环境配置之虚拟机安装配置_第71张图片
2.Hadoop环境配置之虚拟机安装配置_第72张图片
安装完成

2.2.6 切换root用户

当前登录的用户是刚刚创建的用户,权限会缺少,所以使用root,修改一些内容更加方便
2.Hadoop环境配置之虚拟机安装配置_第73张图片
1)切换root用户
2.Hadoop环境配置之虚拟机安装配置_第74张图片
2.Hadoop环境配置之虚拟机安装配置_第75张图片

刚才的引导再来一遍(就不再放图片了)
2.Hadoop环境配置之虚拟机安装配置_第76张图片
最后的用户变成root表示切换成功

2.3 网络配置

对安装好的VMware进行网络配置,方便虚拟机连接网络,本次设置建议选择NAT模式,需要宿主机的Windows和虚拟机的Linux能够进行网络连接,同时虚拟机的Linux可以通过宿主机的Windows进入互联网。

2.3.1 编辑VMware的网络配置

2.Hadoop环境配置之虚拟机安装配置_第77张图片
2.Hadoop环境配置之虚拟机安装配置_第78张图片
2.Hadoop环境配置之虚拟机安装配置_第79张图片
2.Hadoop环境配置之虚拟机安装配置_第80张图片
然后全部点击确定,VMware的网络配置就好了。

2.3.2 Windows的网络配置

以下以Window10为例
1)找到
2.Hadoop环境配置之虚拟机安装配置_第81张图片
2.Hadoop环境配置之虚拟机安装配置_第82张图片


2.Hadoop环境配置之虚拟机安装配置_第83张图片
2.Hadoop环境配置之虚拟机安装配置_第84张图片
按如上格式修改IP信息(地址,网关,DNS服务器),修改完毕后全部点击确定退出。

2.4 虚拟机网络IP修改地址配置

1)修改网络IP地址为静态IP地址,避免IP地址经常变化,从而方便节点服务器间的互相通信。

[root@hadoop100 ~]#vim /etc/sysconfig/network-scripts/ifcfg-ens33 

2)以下加粗的项必须修改,有值的按照下面的值修改,没有该项的则需要增加。

TYPE="Ethernet"    #网络类型(通常是Ethemet)
PROXY_METHOD="none"
BROWSER_ONLY="no"
BOOTPROTO="static"   #IP的配置方法[none|static|bootp|dhcp](引导时不使用协议|静态分配IP|BOOTP协议|DHCP协议)
DEFROUTE="yes"
IPV4_FAILURE_FATAL="no"
IPV6INIT="yes"
IPV6_AUTOCONF="yes"
IPV6_DEFROUTE="yes"
IPV6_FAILURE_FATAL="no"
IPV6_ADDR_GEN_MODE="stable-privacy"
NAME="ens33"   
UUID="e83804c1-3257-4584-81bb-660665ac22f6"   #随机id
DEVICE="ens33"   #接口名(设备,网卡)
ONBOOT="yes"   #系统启动的时候网络接口是否有效(yes/no)
#IP地址
IPADDR=192.168.10.100  
#网关  
GATEWAY=192.168.10.2      
#域名解析器
DNS1=192.168.10.2

3)修改IP地址后的结果如图所示,执行“:wq”命令,保存退出
2.Hadoop环境配置之虚拟机安装配置_第85张图片
4)执行systemctl restart network命令,重启网络服务。如果报错,则执行“reboot”命令,重启虚拟机

[root@hadoop100 ~]# systemctl restart network

5)使用ifconfig命令查看当前IP

[root@hadoop100 ~]# ifconfig

2.Hadoop环境配置之虚拟机安装配置_第86张图片
6)保证Linux系统ifcfg-ens33文件中IP地址、虚拟网络编辑器地址和Windows系统VM8网络IP地址相同

2.5 修改主机名和hosts文件

1)修改主机名称

[root@hadoop100 ~]# vim /etc/hostname
hadoop100

2)配置Linux克隆机主机名称映射hosts文件,打开/etc/hosts

[root@hadoop100 ~]# vim /etc/hosts

添加如下内容

192.168.10.130 hadoop100
192.168.10.131 hadoop101
192.168.10.132 hadoop102
192.168.10.133 hadoop103
192.168.10.134 hadoop104
192.168.10.135 hadoop105
192.168.10.136 hadoop106
192.168.10.137 hadoop107
192.168.10.138 hadoop108

3)重启虚拟机hadoop100

[root@hadoop100 ~]# reboot

4)修改windows的主机映射文件(hosts文件)
(1)如果操作系统是window7,可以直接修改
(a)进入C:\Windows\System32\drivers\etc路径
(b)打开hosts文件并添加如下内容,然后保存

192.168.10.130 hadoop100
192.168.10.131 hadoop101
192.168.10.132 hadoop102
192.168.10.133 hadoop103
192.168.10.134 hadoop104
192.168.10.135 hadoop105
192.168.10.136 hadoop106
192.168.10.137 hadoop107
192.168.10.138 hadoop108

(2)如果操作系统是window10,先拷贝出来,修改保存以后,再覆盖即可
(a)进入C:\Windows\System32\drivers\etc路径
(b)拷贝hosts文件到桌面
(c)打开桌面hosts文件并添加如下内容

192.168.10.130 hadoop100
192.168.10.131 hadoop101
192.168.10.132 hadoop102
192.168.10.133 hadoop103
192.168.10.134 hadoop104
192.168.10.135 hadoop105
192.168.10.136 hadoop106
192.168.10.137 hadoop107
192.168.10.138 hadoop108

(d)将桌面hosts文件覆盖C:\Windows\System32\drivers\etc路径hosts文件。

2.6 检查网络配置

配置完成后使用ping命令查看网络是否可以正常连接外部网络,以及主机与虚拟机之间网络是否通畅:

ping www.baidu.com
ping 主机地址

2.7 安装远程控制工具

通常在工作过程中,公司中使用的真实服务器或者是云服务器,都不允许除运维人员之外的员工直接接触,因此就需要通过远程登录的方式来操作。所以,远程登录工具就是必不可缺的,目前,比较主流的有Xshell,SecureCRT等,由于Xshell现在收费,我们使用MobaXterm免费版。
MobaXterm官方下载网址:https://mobaxterm.mobatek.net/download.html。MobaXterm分了收费版和免费版,免费版就足够使用。
2.Hadoop环境配置之虚拟机安装配置_第87张图片

将下载好的压缩包解压后会得到
2.Hadoop环境配置之虚拟机安装配置_第88张图片

双击MobaXterm.exe就可以进行安装,根据需要选择安装路径。安装完成后桌面会出现图标:
在这里插入图片描述

双击图标打开远程控制工具进行使用:

2.Hadoop环境配置之虚拟机安装配置_第89张图片

2.Hadoop环境配置之虚拟机安装配置_第90张图片

首次登录时需要输入用户名的密码,登录后的页面如下:
2.Hadoop环境配置之虚拟机安装配置_第91张图片
2.Hadoop环境配置之虚拟机安装配置_第92张图片

MobaXterm自带了上传和下载文件的工具,并且展示了主机的目录结构,可以通过点击进行选择。

2.8 配置模板机

为了后期搭建集群时减少不必要的步骤,将hadoop100虚拟机作为模板机进行配置,配置要求如下:

1. 安装epel-release

Extra Packages for Enterprise Linux是为“红帽系”的操作系统提供额外的软件包,适用于RHEL、CentOS和Scientific Linux。相当于是一个软件仓库,大多数rpm包在官方 repository 中是找不到的)。注意:安装前需要保证网络的畅通。

yum install -y epel-release

注意:
如果Linux安装的是最小系统版,还需要安装如下工具;如果安装的是Linux桌面标准版,不需要执行如下操作:

  • net-tool:工具包集合,包含ifconfig等命令
yum install -y net-tools
  • vim:编辑器
yum install -y vim

2. 关闭防火墙,关闭防火墙开机自启

systemctl stop firewalld
systemctl disable firewalld.service

注意:在企业开发时,通常单个服务器的防火墙时关闭的。公司整体对外会设置非常安全的防火墙

3. 创建一个用户,并修改用户的密码

useradd li
passwd xxxxxx

4. 配置新用户具有root权限,方便后期加sudo执行root权限的命令

vim /etc/sudoers

修改/etc/sudoers文件,在%wheel这行下面添加一行,如下所示:

## Allow root to run any commands anywhere
root ALL=(ALL) ALL
## Allows people in group wheel to run all commands
%wheel ALL=(ALL) ALL
li ALL=(ALL) NOPASSWD:ALL

注意:新用户这一行不要直接放到root行下面,因为所有用户都属于wheel组,你先配置了li具有免密功能,但是程序执行到%wheel行时,该功能又被覆盖回需要密码。所以li要放到%wheel这行下面。

5. 在/opt目录下创建文件夹,并修改所属主和所属组

  1. 在/opt目录下创建module、software文件夹
[root@hadoop100 ~]# mkdir /opt/module
[root@hadoop100 ~]# mkdir /opt/software
  1. 修改module、software文件夹的所有者和所属组均为li用户
[root@hadoop100 ~]# chown li:li /opt/module 
[root@hadoop100 ~]# chown li:li /opt/software
  1. 查看module、software文件夹的所有者和所属组
root@hadoop100 ~]# cd /opt/
[root@hadoop100 opt]# ll

6. 卸载虚拟机自带的JDK

[root@hadoop100 ~]# rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps 

注意:如果你的虚拟机是最小化安装不需要执行这一步。

  • rpm -qa:查询所安装的所有rpm软件包
  • grep -i:忽略大小写
  • xargs -n1:表示每次只传递一个参数
  • rpm -e –nodeps:强制卸载软件

7. 重启虚拟机

[root@hadoop100 ~]# reboot

2.9 克隆虚拟机

  1. 利用模板机hadoop100,克隆四台虚拟机:hadoop101、hadoop102、 hadoop103、 hadoop104

在菜单中选择"虚拟机",“管理”,“克隆”。
2.Hadoop环境配置之虚拟机安装配置_第93张图片

注意:克隆时,要先关闭hadoop100
2.Hadoop环境配置之虚拟机安装配置_第94张图片

2.Hadoop环境配置之虚拟机安装配置_第95张图片

2.Hadoop环境配置之虚拟机安装配置_第96张图片
在这里插入图片描述

  1. 克隆完成后修改克隆机的IP,以下以hadoop102举例说明

启动hadoop102,修改IP地址,配置网络

[root@hadoop100 ~]# vim /etc/sysconfig/network-scripts/ifcfg-ens33

修改成:

YPE="Ethernet"
PROXY_METHOD="none"
BROWSER_ONLY="no"
BOOTPROTO="static"
DEFROUTE="yes"
IPV4_FAILURE_FATAL="no"
IPV6INIT="yes"
IPV6_AUTOCONF="yes"
IPV6_DEFROUTE="yes"
IPV6_FAILURE_FATAL="no"
IPV6_ADDR_GEN_MODE="stable-privacy"
NAME="ens33"
UUID="39ae2502-0908-4bd7-ab6d-e9f016dbcdfd"
DEVICE="ens33"
ONBOOT="yes"
IPADDR=192.168.10.132
GATEWAY=192.168.10.2      
DNS1=192.168.10.2
PREFIX=24

注意:保证Linux系统ifcfg-ens33文件中IP地址、虚拟网络编辑器地址和Windows系统VM8网络IP地址相同。

  1. 修改克隆机主机名,以下以hadoop102举例说明

修改主机名称

[root@hadoop100 ~]# vim /etc/hostname
hadoop102

配置Linux克隆机主机名称映射hosts文件,打开/etc/hosts

[root@hadoop100 ~]# vim /etc/hosts
/etc/.hosts.swp"

添加如下内容:

192.168.10.130 hadoop100
192.168.10.131 hadoop101
192.168.10.132 hadoop102
192.168.10.133 hadoop103
192.168.10.134 hadoop104
192.168.10.135 hadoop105
192.168.10.136 hadoop106
192.168.10.137 hadoop107
192.168.10.138 hadoop108
  1. 重启克隆机hadoop102
root@hadoop100 ~]# reboot

其他机器也需要做如上配置,因为每台虚拟机的ip地址和主机名称都不一样。参考hadoop102对其他机器进行配置。

你可能感兴趣的:(Hadoop大数据技术,hadoop,windows,大数据)