大数据平台环境搭建准备

1.虚拟机安装
安装vmware,此处安装vmware14版本虚拟机,密匙易搜。
2.linux环境准备
下载linux系统镜像,下载地址:
http://archive.kernel.org/centos-vault/6.5/isos/x86_64/
cent-os下载巨细说明:
https://blog.csdn.net/sinat_36564972/article/details/81560395
此处鉴于本机原因选择cent-os-64位-6.5版本(现在一般服务server均使用7.4左右)
3.linux系统(cent-os)于虚拟机安装
关于安装cent-os有直接安装标准版,可以直接安装很容易,这样安装得到的是桌面版的cent-os系统,但是初始使用basic-server版的cent-os安装可以对该系统有个好的的了解,具体的安装本人借鉴于慕课网linux课程安装进行,也可以自行搜集进行linux系统的安装,安装需要注意的地方做一罗列。
不使用标准简易安装,使用自定义安装,之后进入安装,需要注意的是如果是win10系统,需要进入dos界面进行简单的设置。

大数据平台环境搭建准备_第1张图片

下一步选择好下载好的cent-os系统镜像文件:
大数据平台环境搭建准备_第2张图片

此处注意,开始安装虚拟需要给自己所在盘符如e盘下留有足够的空间,为了文件以及后续大数据hadoop体系组件搭建,留40g以上空间为保证后续操作顺畅。
win10系统创建虚拟机需要bois界面设置:
https://blog.csdn.net/sinat_37390744/article/details/56498655
安装前虚拟机创建好后,其中一般将处理器设置为多核,此处设置为4核,选择centos系统镜像文件网络选择桥接,简单的方法使得一台电脑上的多台虚拟机网络可以互通(桥接的意思是跟主机可以互相通信且是率属于同一网段,非主机路由出的子网段,如果是net模式是由主机路由出的子网),初始建议网络均选择桥接模式,桥接模式下在同一局域网下或者公司内网,之间均可以通信,但是需要注意如果公司网络大量用于开发使用,需要跟网络工程师沟通,看是否有闲置ip,否则造成ip冲突,网络不稳定,还会影响同时办公,也可以请教网络工程师进行协助,那样效率也会高很多,由于其它原因后续需要考虑与云主机进行通讯等,暂不巨细讨论。
网络选择桥接,选择镜像文件,内存选择1g(1g一般够用,本机内存是8g,内存1g分给虚拟机)
大数据平台环境搭建准备_第3张图片

开机(快速切入虚拟机按F2)
进入后选择第一项-->已经存在的系统-->之后检查选择skip跳过-->之后ok确认后进入centos的安装-->选择语言Chinese中文简体-->键盘美国英式标准-->设备选择基本存储设备默认-->默认之后选择安装模式-->此处为了节省存储空间-->使用自定义安装-->然后进行分区-->一般分区设置-->自定义分区-->必须根分区与boot分区,boot 200M home 2000M swap 1000M \ 根分选择剩余全部,作为最后需要的扩展分区(备存放逻辑分区)
-->格式化-->选择basic server,之后按照引导重新启动ok,密码设置此处均设置的不少于6位,完成安装,上述主要步骤如上,巨细可以查找资料或者慕课网linux安装。

安装成功后关机配置网络,在安装虚拟机后,进入网络适配器选项,修改vm8网络适配器,其网段与本机所在网络一致,此处再可以查找资料。


大数据平台环境搭建准备_第4张图片

修改vm8网络适配器后修改vmware的网路适配器


大数据平台环境搭建准备_第5张图片

大数据平台环境搭建准备_第6张图片

网络适配器参考:

配置好之后开机进入虚拟机。
上述安装完毕,虚拟机有两个功能比较实用,快照和克隆,快照记录下虚拟机某一状态,所得到的快照文件也就便于另一台,或者多态虚拟机的安装,克隆可以将整个系统克隆下来,生成的文件比快照要大,快照使用的更多一些,快照下某一时刻的应用,之间进行切换,便于系统恢复以及相关功能或者应用组件安装测试。

上述对于虚拟机的基本安装已经好了,接下来需要做一些为使用,再更进一步为大数据组件安装使用做一些准备工作。
网络配置:
vi /etc/sysconfig/network-scripts/ifcfg-eth0
如果是动态获取地址,BOOTPROTO=dhcp ,如果是设置静态地址,则BOOTPROTO=static

BOOTPROTO=static
IPADDR=192.168.1.103 (此处所在局域网的网络ip设置,与网络适配器属同一网段)
NETMASK=255.255.255.0
GATEWAY=192.168.1.1 (主机网络适配器设置的网关)
https://blog.csdn.net/u010064017/article/details/77883776
ONBOOT=yes
无论是动态还是静态,配置文件里默认的ONBOOT=no要改成ONBOOT=yes,然后保存。
service neteork restart 命令重启网络服务。
vi /etc/resolv.conf
添加域名服务器:
nameserver 218.2.135.1
nameserver 8.8.8.8
保存后,无需重启网卡,DNS立即生效。
网络成功配置参考:
https://blog.csdn.net/u010064017/article/details/77883776
https://blog.csdn.net/u014466635/article/details/80284792
网络防火墙关闭(较为简单,参考下文档,注意最好使用永久关闭防火墙):
service iptables stop(关闭)
chkconfig iptables off (永久关闭,使用永久关闭,三台机器均操作)
service iptables status
https://www.cnblogs.com/maybo/p/5250668.html
service network restart 重启网络服务

为了配置安装hadoop以及其它使用还需要进行主机名的设置
主机名进行设置(修改主机名):
[root@master /]# cat /etc/sysconfig/network #HOSTNAME=localhostzjx
NETWORKING=yes
HOSTNAME=master
NETWORKING_IPV6=yes

需要进行切换用户生效:
su - root

也可百度下设置用户名和密码,另外需要将进行网络通信的主机名与ip加入/etc/hosts 。这里面配置的是其它主机的ip与主机名的映射,由此才可以通过主机名进行访问。
vim /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
10.176.2.101 master
10.176.2.103 zjx03
10.176.2.105 zjx05
10.176.2.111 yjy11
10.176.2.113 yjy13
10.176.2.115 yjy15

可以使用主机名进行测试:
ssh master date

基本安装与环境配置到此已经完毕,可以使用此镜像完成

大数据hadoop安装准备
hadoop安装
hadoop下载地址:
http://central.maven.org/maven2/org/apache/hadoop/
https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

hadoop安装获取hadoop官方版本,另一个是CDH版本,关于安装版本选择,目前所使用的较多的有hadoop-2.5版本,但后续更多应用均采用2.7,此处也选用hadoop-2.7
有参考版本如下:
hadoop-2.5.0.tar.gz
hbase-0.98.6-cdh5.3.0
jdk-7u67-linux-x64
zookeeper-3.4.5-cdh.10.0

实际安装版本:
jdk-8.191
hadoop-2.7.7
zookeeper-3.4.5-cdh5.12.2
后续组件安装sqoop选用版本:sqoop-1.4.7.bin__hadoop-2.6.0
已成功安装对应此版本下的基于zookeeper的hadoop集群,此版本测试环境可以放心使用,生产环境待测。

下一篇:进行大数据平台搭建hadoop安装(单机版,hadoop集群版,zookeeper管理集群的安装)

不足之处还望指正,谢谢!Q:1098077157

你可能感兴趣的:(大数据平台环境搭建准备)