大数据环境搭建之一键部署

作者:Neshoir

   大数据环境搭建是一项比较复杂的工作,因为其依赖的大数据基础平台组件较多,导致很多基础薄弱的伙伴在搭建环境时遇到各种不顺,索性我们定制化了两个一键部署包产品,产品包里包含了虚拟机系统,hadoop组件,hbase组件,spark组件等。定制化的产品包的好处就是,虚拟机系统已经内置了一些依赖库或环境,hadoop等组件已配置好相关的属性。所有的部署过程都编写了自动化部署的脚本,小伙伴只需要按下面的步骤进行,即可体验全套的大数据产品。

一、产品包下载

​ 目前在CentOS 7.5和Ubuntu 16.04系统上做了定制化及优化。产品包里有虚拟机操作系统和一键安装包。注:如果在其他Linux系统上安装部署,必须安装ssh服务,软件版本微调,需要在脚本里替换软件的名称。提取码:xujb

  • onestep-CentOS 7.5
  • onestep-Ubuntu 16.04
二、虚拟机环境准备(以centos为例)
  1. 解压centos-7.5.rar包,复制三份。

  2. 用VMware(12.5以上版本)打开三台centos系统。

  3. 分别用root用户登录,密码为test。

  4. 用命令:ifconfig,查看三台机器的ip,建议将其ip配置为固定ip。

  5. 由于三台机器复制的名称是一样的,分别将三台机器的名称改为 master.com,node1.com,node2.com。命令:

    hostnamectl set-hostname master.com
    
三、onestep一键部署包配置
  1. 将onestep.tar包上传到master.com机器的/home目录下,并解压
    	 tar -xvf onestep.tar
    
  2. 编辑onestep/conf/host.conf文件,新增各节点机器信息,格式:机器ip 机器名称 root用户密码

大数据环境搭建之一键部署_第1张图片

  1. 编辑onestep/conf/init.conf文件,设置安装用户,软件,路径等,信息如截图,注:不需预先创建用户

大数据环境搭建之一键部署_第2张图片

  1. 准备脚本的执行,检查bin和expect目录所有文件,是否有执行权限,顺利安装成功会显示“初始化完毕!”

    	    # 如果没有权限,赋予权限
    		 chmod 777 *
    		# root用户下执行准备脚本,主要安装expect,ntp同步时间,关闭防火墙,安装jdk
    		 bin/01preinstall.sh
    
  2. 另外两台机器也会安装,登录到node1.com机器,验证时间同步服务和jdk。

    # 验证时间同步服务
    ntpstat
    # 切换到supermap用户,验证jdk
    su supermap		#输入密码
    java -version
    
四、节点机器之间安装ssh服务

​ 在master.com机器上,切换到supermap用户,执行如下脚本:

			su supermap 	#输入密码
			bin/02installssh.sh		#安装ssh服务
五、安装各组件包

​ 在master.com机器上,切换到supermap用户,执行如下脚本:

			su supermap 	#输入密码
			bin/03installSoft.sh	#安装hadoop,hbase,spark等组件,需要耗时几分钟
六、验证各个组件

​ 执行命令 ./start_all.sh 脚本,启动所有组件

  • hadoop组件的ui地址:http://master.com:50070/dfshealth.html#tab-datanode

大数据环境搭建之一键部署_第3张图片

  • hbase组件的ui地址:http://master.com:60000/master-status

大数据环境搭建之一键部署_第4张图片

  • spark组件的ui地址:http://master.com:8080/

大数据环境搭建之一键部署_第5张图片

   至此大数据组件的快速部署完成,可以用spark组件或者iServer进行大数据分析任务。注:iServer可以配置集群,iServer开启分布式服务可以支持外部的spark standalone以及spark on yarn模式,具体配置参考iServer开启集群配置文档和iServer开启分布式服务相关博客。

你可能感兴趣的:(大数据)