ambari部署Hadoop集群

ambari部署Hadoop集群

在三台初始机器上部署,具体安装配置过程参考之前的《Hadoop试验之虚拟机准备》 。

192.168.56.101 centos01
192.168.56.102 centos02
192.168.56.103 centos03

配置yum

yum源可以使用public repository,也可以在本地局域网搭建本地repository。

使用public repository,则在centos01上修改本地/etc/yum.repos.d/ambari.repo:

wget http://public-repo-1.hortonworks.com/ambari/centos6/2.x/updates/2.0.1/ambari.repo #注意ambari版本
cp ambari.repo /etc/yum.repo.d/ #该路径下文件名必须为ambari.repo
yum clean all && yum repolist

public repository一般在国外,网速慢经常导致安装失败。所以建议搭建本地yum源。下载Ambari、HDP、CentOS的软件库,然后用createrepo工具生成repository。最后用httpd或ftp等服务使其他节点可以访问该repository。

适用于CentOS 7 版本的Ambari Repository:
http://public-repo-1.hortonworks.com/ambari/centos7/2.x/updates/2.2.0.0/ambari-2.2.0.0-centos7.tar.gz.md5

下载适用于CentOS 7 版本的HDP Stack Repository:
HDP下载链接:
http://public-repo-1.hortonworks.com/HDP/centos7/2.x/updates/2.3.4.0/HDP-2.3.4.0-centos7-rpm.tar.gz.md5

HDP下载链接:
http://public-repo-1.hortonworks.com/HDP-UTILS-1.1.0.20/repos/centos7/HDP-UTILS-1.1.0.20-centos7.tar.gz.md5

本人采用的httpd。将上面三个压缩包解压到/var/www/html/,然后在该路径运行createrepo /var/www/html/ 。或者在其他路径建好本地仓库后创建软链接到/var/www/html/ 路径下ln -s /data /var/www/html/localrepo

最后配置/etc/yum.repos.d/ambari.repo,将一下信息写入即可。该配置文档分发到所有节点对应路径。

[local]
name=local
baseurl=http://centos01/ #使用软链接的话,写成centos01/localrepo
gpgcheck=0

安装ambari-server

在centos01上安装ambari-server yum install -y ambari-server

安装完后对Ambari Server做配置 ambari-server setup

配置完就可以启动Ambari Server ambari-server start

成功启动后就可以在浏览器访问管理界面,默认端口是8080 。 登录密码为 admin/admin 。登录后可以管理Ambari用户、界面和安装集群。

部署Hadoop集群

在Ambari web端点击“Launch Install Wizard”。

第一步 , 命名集群的名字,比如 bigdata。

第二步 , 选择一个 Stack,这个 Stack 相当于一个 Hadoop 生态圈软件的集合。Stack 的版本越高,里面的软件版本也就越高。 HDP版本与Apache Hadoop版本有个对应管理,详细可以查官网。

第三步 , 指定 Agent 机器(在终端使用`hostname -f`` 查看),这些机器会被安装 Hadoop 等软件包。这里需要指定当时在 Ambari Server 机器生成的私钥(ssh-keygen 生成的,公钥已经拷贝到 Ambari Agent 的机器)。另外不要选择“Perform [manual registration](javascript:void(null)) on hosts and do not use SSH“。因为我们需要 Ambari Server 自动去安装 Ambari Agent。

第四步 , Ambari Server 会自动安装 Ambari Agent 到刚才指定的机器列表。安装完成后,Agent 会向 Ambari Server 注册。成功注册后,就可以继续 Next 到下一步。

第五步 , 我们需要选择要安装的软件名称。本文环境选择了 HDFS,YARN + MapReduce2,Zoopkeeper,Storm 以及 Spark。选的越多,就会需要越多的机器内存。选择之后就可以继续下一步了。这里需要注意某些 Service 是有依赖关系的。如果您选了一个需要依赖其他 Service 的一个 Service,Ambari 会提醒安装对应依赖的 Service。

第六步和第七步 , 分别是选择安装软件所指定的 Master 机器和 Slave 机器,以及 Client 机器。这里使用默认选择即可(真正在生产环境中,需要根据具体的机器配置选择)。

第八步 , Service 的配置。绝大部分配置已经有默认值,不需要修改。初学者,如果不需要进行调优是可以直接使用默认配置的。有些 Service 会有一些必须的手工配置项,则必须手动输入,才可以下一步。

第九步 , Ambari 会总结一个安装列表,供用户审阅。这里没问题,就直接下一步。

第十步 , Ambari 会开始安装选择的 Service 到 Ambari Agent 的机器。安装完成之后,Ambari 就会启动这些 Service。

至此,集群已经安装完成。

报错排查

安装agent报错

第四步,Ambari Server安装各节点Agent时,所有节点都失败,报错显示:

ERROR: Bootstrap of host c6401.ambari.apache.org fails because previous action finished
with non-zero exit code (1)
> ERROR MESSAGE: Execute of '>' failed
> STDOUT: Try to execute '>'

解决:在/etc/yum.repos.d/ 下边必须有个名叫ambari.repo的源。

SSL报错

第四步,安装Agent时报错:

[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:579)

是由于系统的python版本过高,导致验证ssl失败,将python降级为2.7.5以下或修改每个安装节点的python证书验证配置文件,执行以下命令修改:sed -i 's/verify=platform_default/verify=disable/' /etc/python/cert-verification.cfg

还可以参考以下解决办法:

https://community.hortonworks.com/articles/68799/steps-to-fix-ambari-server-agent-expired-certs.html

https://community.hortonworks.com/questions/120861/ambari-agent-ssl-certificate-verify-failed-certifi.html

刷新浏览器

使用Ambari安装HDP时,如果在某一步耗时过长,需要刷新浏览器,重新之前的步骤,不然可能一直卡在某一步导致安装进行不下去。

Java环境变量

ambari-server setup 配置Ambari Server时会安装Java。安装完java,记得设置java相关PATH环境变量,切记将java的环境变量放在PATH前面。如果放在后面,会使用系统默认安装的java版本。安装新软件后,如果系统已经安装了其他版本的软件,切记设置PATH时将使用的bin放置在前面。

yum本地仓库

如果yum源通过http方式访问,需要确保/var/www/html/目录有下列文件夹且包含了相应的软件安装包:

  • ambari:安装ambari相关软件
  • centos74:安装操作系统相关软件
  • HDP:安装HDP相关软件
  • HDP-UTILS-1.1.0.21:安装HDP相关工具软件
  • mysql:安装mysql相关软件。非必须。

在/etc/yum.repos.d/目录要有以上几个仓库的yum源配置。

你可能感兴趣的:(ambari部署Hadoop集群)