CDH5.15集成spark2

                                           CDH5.15集成spark2

简介:

在我的CDH5.15集群中,默认安装的spark是1.6版本,这里需要将其升级为spark2.x版本。经查阅官方文档,发现spark1.6和2.x是可以并行安装的,也就是说可以不用删除默认的1.6版本,可以直接安装2.x版本,它们各自用的端口也是不一样的。我尝试了安装spark2.3版本,大告成功,这里做一下安装spark2.3版本的步骤记录。

一.  安装准备

所需软件

①csd包:http://archive.cloudera.com/spark2/csd/

CDH5.15集成spark2_第1张图片

②parcel包:http://archive.cloudera.com/spark2/parcels/2.3.0.cloudera3/

CDH5.15集成spark2_第2张图片

 以上均选择红框内的内容下载。

注意,下载对应版本的包,我的CentOS7,所以下载el7的包,若是CentOS6,就要下el6的包。

二.  开始安装

1.安装前可以停掉集群和Cloudera Management Service,也可以不停,但是待会还是要停止重启的。

2.上传CSD包到所有机器的/opt/cloudera/csd目录,并且修改文件的用户和组。注意如果本目录下有其他的jar包,把删掉或者移到其他目录

[root@kjtlxsvr6 csd]# chgrp cloudera-scm SPARK2_ON_YARN-2.3.0.cloudera3.jar 
[root@kjtlxsvr6 csd]# ls -la
total 16
drwxr-xr-x 2 cloudera-scm cloudera-scm    47 Jun 23 16:11 .
drwxr-xr-x 6 cloudera-scm cloudera-scm    67 May  1 17:46 ..
-rw-r--r-- 1 root         cloudera-scm 16109 Jun 23 16:04 SPARK2_ON_YARN-2.1.0.cloudera1.jar
[root@kjtlxsvr6 csd]#chown cloudera-scm SPARK2_ON_YARN-2.3.0.cloudera3.jar
[root@kjtlxsvr6 csd]# ls -la
total 16
drwxr-xr-x 2 cloudera-scm cloudera-scm    47 Jun 23 16:11 .
drwxr-xr-x 6 cloudera-scm cloudera-scm    67 May  1 17:46 ..
-rw-r--r-- 1 cloudera-scm cloudera-scm 16109 Jun 23 16:04 SPARK2_ON_YARN-2.1.0.cloudera1.jar
[root@kjtlxsvr6 csd]#

3.上传 SPARK2-2.3.0.cloudera3-1.cdh5.13.3.p0.458809-el7.parcel

   SPARK2-2.3.0.cloudera3-1.cdh5.13.3.p0.458809-el7.parcel.sha1

   manifest.json

到机器master的/opt/cloudera/parcel-repo目录下。注意:将   SPARK2-2.3.0.cloudera3-1.cdh5.13.3.p0.458809-el7.parcel.sha1重命名为   SPARK2-2.3.0.cloudera3-1.cdh5.13.3.p0.458809-el7.parcel.sha。如果有其他的安装包,不用删除 ,但是如果本目录下有其他的重名文件比如manifest.json文件,把它重命名备份掉。然后把那3个parcel包的文件放在这里。

4.如果刚刚没有停掉CM和集群,现在将他们停掉。然后运行命令。

5.把CM和集群启动起来。然后点击主机->Parcel页面,看是否多了个spark2的选项。如下图,你这里此时应该是分配按钮,点击,等待操作完成后,点击激活按钮

6.激活后,点击你的群集-》添加服务,添加spark2服务。注意,如果你这里看不到spark2服务,就请检查你的CSD包和parcel包是否对应,上面的步骤是否有漏掉。正常情况下,应该是能用了。我的集群到此已经OK.

最后附上一个成功集成spark2的截图

CDH5.15集成spark2_第3张图片

 

你可能感兴趣的:(CDH搭建)