Impala学习笔记(一)CDH5.4.0安装

Impala是Cloudra公司发布的实时查询开源项目,基于Hive但使用内存进行计算,是使用CDH的首选PB级大数据实时查询分析引擎。


Impala的安装方式有两种,CM方式和手动安装,手动安装比较麻烦,需要额外的步骤验证与其他组件的交互,这里采用CM的方式安装。

1、安装准备
MySQL5.6.17版本
[root@dnode2 lucl]# rpm -ivh MySQL-server-5.6.17-1.el6.x86_64.rpm

Impala学习笔记(一)CDH5.4.0安装_第1张图片

由于版本冲突,卸载之前的MySQL5.1.71版本
[root@dnode2 lucl]# yum -y remove mysql-libs-5.1.71*

再次安装MySQL就可以了。
[root@dnode2 lucl]# rpm -ivh MySQL-server-5.6.17-1.el6.x86_64.rpm
[root@dnode2 lucl]# rpm -ivh MySQL-client-5.6.17-1.el6.x86_64.rpm

目录 说明
/usr/bin Client programs and scripts
/usr/sbin The mysqld server
/var/lib/mysq 数据文件
/usr/my.cnf 配置文件


2、下载CM和CDH
CM当前最新版本为5.5.1,这里安装CM5.4.0和CDH5.4.0。

http://www.cloudera.com/content/www/en-us/downloads.html

在该网站能够找到CM和CDH的下载链接,下载时选定了相应的版本后,会有安装的帮助信息。


安装CM可以使用在线安装和离线安装两种方式,在线安装也需要将基础安装包下载到本地再进行安装,安装过程中自动下载需要安装的软件,但对于带宽要求较高,由于国内的网络环境下载境外的资源时容易受到限制,影响安装速度,可以通过在本地配置yum源进行安装。

http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.4.0/

实际需要使用的文件为RPMS/x86_64目录下的文件:
Impala学习笔记(一)CDH5.4.0安装_第2张图片

http://archive.cloudera.com/cdh5/parcels/
Impala学习笔记(一)CDH5.4.0安装_第3张图片
说明:我的虚拟机环境为Centos6.5,这里只需要下载el6版本的即可。

3、将软件发布成web服务
在nnode节点上启动HTTP服务,CM和CDH的介质需要放在HTTP服务器的root目录下。
[root@nnode ~]# service httpd start


验证Web服务:
Impala学习笔记(一)CDH5.4.0安装_第4张图片

查找httpd的根目录:
[hadoop@nnode html]$ cat /etc/httpd/conf/httpd.conf |grep var/www/html
DocumentRoot "/var/www/html"
<Directory "/var/www/html">
[hadoop@nnode html]$ ll /var/www/html
total 0
[hadoop@nnode html]$


将下载的cm及cdh目录下的文件拷贝到该根目录下:
[root@nnode html]# mv /lucl/Cloudera/cm5 .
[root@nnode html]# mv /lucl/Cloudera/cdh5 .


RPM-GPG-KEY-cloudera的下载地址为:
https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera

目录结构:
[root@nnode html]# pwd
/var/www/html
[root@nnode html]# ll
total 12
drwxrwxr-x 3 hadoop hadoop 4096 Jan 10 04:27 cdh5
drwxrwxr-x 4 hadoop hadoop 4096 Jan 10 06:18 cm5
-rwxr-xr-x 1 root   root   1690 Jan 10 04:15 RPM-GPG-KEY-cloudera
[root@nnode html]#


cm5的目录结构为:
[root@nnode x86_64]# pwd
/var/www/html/cm5/RPMS/x86_64
[root@nnode x86_64]# ls
cloudera-manager-agent-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-daemons-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-server-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-server-db-2-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
enterprise-debuginfo-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
jdk-6u31-linux-amd64.rpm
oracle-j2sdk1.7-1.7.0+update67-1.x86_64.rpm
[root@nnode x86_64]# 

Impala学习笔记(一)CDH5.4.0安装_第5张图片

cdh5的目录结构为:
[root@nnode 5.4.0]# pwd
/var/www/html/cdh5/parcels/5.4.0
[root@nnode 5.4.0]# ll -h
total 1.2G
-rwxrwxr-x 1 hadoop hadoop 1.2G Jan 10 02:54 CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel
-rwxrwxr-x 1 hadoop hadoop   41 Jan 10 02:54 CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel.sha1
-rwxrwxr-x 1 hadoop hadoop  42K Jan 10 02:54 manifest.json
[root@nnode 5.4.0]# 

Impala学习笔记(一)CDH5.4.0安装_第6张图片

分别在cm5和parcels目录下执行createrepo .命令,为rpm建立索引
[root@nnode cm5]# createrepo .
Spawning worker 0 with 7 pkgs
Workers Finished
Gathering worker results

Saving Primary metadata
Saving file lists metadata
Saving other metadata
Generating sqlite DBs
Sqlite DBs complete
[root@nnode cm5]# 
# 执行后repodata目录会生成相应的文件。

[root@nnode parcels]# createrepo .

Saving Primary metadata
Saving file lists metadata
Saving other metadata
Generating sqlite DBs
Sqlite DBs complete
[root@nnode parcels]



4、配置yum源
通过cloudera网站下载repo资源文件
cloudera-manager的repo文件
https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/cloudera-manager.repo

cloudera-cdh的repo文件
https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/cloudera-cdh5.repo

说明:
[url]https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera[url]

[url]https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera[url]
内容实际是一样的,这里就使用了一份。

[root@nnode yum.repos.d]# cat cloudera-cdh5.repo 
[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://nnode/cdh5/parcels/
gpgkey=http://nnode/RPM-GPG-KEY-cloudera    
gpgcheck = 1

[root@nnode yum.repos.d]# cat cloudera-manager.repo
[cloudera-manager]
# Packages for Cloudera Manager, Version 5, on RedHat or CentOS 6 x86_64                  
name=Cloudera Manager
baseurl=http://nnode/cm5/
gpgkey=http://nnode/RPM-GPG-KEY-cloudera    
gpgcheck = 1

[root@nnode yum.repos.d]# 


5、下载安装脚本
http://archive.cloudera.com/cm5/installer/5.4.0/cloudera-manager-installer.bin

6、执行安装
chmod u+x cloudera-manager-installer.bin


在图形界面下执行./cloudera-manager-installer.bin

Impala学习笔记(一)CDH5.4.0安装_第7张图片

Impala学习笔记(一)CDH5.4.0安装_第8张图片

7、访问验证
http://nnode:7180
Impala学习笔记(一)CDH5.4.0安装_第9张图片
Impala学习笔记(一)CDH5.4.0安装_第10张图片

你可能感兴趣的:(impala)