CDH5 Hadoop集群完全离线安装说明

CDH5

Hadoop集群完全离线安装说明

系统环境：CentOS6.5 64位

用到的文件

JDK1.8.0.111安装包

方法一使用：jdk-8u111-linux-x64.rpm

方法二使用：jdk-8u111-linux-x64.tar.gz

JDK环境配置（所有节点）

（先用命令：rpm -qa |

grep java

查看系统是否已自带了openjdk，若系统自带了openjdk，需要先卸载掉，方法参照后面说明）

通常有两种方式来安装JDK，根据从Oracle官网上下载的文件扩展名（tar.gz和.rpm），分别说明两种安装配置方式：

方法一：用rpm安装JDK

如果主机能访问外网，则联网下载安装包

[root@one-centos ~]#curl -O

http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.rpm

若不能访问外网，则使用离线包，将下载好的rpm包上传到主机某文件夹下（比如/home/root/下载）

[root@one-centos ~]#cd 下载

使用rpm命令安装：

[root@one-centos 下载] #rpm

-ivh jdk-8u111-linux-x64.rpm

[if !vml]

[endif]

设置环境变量：

[root@one-centos 下载]#vim/etc/profile

在打开的profile文件中添加如下内容：

#set java environment

JAVA_HOME=/usr/java/jdk1.8.0_111

JRE_HOME=/usr/java/jdk1.8.0_111/jre

CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

export JAVA_HOME JRE_HOME CLASS_PATH PATH

[if !vml]

[endif]

让修改生效

[root@one-centos 下载]#source

/etc/profile

验证JDK有效性：

[root@one-centos yt]#java -version

[root@one-centos yt]#java

[root@one-centos yt]#javac

[if !vml]

[endif]

[root@one-centos yt]#echo $JAVA_HOME

/usr/java/jdk1.8.0_111

方法二：用tar.gz包安装JDK

[root@localhost ~]#mkdir/usr/java

[root@localhost ~]#cd /usr/java

下载JDK，然后解压：

[root@localhost java]#curl -O

http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.tar.gz

[root@localhost java]#tar -zxvf jdk-8u111-linux-x64.tar.gz

设置环境变量：（同上）

[root@one-centos 下载]#vim/etc/profile

在打开的profile文件中添加如下内容：

#set java environment

JAVA_HOME=/usr/java/jdk1.8.0_111

JRE_HOME=/usr/java/jdk1.8.0_111/jre

CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

export JAVA_HOME JRE_HOME CLASS_PATH PATH

让修改生效：（同上）

[root@one-centos 下载]#source

/etc/profile

验证JDK有效性：（同上）

[root@one-centos yt]#java -version

[root@one-centos yt]#java

[root@one-centos yt]#javac

[if !vml]

[endif]

[root@one-centos yt]#echo $JAVA_HOME

/usr/java/jdk1.8.0_111

卸载Linux自带的openjdk

安装了centos7系统，发现自带了openjdk,想删除centos自带的jdk。具体方法如下：

1.使用rpm命令查看系统已经安装的java包

[root@dev]# rpm -qa | grep java

java-1.8.0-openjdk-headless-1.8.0.101-3.b13.el7_2.x86_64

javapackages-tools-3.4.1-11.el7.noarch

tzdata-java-2016f-1.el7.noarch

java-1.8.0-openjdk-1.8.0.101-3.b13.el7_2.x86_64

Python-javapackages-3.4.1-11.el7.noarch

2.使用rpm命令删除已安装的java依赖

[root@dev]# rpm -e --nodepsJava-1.8.0-openjdk-1.8.0.101-3.b13.el7_2.x86_64

[root@dev]# rpm -e --nodepsjava-1.8.0-openjdk-headless-1.8.0.101-3.b13.el7_2.x86_64

[root@dev]# rpm -e --nodeps tzdata-java-2016f-1.el7.noarch

[root@dev]# rpm -e --nodepsjavapackages-tools-3.4.1-11.el7.noarch

[root@dev]# rpm -e --nodepspython-javapackages-3.4.1-11.el7.noarch

3.再次检查java相关依赖以删除

[root@dev]# rpm -qa | grep java

[root@dev]# java -version

如果输出类似not found command则说明删除完成！

网络环境配置（所有节点）

我部署的集群中包括4个节点：1个master，3个salve，节点之间局域网连接，可以相互ping通。节点IP地址分布如下：

机器名称 IP地址

master 10.1.34.59

slave1 10.1.34.66

slave2 10.1.34.67

slave3 10.1.34.68

主机名配置

下面以master机器为例，即主机名为“master”，IP为“10.1.34.59”进行主机的配置，他的slave机器以此为依据进行修改。

命令hostname可查看当前主机名

修改hostname：

[root@master ~]#vim

/etc/sysconfig/network

[if !vml]

[endif]

配置完成之后，我们需要重启主机，命令：

[root@master ~]#reboot

（注：CentOS7以上系统修改主机名见附录）

配置hosts文件

“/etc/hosts”这个文件是用来配置主机将用的DNS服务器信息，是记载LAN内接续的各主机的对应HostName和IP用的。当用户在进行网络连接时，首先查找该文件，寻找对应主机名（或域名）对应的IP地址。

在进行Hadoop集群配置中，需要在“/etc/hosts”文件中添加集群中所有机器的IP与主机名，这样Master与所有的Slave机器之间不仅可以通过IP进行通信，而且还可以通过主机名进行通信。所以在所有的机器上的“/etc/hosts”文件末尾中都要添加如下内容：

[root@master ~]#vim

/etc/hosts

10.1.34.59 master

10.1.34.66 slave1

10.1.34.67 slave2

10.1.34.68 slave3

[if !vml]

[endif]

[if !vml]

[endif]

从上图中我们已经能用主机名进行ping通了，说明我们刚才添加的内容，在局域网内能进行DNS解析了，那么现在剩下的事儿就是在其余的slave机器上进行相同的配置。然后进行测试。

关闭防火墙

本文档是假定“服务器在防火墙以内”的前提下编纂的，在这个前提下，服务器本身在内部网络是不需要防火墙的（在需要抵御内部安全威胁的情况下，您也可以用您在iptables方面的相关知识，根据实情设置防火前，并保证服务器端防火墙启动的状态）。另外，在一般情况下，我们不需要SELinux复杂的保护，所以也将其设置为无效的状态。

关闭防火墙

[root@master ~]#serviceiptables stop

（注：service iptables stop (临时关闭)

chkconfig iptables off (重启后生效)

防火墙相关操作命令见附录）

关闭SELinux

[root@master ~]#vim/etc/sysconfig/selinux

将SELINUX=enforcing修改为SELINUX=disabled

[if !vml]

[endif]

（注：setenforce 0 (临时生效)）

SSH无密码验证配置

Hadoop运行过程中需要管理远端Hadoop守护进程，在Hadoop启动以后，NameNode是通过SSH（Secure Shell）来启动和停止各个DataNode上的各种守护进程的。这就必须在节点之间执行指令的时候是不需要输入密码的形式，故我们需要配置SSH运用无密码公钥认证的形式，这样NameNode使用SSH无密码登录并启动DataName进程，同样原理，DataNode上也能使用SSH无密码登录到NameNode。

安装和启动SSH协议

[root@master ~]#rpm

-qa | grep openssh

[root@master ~]#rpm

-qa | grep rsync

[if !vml]

[endif]

（注：我的本机已经安装了openssh和rsync，如果没有安装，可执行如下命令进行安装：

yum install ssh

yum install rsync

service sshd restart

要确保所有的服务器都安装了这两个工具）

配置master无密码登录所有salve

SSH无密码原理

[if !vml]

[endif]

[if !vml]

[endif]

SSH无密码原理简介：

master（NameNode |JobTracker）作为客户端，要实现无密码公钥认证，连接到服务器salve（DataNode | Tasktracker）上时，需要在master上生成一个密钥对，包括一个公钥和一个私钥，而后将公钥复制到所有的slave上。当master通过SSH连接salve时，salve就会生成一个随机数并用master的公钥对随机数进行加密，并发送给master。master收到加密数之后再用私钥解密，并将解密数回传给slave，slave确认解密数无误之后就允许master进行连接了。这就是一个公钥认证过程，其间不需要用户手工输入密码。重要过程是将客户端master复制到slave上。

master机器上生成密码对

在master节点上执行以下命令（以root账户登录）：

[root@master root]#ssh-keygen -t rsa -P ''

这条命令是生成其无密码密钥对，询问其保存路径时直接回车采用默认路径。生成的密钥对：id_rsa和id_rsa.pub，默认存储在“/home/hadoop/.ssh”目录下。

[if !vml]

[endif]

查看/home/hadoop/下是否有.ssh文件夹，且.ssh文件下是否有两个刚生产的无密码密钥对：

[if !vml]

[endif]

接着在master节点上做如下配置，把id_rsa.pub追加到授权的key里面去。

[root@master .ssh]#cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

在验证前，需要做两件事儿。第一件事儿是修改文件authorized_keys权限（权限的设置非常重要，因为不安全的设置安全设置，会让你不能使用RSA功能），另一件事儿是用root用户设置/etc/ssh/sshd_config的内容。使其无密码登录有效。

修改文件authorized_keys：

[root@master .ssh]#chmod 600 ~/.ssh/authorized_keys

设置SSH配置：

用root用户登录服务器修改SSH配置文件/etc/ssh/sshd_config的下列内容

[root@master .ssh]#vim /etc/ssh/sshd_config

[if !vml]

[endif]

（注：参数说明如下：

RSAAuthentication yes #启用RSA认证

PubkeyAuthentication yes #启用公钥私钥配对认证方式

AuthorizedKeysFile .ssh/authorized_keys #公钥文件路径，和上面生成的文件相同）

[if !vml]

[endif]

设置完之后重启SSH服务，能使刚才设置有效。

[root@master .ssh]#service sshd restart

[if !vml]

[endif]

验证是否成功。

[root@master .ssh]#ssh localhost

[if !vml]

[endif]

从上图得知无密码登录本机已经设置完毕，接下来是把公钥复制所有的slave机器上。

在往下做之前，把其他几台的公钥私钥全部产生，参照以上步骤。

使用下面的命令格式进行复制公钥：

scp ~/.ssh/id_rsa.pub远程用户名@远程服务器IP:~/

把master上的公钥复制到slave1上：

[hadoop@master .ssh]$scp ~/.ssh/id_rsa.pub hadoop@slave1:~/

[if !vml]

[endif]

从被复制的Slave机上可以用ls –a查看确实存在id_rsa.pub这个文件：

[root@slave1 ~]#ll

-a

[if !vml]

[endif]

依据以上方式，分别复制到其他几台slave主机的根目录下。

在所有slave机上，将公钥添加到授权密钥文件authorized_keys内（添加完成后，把/home/hadoop/目录下的id_rsa.pub文件删除掉）：

[root@slave1 ~]#cat

~/id_rsa.pub >> ~/.ssh/authorized_keys

[if !vml]

[endif]

配置所有slave无密码登录master

和master无密码登录所有slave原理一样，就是把slave的公钥追加到master的.ssh文件夹下的authorized_keys中，记得是追加（>>）。

思想：分别在其他几台slave机上使用scp命令，将slave上的公钥发到master上去，然后每发送一个，在master上，使用cat命令将slave的公钥添加到master的授权文件中。然后把传过来的公钥文件删除。

比如我这里的slave1机发送公钥到master机：

[root@slave1 ~]#scp

~/.ssh/id_rsa.pub [email protected]:~/

[if !vml]

[endif]

然后master机上，将slave1的公钥添加到master的授权文件中：

[root@master .ssh]#cat ~/id_rsa.pub >> ~/.ssh/authorized_keys

[if !vml]

[endif]

到此，配置已完成。验证一下ssh可以master和slave之间的无密码相互登陆

[if !vml]

[endif]

安装NTP服务（所有节点）

集群中所有主机必须保持时间同步，如果时间相差较大会引起各种问题。具体思路如下：

1.master节点作为ntp服务器与外界对时中心同步时间，随后对所有datanode节点提供时间同步服务。

2.所有datanode节点以master节点为基础同步时间。

所有节点安装相关组件：ntp与ntpdate。

查看当前系统是否已安装ntp：

[root@master ~]#rpm

-qa | grep ntp

[if !vml]

[endif]

如果当前系统没有安装ntp，则安装：

yum -y install ntp ntpdate

或者下载安装ntpd的稳定版本。比如ntp-4.2.6p3.

wgethttp://www.eecis.udel.edu/~ntp/ntp_spool/ntp4/ntp-4.2/ntp-4.2.6p3.tar.gz

tar zxf ntp-4.2.6p3.tar.gz

mkdir /app/ntp

cd ntp-4.2.6p3

./configure --prefix=/app/ntp --enable-all-clocks--enable-parse-clocks

make clean && make check && make

&& make intall

（注意：/app/ntp为ntpd的安装后文件路径）

完成后，配置开机启动。

[root@master ~]#chkconfig

ntpd on

[root@master ~]#chkconfig

--list ntpd

[if !vml]

[endif]

其中2-5为on状态就代表成功。

配置内网NTP服务器（master节点）

在配置之前，先使用ntpdate手动同步一下时间，免得本机与对时中心时间差距太大，使得ntpd不能正常同步。这里选用65.55.56.206作为对时中心。

[root@master ~]#ntpdate

-u 65.55.56.206

[if !vml]

[endif]

（注：在公司由于网络受限，导致对时失败，可以先不用管）

ntp服务只有一个配置文件，配置好了就OK。这里只给出有用的配置，不需要的配置都用#注掉，这里就不再给出：

[root@master ~]#vim

/etc/ntp.conf

driftfile /var/lib/ntp/drift

restrict 127.0.0.1

restrict -6 ::1

restrict default nomodify notrap

server 65.55.56.206 prefer

server 127.127.1.0 # local clock

fudge 127.127.1.0 stratum 10

includefile /etc/ntp/crypto/pw

keys /etc/ntp/keys

[if !vml]

[endif]

配置文件完成，保存退出，启动服务，执行如下命令：

service ntpd start

chkconfig ntpd on (设置开机启动)

一般等待5-10分钟才能同步

配置NTP客户端（所有slave节点）

[root@slave1 ~]#vim

/etc/ntp.conf

driftfile /var/lib/ntp/drift

restrict 127.0.0.1

restrict -6 ::1

restrict default kod nomodify notrap nopeer noquery

restrict -6 default kod nomodify notrap nopeer noquery

server 10.1.34.59

includefile /etc/ntp/crypto/pw

keys /etc/ntp/keys

[if !vml]

[endif]

保存退出，请求服务器前，请先使用ntpdate手动同步一下时间：

[root@slave1 ~]#ntpdate

-u 10.1.34.59

[if !vml]

[endif]

（注：这里可能出现同步失败的情况，请不要着急，一般是本地的ntp服务器还没有正常启动，一般需要等待5-10分钟才可以正常同步。启动服务：

service ntpd start

chkconfig ntpd on）

附：其他可能用到的ntp设置

/etc/ntp.conf配置文件中，还可以设置其他属性，以更好的完成时间同步任务：

#允许内网其他机器同步时间

restrict 192.168.1.0 mask 255.255.255.0 nomodify

notrap

#中国这边最活跃的时间服务器: http://www.pool.ntp.org/zone/cn

server 210.72.145.44 perfer #中国国家受时中心

server 202.112.10.36 #1.cn.pool.ntp.org

server 59.124.196.83 #0.asia.pool.ntp.org

#允许上层时间服务器主动修改本机时间

restrict 210.72.145.44 nomodify notrap noquery

restrict 202.112.10.36 nomodify notrap noquery

restrict 59.124.196.83 nomodify notrap noquery

#外部时间服务器不可用时，以本地时间作为时间服务

server 127.127.1.0 # local clock

fudge 127.127.1.0 stratum 10

安装配置（master节点）

检查系统是否已安装MySQL

先检查系统是否已经安装了MySQL，运行命令

[root@master ~]#rpm

-qa | grep -i mysql

如果安装了MySQL，就会有提示，有的系统没有安装MySQL数据库，但可能安装了MySQL的库文件，类似于mysql-libc-XXX，这个也要卸载。

卸载命令rpm -e --nodeps mysql-xxx

卸载完成后，运行 rpm -qa | grep mysql 查看是否卸载完全。

[if !vml]

[endif]

安装MySQL

（以下安装步骤适用于MySQL5.7.17版本，若要安装5.6.34等版本，请参考博客：

CentOS6.4离线安装mysql5.6.22

http://www.voidcn.com/blog/q383965374/article/p-6299314.html）

卸载完成后，上传MySQL安装包到hadoop的master服务器的某路径下，比如我这里上传到了：/home/hadoop/mysql-5.7.17-1.el6.x86_64.rpm-bundle.tar

解压缩tar包：

[root@master hadoop]#tar -xvf mysql-5.7.17-1.el6.x86_64.rpm-bundle.tar

[if !vml]

[endif]

依次序执行安装操作：（注意：是依次执行，不要乱了顺序，因为它们之间有依赖关系）

[root@master hadoop]#rpm -ivh mysql-community-common-5.7.17-1.el6.x86_64.rpm

[root@master hadoop]#rpm -ivh mysql-community-libs-5.7.17-1.el6.x86_64.rpm

[root@master hadoop]#rpm -ivh mysql-community-client-5.7.17-1.el6.x86_64.rpm

[root@master hadoop]#rpm -ivh mysql-community-server-5.7.17-1.el6.x86_64.rpm

[if !vml]

[endif]

以上安装操作完成，启动MySQL

[root@master hadoop]#service mysqld start

（注：若是安装5.6.34版本，安装顺序如下：

MySQL-server-5.6.34-1.linux_glibc2.5.x86_64.rpm

MySQL-client-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivh MySQL-shared-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivh MySQL-devel-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivh MySQL-shared-compat-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivh MySQL-embedded-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivh MySQL-test-5.6.34-1.linux_glibc2.5.x86_64.rpm

）

修改密码

启动后在/var/log/mysqld.log中获取root账户的初始密码

[root@master hadoop]#vim /var/log/mysqld.log

[if !vml]

[endif]

（注：可通过

#grep

"password" /var/log/mysqld.log命令获取MySQL的临时密码）

连接MySQL数据库：

[root@master hadoop]#mysql -u root -p

[if !vml]

[endif]

修改数据库root用户的密码：

mysql>alter

user 'root'@'localhost' identified by '123456';

[if !vml]

[endif]

MySQL对用户密码安全性有所加强，所以设置的密码必须包含有数字，大写字母，小写字母，特殊符号，如果你设置的密码过于简单，会提示：

ERROR 1819 (HY000): Your password does not satisfy the currentpolicy requirements

修改密码后，刷新：

mysql>flush

privileges;

（注：若想使用简单密码，修改方法见附录）

设置MySQL远程连接

查看MySQL的用户：

mysql>selecthost, user from mysql.user;

设置允许所有地址访问：

mysql>update mysql.user

set host="%" where user="root";

mysql>flush

privileges;

关闭防火墙或设置3306端口允许访问：

要访问3306可以用两种方式，一个就是让防火墙开放3306端口，另一个是关闭防火墙。推荐使用开放3306端口

1. 开放3306端口

方法1：

[root@master hadoop]#iptables -I INPUT -i eth0 -p tcp --dport 3306 -j ACCEPT

[root@master hadoop]#iptables -I OUTPUT -o eth0 -p tcp --sport 3306 -j ACCEPT

对应阻止3306端口的命令为：

[root@master hadoop]#iptables -I INPUT -i eth0 -p tcp --dport 3306 -j DROP

[root@master hadoop]#iptables -I OUTPUT -o eth0 -p tcp --sport 3306 -j DROP

保存设置：

[root@master hadoop]#/etc/rc.d/init.d/iptables save

方法2：

修改/etc/sysconfig/iptables文件，增加如下一行：

-A RH-Firewall-1-INPUT -m state --state NEW -m tcp -p tcp --dport3306 -j ACCEPT

然后重启防火墙：

[root@master hadoop]#service iptables restart

1. 关闭防火墙

重启后生效：

[root@master hadoop]#chkconfig iptables off

即时成效，但重启后会再次启动：

[root@master hadoop]#service iptables stop

至此，应该可以远程连接MySQL了。

设置MySQL不区分大小写

Linux下的MySQL安装完之后默认是区分表名的大小写，不区分列名的大小写。

改变表名大小写区分规则的方法：

root账户登录，在/etc/my.cnf或/etc/mysql/my.cnf中的[mysqld]后添加lower_case_table_names=1，重启MySQL服务。

[if !vml]

[endif]

重启MySQL服务：

[root@master ~]#service

mysqld restart

[if !vml]

[endif]

（注：如果在/etc或/etc/mysql找不到my.cnf文件，需要从其他地方拷贝过来，因为使用rpm安装MySQL时，需要手工拷贝my.cnf文件。操作如下：

到/usr/share/mysql/下找到*.cnf文件，拷贝其中一个到/etc/并改名为my.cnf：

[root@master mysql]#cp /usr/share/mysql/my-medium.cnf /etc/my.cnf

my-small.cnf是为小型数据库设计的，不应该把这个模型用于含有一些常用项目的数据库

my-medium.cnf是为中等规模的数据库而设计的

my-large.cnf是为专用于一个SQL数据库的计算机而设计的

my-huge.cnf是为企业中的数据库而设计的

拷贝完成后，进入etc目录下，编辑my.cnf

修改MySQL默认编码

MySQL数据库的默认编码并不是utf-8，启动服务并登陆MySQL，可以查看MySQL数据库的编码

mysql>show

variables like '%char%';

[if !vml]

[endif]

由上图可知，database和server的字符集使用了latin1编码方式，不支持中文，即存储中文时会出现乱码。一下修改为utf-8编码：

关闭MySQL服务：

[root@master mysql]#service mysqld stop

[if !vml]

[endif]

打开my.cnf，在文件内的[mysqld]下增加如下两行设置，并保存退出

character_set_server=utf8

init_connect=’SET NAMES utf8’

[if !vml]

[endif]

重启MySQL服务

[root@master mysql]#service mysqld start

登陆MySQL后，可以看到，编码方式已经修改为utf8

[if !vml]

[endif]

设置MySQL开机启动

[root@master ytfiles]#hkconfig mysqld on

c[if !vml]

[endif]

创建数据库

进入mysql命令行，创建以下数据库：

#hive

>create database hive DEFAULT CHARSET

utf8 COLLATE utf8_general_ci;

#activity monitor

>create database amon DEFAULT CHARSET

utf8 COLLATE utf8_general_ci;

#hue

>create database hue DEFAULT CHARSETutf8 COLLATE utf8_general_ci;

#activity oozie

>create database oozie DEFAULT CHARSET

utf8 COLLATE utf8_general_ci;

#Reports Manager

>create database reportsmanager DEFAULT

CHARSET utf8 COLLATE utf8_general_ci;

授权root用户在主节点拥有所有数据库的访问权限

>grant all privileges on *.* to

'root'@'master' identified by 'xxxx' with grant option;

>flush privileges;

安装Cloudera Manager Server和Agent

解压安装包至/opt默认目录

在master节点解压安装包至/opt默认目录

[root@master tmp]#tar

-zxvf cloudera-manager-el6-cm5.10.1_x86_64.tar.gz -C /opt

为Cloudera Manager 5建立数据库

将准备好的mysql-connector-java-5.1.33-bin.jar文件放到/opt/cm-5.10.1/share/cmf/lib/中。

并分别复制到：

/opt/cloudera/parcels/CDH-5.10.1-1.cdh5.10.1.p0.10/lib/hive/lib/ （hive需要使用）

/opt/cloudera/parcels/CDH-5.10.1-1.cdh5.10.1.p0.10/lib/oozie/lib/ （oozie需要使用）

/var/lib/oozie/ （oozie需要使用）

[root@master tmp]#cp

mysql-connector-java-5.1.33.jar /opt/cm-5.10.1/share/cmf/lib/

在master节点初始化CM5的数据库

[root@master tmp]#/opt/cm-5.10.1/share/cmf/schema/scm_prepare_database.sh

mysql cm -hlocalhost -uroot -p123456 --scm-host localhost scm 123456 scm

note：在这里后面的参数分别是：数据库类型数据库名称数据库主机名数据库用户名密码 --scm-host cmserver主机名数据库用户名数据库用户对应的密码 scm（未知参数，未查到用途，去掉也可以执行成功，暂且保留，与网上保持一致）

配置Agent

修改/opt/cm-5.10.1/etc/cloudera-scm-agent/config.ini中的server_host为主节点的主机名master。

[root@master ~]#vim

/opt/cm-5.10.1/etc/cloudera-scm-agent/config.ini

[if !vml]

[endif]

同步Agent到所有slave节点

[root@master lib]#scp

-r /opt/cm-5.10.1/ root@slave3:/opt/

在所有节点创建cloudera-scm用户

[root@master lib]#useradd

--system --home=/opt/cm-5.10.1/run/cloudera-scm-server/ --no-create-home

--shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

[if !vml]

[endif]

准备Parcels，用以安装CDH5

将CHD5相关的Parcel包放到主节点的/opt/cloudera/parcel-repo/目录中

相关的文件如下：

CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel.sha1

CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel

manifest.json

最后将CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel.sha1，重命名为CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel.sha，这点必须注意，否则，系统会重新下载CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel文件。

执行启动脚本

在master节点启动服务端：

[root@master ~]#/opt/cm-5.10.1/etc/init.d/cloudera-scm-server

start

在所有节点启动Agent：

[root@slave1 ~]#/opt/cm-5.10.1/etc/init.d/cloudera-scm-agent

start

以上脚本是启动命令，相关停止或重启命令仅需将start变成stop或restart即可。

[if !vml]

[endif]

配置CDH集群

登录网页，安装CDH5

Cloudera Manager Server和Agent都启动以后，就可以进行CDH5的安装配置了。

在浏览器打开http://master:7180进入CDH管理界面，由于CM

Server的启动需要花点时间，这里可能要等待一会才能访问，默认的用户名和密码均为admin。

[if !vml]

[endif]

以下选择安装的CM版本，选Express免费版或者Enterprise试用版都行。

[if !vml]

[endif]

[if !vml]

[endif]

选择安装的集群，这里注意只有已启动cloudera-scm-agent的主机才能被CM管理。

点击继续，各个Agent节点正常启动后，可以在当前管理的主机列表中看到对应的节点。选择要安装的节点，点继续。

[if !vml]

[endif]

接下来，出现以下包名，说明本地Parcel包配置无误，直接点继续就可以了

[if !vml]

[endif]

如果此处发现不到parcel包，就重启所有节点的agent服务，和master的server服务，然后重新尝试。并且确认CDH版本小于或者等于CM的版本

[if !vml]

[endif]

本地通过Parcel安装过程与本地通过Package安装过程完全一致，不同的是两者的本地源的配置。

区别如下：

Package本地源：软件包是.rpm格式的，数量通常较多，下载的时候比较麻烦。通过”createrepo .”的命令创建源，并要放到存放源文件主机的web服务器的根目录下，详见创建本地yum软件源，为本地Package安装Cloudera Manager、Cloudera Hadoop及Impala做准备

Parcel本地源：软件包是以.parcel结尾，相当于压缩包格式的，一个系统版本对应一个，下载的时候方便。如centos

6.x使用的CDH版本为CDH-X.X.X-1.cdhX.X.X.p0.22-el6.parcel，而centos 5.x使用的CDH版本为CDH-X.X.X-1.cdhX.X.X.p0.22-el5.parcel。

这些文件放好之后，CM会获取这个包，并出现在主机->包裹的页面。出现的快慢跟你设置的包的刷新频率有关，默认是1小时。也可以重启CM服务和agent服务识别。

可以在管理页面的属性标签下的包裹种类里修改。

parcel安装，查看日志

[if !vml]

[endif]

正常情况下，内网网速速好的话10分钟左右激活完毕，最多不超过30分钟，如果卡住了，建议看看日志

安装过程中有什么问题，可以用

/opt/cm-5.10.1/etc/init.d/cloudera-scm-agentstatus

/opt/cm-5.10.1/etc/init.d/cloudera-scm-serverstatus

查看服务器客户端状态

也可以通过

/var/log/cloudera-scm-server/cloudera-scm-server.log

/var/log/cloudera-scm-agent/cloudera-scm-agent.log

查看日志

如果上面的路径找不到则在

日志文件夹＂/opt/cm-5.10.1/log＂查看日志，里面包含server和agent的log，使用命令如下：

tail -f/opt/cm-5.10.1/log/cloudera-scm-server/cloudera-scm-server.log

tail -f/opt/cm-5.10.1/log/cloudera-scm-agent/cloudera-scm-agent.log

成功激活后继续右下角点击继续

[if !vml]

[endif]

主机检查

会进入自动检查主机（耗时2分钟左右）然后给出报告，包括需要修改的部分和组件的版本

[if !vml]

[endif]

解决警告

这里有2个警告需要解决一下，至于版本里的不可用不适用不需要管。

警告一

Cloudera 建议将 /proc/sys/vm/swappiness 设置为最大值 10。当前设置为 60。使用 sysctl 命令在运行时更改该设置并编辑 /etc/sysctl.conf，以在重启后保存该设置。您可以继续进行安装，但 Cloudera

Manager 可能会报告您的主机由于交换而运行状况不良。以下主机将受到影响

解决方法

每台受影响的主机运行

echo 10 > /proc/sys/vm/swappiness 即可解决。

[if !vml]

[endif]

[root@master ~]#vim

/etc/sysctl.conf

[if !vml]

[endif]

警告二

已启用透明大页面压缩，可能会导致重大性能问题。请运行“echo

never > /sys/kernel/mm/transparent_hugepage/defrag”以禁用此设置，然后将同一命令添加到 /etc/rc.local 等初始脚本中，以便在系统重启时予以设置。以下主机将受到影响

解决方法

每台受影响的主机运行命令

[root@master ~]#echo

never > /sys/kernel/mm/transparent_hugepage/defrag

[root@master ~]#echo

never > /sys/kernel/mm/transparent_hugepage/enabled

[if !vml]

[endif]

并且

vim /etc/rc.local

加入

echo never >

/sys/kernel/mm/transparent_hugepage/defrag

echo never >

/sys/kernel/mm/transparent_hugepage/enabled

[if !vml]

[endif]

然后点击重新运行进行重新检查

[if !vml]

[endif]

[if !vml]

[endif]

全部绿勾了，然后点击右下角的完成。

选择安装哪些组件服务--这里根据需求选择即可。

[if !vml]

[endif]

右下角点击继续，然后配置角色。一般情况下保持默认就可以了（Cloudera

Manager会根据机器的配置自动进行配置，如果需要特殊调整，自行进行设置就可以了）。

我这里使用默认配置，所以直接点击继续就可以了。

[if !vml]

[endif]

配置数据库

然后配置数据库

这里需要输入自己的mysql的对应数据库名称和用户名以及密码。

我们之前在mysql中新建的数据名分布对应填入然后点击测试连接。

hive root 123456

oozie root 123456

hue root 123456

[if !vml]

[endif]

如果测试连接全部是Successful,则点击右下角的继续。

[if !vml]

[endif]

参考博文

hadoop基础----hadoop实战(七)-----hadoop管理工具---使用Cloudera

Manager安装Hadoop---Cloudera

Manager和CDH5.8离线安装

http://www.voidcn.com/blog/q383965374/article/p-6326985.html

CDH5 Hadoop集群完全离线安装步骤总结

http://blog.csdn.net/it_taojingzhan/article/details/51537258

Centos7 CM5和CDH5(5.9.0) 离线安装

http://blog.csdn.net/myself_way/article/details/54864651

ERROR 1819 (HY000): Your password does not satisfy the currentpolicy requirements

http://www.cnblogs.com/ivictor/p/5142809.html

附录

CentOS7以下系统的防火墙操作

本机连接好着，远程连接不上telnet 192.168.1.561521

Linux自身的防火墙名为“iptables”

chkconfig命令只是查看和设置服务的自动启动情况，并不能反映当前服务的状态.

service iptables status

可以查看到iptables服务的当前状态

查看防火墙状态：

/etc/init.d/iptablesstatus

暂时关闭防火墙：

/etc/init.d/iptables stop

永久关闭防火墙：

chkconfig iptables off

开启防火墙：

/etc/init.d/iptablesstart

永久开启防火墙：

chkconfig iptableson

禁止防火墙在系统启动时启动：

/sbin/chkconfig --level2345 iptables off

重启iptables：

/etc/init.d/iptablesrestart

开放防火墙端口（1521、1158）

/sbin/iptables -I INPUT-p tcp --dport 1521 -j ACCEPT

/sbin/iptables -I INPUT-p tcp --dport 1158 -j ACCEPT

保存设置命令：

/etc/rc.d/init.d/iptablessave

查看端口打开情况命令：

/etc/init.d/iptablesstatus

CentOS7以上系统的防火墙操作

centos6的版本防火墙使用的iptables，iptables是一个静态防火墙，也就是说它不能够动态的添加开启端口，必须在配置文件中添加开启端口，然后重启防火墙才能生效。

centos7的防火墙使用的是firewalld，它是动态的，可以通过命令添加开启端口，不用重启服务就可以使改变生效。

启动：#systemctlstart firewalld

查看状态：#systemctl

status firewalld或者firewall-cmd --state

停止：#systemctl

stop firewalld

禁用：#systemctl

disable firewalld

永久开启80端口：firewall-cmd --zone=public --add-port=80/tcp –permanent

说明：--add-port=80/tcp #添加端口，格式为：端口/通讯协议

--permanent #永久生效，没有此参数重启后失效

更新防火墙规则：#firewall-cmd

--reload

#firewall-cmd

--complete-reload

两者的区别就是第一个无需断开连接，就是firewalld特性之一动态添加规则，第二个需要断开连接，类似重启服务

CentOS7以上系统修改主机名

第一种：hostname 主机名

hostname 主机名称

这种方式，只能修改临时的主机名，当重启机器后，主机名称又变回来了。

第二种：hostnamectl set-hostname

hostnamectl set-hostname 主机名

使用这种方式修改，可以永久性的修改主机名称！

MySQL5.6.34相关操作

（参考博文：）

安装MySQL5.6.34的执行顺序：

rpm -ivhMySQL-server-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivhMySQL-client-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivhMySQL-shared-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivh MySQL-devel-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivhMySQL-shared-compat-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivhMySQL-embedded-5.6.34-1.linux_glibc2.5.x86_64.rpm

rpm -ivhMySQL-test-5.6.34-1.linux_glibc2.5.x86_64.rpm

[if !vml]

[endif]

安装完成后，查看生成的临时随机密码：

[root@master ytfiles]#vim /root/.mysql_secret

[if !vml]

[endif]

启动MySQL服务：

[root@master ytfiles]#service mysql start

[if !vml]

[endif]

登录MySQL：

[root@master ytfiles]#mysql -u root -p

[if !vml]

[endif]

修改MySQL初始密码：

mysql> set password for 'root'@'localhost'=password('123456');

[if !vml]

[endif]

找到my.cnf配置文件

如果"/etc/"目录下没有my.cnf配置文件，请到"/usr/share/mysql/"下找到my-default.cnf文件，拷贝其中一个合适的配置文件到"/etc/"并改名为"my.cnf"中。命令如下：

cp /usr/share/mysql/my- default.cnf /etc/my.cnf

编辑MySQL的配置文件"/etc/my.cnf"为保证MySQL能够正常工作，需要指明"mysql.sock"文件的产生位置，以及默认编码修改为UTF-8。用下面命令：

vim /etc /my.cnf

[mysqld] #下添加以下命令

socket = /var/lib/mysql/mysql/mysql.sock

datadir=/mysql_data/mysql #如果你的数据存储位置要改变的话需要在这里指定存储目录

character-set-server=utf8

lower_case_table_names=1

[if !vml]

[endif]

#（注意linux下mysql安装完后是默认：区分表名的大小写，不区分列名的大小写；# lower_case_table_names =0 0：区分大小写，1：不区分大小写）

注意：

1）还有在此配置文件还有[client]的一项配置，其中也可以设置socket，datadir两个选项

2）如果你修改了数据的存储位置目录，则需要修改MySQL启动脚本/etc/rc.d/init.d/mysql，修改 datadir=/mysql_data/mysql。

vim /etc/rc.d/init.d/mysql

问题：有时候发现设置的my.cnf值没生效：

了解一下mysql配置文件的加载顺序：

$ mysqld --help --verbose|grep -A1 -B1 cnf

Default options are read from the following files in the givenorder:

/etc/my.cnf/etc/mysql/my.cnf/usr/my.cnf

~/.my.cnf

mysql按照上面的顺序加载配置文件，后面的配置项会覆盖前面的。把/usr/my.cnf这个文件删掉，/etc/my.cnf里面的就生效了。

[root@master usr]#mv

my.cnf my.cnf.bak

[if !vml]

[endif]

错误：

MySQL> update user set host='%' where user =

'root';ERROR 1062 (23000):

Duplicate entry '%-root' for key 'PRIMARY'然后查看了下数据库的host信息如下：MySQL> select host from user where user =

'root';+-----------------------+| host |+-----------------------+| % || 127.0.0.1 || localhost.localdomain |+-----------------------+3 rows in set (0.00 sec)host已经有了%这个值，所以直接运行命令：复制代码代码如下:MySQL>flush privileges;再用MySQL

administrator连接...成功！！

MySQL5.7修改简单密码

MySQL对用户密码安全性有所加强，所以设置的密码必须包含有数字，大写字母，小写字母，特殊符号，如果你设置的密码过于简单，会提示：

ERROR 1819 (HY000): Your password does not satisfy the currentpolicy requirements

这个其实与validate_password_policy的值有关。

validate_password_policy有以下取值：

PolicyTests Performed

0 or LOWLength

1 or MEDIUMLength; numeric, lowercase/uppercase, and special characters

2 or STRONGLength; numeric, lowercase/uppercase, and special characters; dictionary file

默认是1，即MEDIUM，所以刚开始设置的密码必须符合长度，且必须含有数字，小写或大写字母，特殊字符。

有时候，只是为了自己测试，不想密码设置得那么复杂，譬如说，我只想设置root的密码为123456。

必须修改两个全局参数：

首先，修改validate_password_policy参数的值

mysql> set global validate_password_policy=0;

Query OK, 0 rows affected (0.00sec)

这样，判断密码的标准就基于密码的长度了。这个由validate_password_length参数来决定。

[if !vml][endif]

mysql> select @@validate_password_length;

+----------------------------+

| @@validate_password_length |

+----------------------------+

| 8 |

+----------------------------+

1 row in set (0.00sec)

[if !vml][endif]

validate_password_length参数默认为8，它有最小值的限制，最小值为：

validate_password_number_count

+validate_password_special_char_count

+ (2 *validate_password_mixed_case_count)

其中，validate_password_number_count指定了密码中数据的长度，validate_password_special_char_count指定了密码中特殊字符的长度，validate_password_mixed_case_count指定了密码中大小字母的长度。

这些参数，默认值均为1，所以validate_password_length最小值为4，如果你显性指定validate_password_length的值小于4，尽管不会报错，但validate_password_length的值将设为4。如下所示：

[if !vml][endif]

mysql> select @@validate_password_length;

+----------------------------+

| @@validate_password_length |

+----------------------------+

| 8 |

+----------------------------+

1 row in set (0.00sec)

mysql> set global validate_password_length=1;

Query OK, 0 rows affected (0.00sec)

mysql> select @@validate_password_length;

+----------------------------+

| @@validate_password_length |

+----------------------------+

| 4 |

+----------------------------+

1 row in set (0.00sec)

[if !vml][endif]

如果修改了validate_password_number_count，validate_password_special_char_count，validate_password_mixed_case_count中任何一个值，则validate_password_length将进行动态修改。

[if !vml][endif]

mysql> select @@validate_password_length;

+----------------------------+

| @@validate_password_length |

+----------------------------+

| 4 |

+----------------------------+

1 row in set (0.00sec)

mysql> select @@validate_password_mixed_case_count;

+--------------------------------------+

| @@validate_password_mixed_case_count |

+--------------------------------------+

| 1 |

+--------------------------------------+

1 row in set (0.00sec)

mysql> set global validate_password_mixed_case_count=2;

Query OK, 0 rows affected (0.00sec)

mysql> select @@validate_password_mixed_case_count;

+--------------------------------------+

| @@validate_password_mixed_case_count |

+--------------------------------------+

| 2 |

+--------------------------------------+

1 row in set (0.00sec)

mysql> select @@validate_password_length;

+----------------------------+

| @@validate_password_length |

+----------------------------+

| 6 |

+----------------------------+

1 row in set (0.00sec)

[if !vml][endif]

当然，前提是validate_password插件必须已经安装，MySQL5.7是默认安装的。

那么如何验证validate_password插件是否安装呢？可通过查看以下参数，如果没有安装，则输出将为空。

[if !vml][endif]

mysql> SHOW VARIABLES LIKE 'validate_password%';

+--------------------------------------+-------+

|Variable_name | Value |

+--------------------------------------+-------+

|validate_password_dictionary_file | |

|validate_password_length | 6 |

|validate_password_mixed_case_count | 2 |

|validate_password_number_count | 1 |

|validate_password_policy |LOW |

| validate_password_special_char_count | 1 |

+--------------------------------------+-------+

6 rows in set (0.00sec)

（注：出自博客：http://www.cnblogs.com/ivictor/p/5142809.html）

Linux系统备份与还原

Linux不像windows，它不限制根用户存取任何东西，因此，你完全可以把一个分区上每一个的文件放入一个TAR文件中。

使用root用户切换到根目录

[root@master ~]#cd

然后，创建backup文件夹，用以存放备份的系统压缩包：

[root@master /]#mkdir

backup

然后，使用下面的命令备份完整的系统：

[root@master /]#tar

cvpzf /backup/backup_full.tar.gz --exclude=/proc --exclude=/lost+found

--exclude=/backup --exclude=/mnt --exclude=/sys /

说明：

tar 部分就是我们将要使用的软件。

'cvpfz'是我们给tar加的选项，像“创建一个压缩文档”（这是显然的），“保存权限”（以便使每一个相同的文件有相同的权限），以及“gzip”（缩减大小）。接下来，是压缩文档将获得的名称，在我们的例子中是backup.tgz。

紧随其后的是我们想要备份的根目录。既然我们想备份所有东西：/。接着就是我们要剔除的目录了：我们不想备份每一样东西，因为包括有些目录不是非常有用。同时确保你没有把备份文件本身也加进去了，否则，你会得到怪异的结果的。你也许同样不打算把/mnt文件夹包括进来——如果你在那儿挂载了其他分区——否则最终你会把那些也备份的。同时确保你没有任何东西挂载在 /media(即没有挂载任何cd或可移动介质）。否则，剔除/media。

在进程的最后，你也许会得到一条信息，写着“tar：由于先前错误的耽搁而存在错误”或者其他什么，不过大多数情况下你可以仅仅忽略它。

作为选择，你可以使用Bzip来压缩你的备份。这意味着较高的压缩比但是也意味着较低的速度。如果压缩比对你很重要，只需用“j”替换命令中的“z”，同时给备份命一个相应的扩展名。这些会使命令变成这样：

[root@master /]#tar cvpjf /backup/backup_full.tar.bz2

--exclude=/proc --exclude=/lost+found --exclude=/backup --exclude=/mnt

--exclude=/sys /

恢复：

如果系统被毁坏，那么我们就可以用备份好的tar包进行恢复。

在分区的backup目录下的backup_full.tar.gz文件

[root@master /]#tar

xvpfz /backup/backup_full.tar.gz -C /

如果你使用 bz2：

[root@master /]#tar

xvpfj /backup/backup_full.tar.bz2 -C /

警告：这会把你分区里所有文件替换成压缩文档里的文件！

确保在你做其他任何事情之前，重新创建你剔除的目录：

[root@master /]#mkdir

proc

[root@master /]#mkdir

lost+found

[root@master /]#mkdir

mnt

[root@master /]#mkdir

sys

/proc 权限：文件所有者：root群组：root 所有者：读取执行群组：读取执行其它：读取执行

/lost+found 权限：文件所有者：root群组：root 所有者：读取写入执行群组：读取执行其它：读取执行

/mnt 权限：文件所有者：root群组：root 所有者：读取写入执行群组：读取执行其它：读取执行

/sys 权限：文件所有者：root群组：root 所有者：读取写入执行群组：读取执行其它：读取执行

当你重启以后，所以的事情都会和你备份的时候一模一样。

（注：参考博客：http://www.centoscn.com/image-text/2013/0418/318.html）

CDH5 Hadoop集群完全离线安装说明

你可能感兴趣的:(CDH5 Hadoop集群完全离线安装说明)