CDH5
Hadoop集群完全离线安装说明
系统环境:CentOS6.5 64位
用到的文件
JDK1.8.0.111安装包
方法一使用:jdk-8u111-linux-x64.rpm
方法二使用:jdk-8u111-linux-x64.tar.gz
JDK环境配置(所有节点)
(先用命令:rpm -qa |
grep java
查看系统是否已自带了openjdk,若系统自带了openjdk,需要先卸载掉,方法参照后面说明)
通常有两种方式来安装JDK,根据从Oracle官网上下载的文件扩展名(tar.gz和.rpm),分别说明两种安装配置方式:
方法一:用rpm安装JDK
如果主机能访问外网,则联网下载安装包
[root@one-centos ~]#curl -O
http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.rpm
若不能访问外网,则使用离线包,将下载好的rpm包上传到主机某文件夹下(比如/home/root/下载)
[root@one-centos ~]#cd 下载
使用rpm命令安装:
[root@one-centos 下载] #rpm
-ivh jdk-8u111-linux-x64.rpm
[if !vml]
[endif]
设置环境变量:
[root@one-centos 下载]#vim/etc/profile
在打开的profile文件中添加如下内容:
#set java environment
JAVA_HOME=/usr/java/jdk1.8.0_111
JRE_HOME=/usr/java/jdk1.8.0_111/jre
CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
export JAVA_HOME JRE_HOME CLASS_PATH PATH
[if !vml]
[endif]
让修改生效
[root@one-centos 下载]#source
/etc/profile
验证JDK有效性:
[root@one-centos yt]#java -version
[root@one-centos yt]#java
[root@one-centos yt]#javac
[if !vml]
[endif]
[root@one-centos yt]#echo $JAVA_HOME
/usr/java/jdk1.8.0_111
方法二:用tar.gz包安装JDK
在/usr/目录下创建java目录:
[root@localhost ~]#mkdir/usr/java
[root@localhost ~]#cd /usr/java
下载JDK,然后解压:
[root@localhost java]#curl -O
http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.tar.gz
[root@localhost java]#tar -zxvf jdk-8u111-linux-x64.tar.gz
设置环境变量:(同上)
[root@one-centos 下载]#vim/etc/profile
在打开的profile文件中添加如下内容:
#set java environment
JAVA_HOME=/usr/java/jdk1.8.0_111
JRE_HOME=/usr/java/jdk1.8.0_111/jre
CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
export JAVA_HOME JRE_HOME CLASS_PATH PATH
让修改生效:(同上)
[root@one-centos 下载]#source
/etc/profile
验证JDK有效性:(同上)
[root@one-centos yt]#java -version
[root@one-centos yt]#java
[root@one-centos yt]#javac
[if !vml]
[endif]
[root@one-centos yt]#echo $JAVA_HOME
/usr/java/jdk1.8.0_111
卸载Linux自带的openjdk
安装了centos7系统,发现自带了openjdk,想删除centos自带的jdk。具体方法如下:
1.使用rpm命令查看系统已经安装的java包
[root@dev]# rpm -qa | grep java
java-1.8.0-openjdk-headless-1.8.0.101-3.b13.el7_2.x86_64
javapackages-tools-3.4.1-11.el7.noarch
tzdata-java-2016f-1.el7.noarch
java-1.8.0-openjdk-1.8.0.101-3.b13.el7_2.x86_64
Python-javapackages-3.4.1-11.el7.noarch
2.使用rpm命令删除已安装的java依赖
[root@dev]# rpm -e --nodepsJava-1.8.0-openjdk-1.8.0.101-3.b13.el7_2.x86_64
[root@dev]# rpm -e --nodepsjava-1.8.0-openjdk-headless-1.8.0.101-3.b13.el7_2.x86_64
[root@dev]# rpm -e --nodeps tzdata-java-2016f-1.el7.noarch
[root@dev]# rpm -e --nodepsjavapackages-tools-3.4.1-11.el7.noarch
[root@dev]# rpm -e --nodepspython-javapackages-3.4.1-11.el7.noarch
3.再次检查java相关依赖以删除
[root@dev]# rpm -qa | grep java
[root@dev]# java -version
如果输出类似not found command则说明删除完成!
网络环境配置(所有节点)
我部署的集群中包括4个节点:1个master,3个salve,节点之间局域网连接,可以相互ping通。节点IP地址分布如下:
机器名称 IP地址
master 10.1.34.59
slave1 10.1.34.66
slave2 10.1.34.67
slave3 10.1.34.68
主机名配置
下面以master机器为例,即主机名为“master”,IP为“10.1.34.59”进行主机的配置,他的slave机器以此为依据进行修改。
命令hostname可查看当前主机名
修改hostname:
[root@master ~]#vim
/etc/sysconfig/network
[if !vml]
[endif]
配置完成之后,我们需要重启主机,命令:
[root@master ~]#reboot
(注:CentOS7以上系统修改主机名见附录)
配置hosts文件
“/etc/hosts”这个文件是用来配置主机将用的DNS服务器信息,是记载LAN内接续的各主机的对应HostName和IP用的。当用户在进行网络连接时,首先查找该文件,寻找对应主机名(或域名)对应的IP地址。
在进行Hadoop集群配置中,需要在“/etc/hosts”文件中添加集群中所有机器的IP与主机名,这样Master与所有的Slave机器之间不仅可以通过IP进行通信,而且还可以通过主机名进行通信。所以在所有的机器上的“/etc/hosts”文件末尾中都要添加如下内容:
[root@master ~]#vim
/etc/hosts
10.1.34.59 master
10.1.34.66 slave1
10.1.34.67 slave2
10.1.34.68 slave3
[if !vml]
[endif]
[if !vml]
[endif]
从上图中我们已经能用主机名进行ping通了,说明我们刚才添加的内容,在局域网内能进行DNS解析了,那么现在剩下的事儿就是在其余的slave机器上进行相同的配置。然后进行测试。
关闭防火墙
本文档是假定“服务器在防火墙以内”的前提下编纂的,在这个前提下,服务器本身在内部网络是不需要防火墙的(在需要抵御内部安全威胁的情况下,您也可以用您在iptables方面的相关知识,根据实情设置防火前,并保证服务器端防火墙启动的状态)。另外,在一般情况下,我们不需要SELinux复杂的保护,所以也将其设置为无效的状态。
关闭防火墙
[root@master ~]#serviceiptables stop
(注:service iptables stop (临时关闭)
chkconfig iptables off (重启后生效)
防火墙相关操作命令见附录)
关闭SELinux
[root@master ~]#vim/etc/sysconfig/selinux
将SELINUX=enforcing修改为SELINUX=disabled
[if !vml]
[endif]
(注:setenforce 0 (临时生效))
SSH无密码验证配置
Hadoop运行过程中需要管理远端Hadoop守护进程,在Hadoop启动以后,NameNode是通过SSH(Secure Shell)来启动和停止各个DataNode上的各种守护进程的。这就必须在节点之间执行指令的时候是不需要输入密码的形式,故我们需要配置SSH运用无密码公钥认证的形式,这样NameNode使用SSH无密码登录并启动DataName进程,同样原理,DataNode上也能使用SSH无密码登录到NameNode。
安装和启动SSH协议
[root@master ~]#rpm
-qa | grep openssh
[root@master ~]#rpm
-qa | grep rsync
[if !vml]
[endif]
(注:我的本机已经安装了openssh和rsync,如果没有安装,可执行如下命令进行安装:
yum install ssh
yum install rsync
service sshd restart
要确保所有的服务器都安装了这两个工具)
配置master无密码登录所有salve
SSH无密码原理
[if !vml]
[endif]
[if !vml]
[endif]
SSH无密码原理简介:
master(NameNode |JobTracker)作为客户端,要实现无密码公钥认证,连接到服务器salve(DataNode | Tasktracker)上时,需要在master上生成一个密钥对,包括一个公钥和一个私钥,而后将公钥复制到所有的slave上。当master通过SSH连接salve时,salve就会生成一个随机数并用master的公钥对随机数进行加密,并发送给master。master收到加密数之后再用私钥解密,并将解密数回传给slave,slave确认解密数无误之后就允许master进行连接了。这就是一个公钥认证过程,其间不需要用户手工输入密码。重要过程是将客户端master复制到slave上。
master机器上生成密码对
在master节点上执行以下命令(以root账户登录):
[root@master root]#ssh-keygen -t rsa -P ''
这条命令是生成其无密码密钥对,询问其保存路径时直接回车采用默认路径。生成的密钥对:id_rsa和id_rsa.pub,默认存储在“/home/hadoop/.ssh”目录下。
[if !vml]
[endif]
查看/home/hadoop/下是否有.ssh文件夹,且.ssh文件下是否有两个刚生产的无密码密钥对:
[if !vml]
[endif]
接着在master节点上做如下配置,把id_rsa.pub追加到授权的key里面去。
[root@master .ssh]#cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
在验证前,需要做两件事儿。第一件事儿是修改文件authorized_keys权限(权限的设置非常重要,因为不安全的设置安全设置,会让你不能使用RSA功能),另一件事儿是用root用户设置/etc/ssh/sshd_config的内容。使其无密码登录有效。
修改文件authorized_keys:
[root@master .ssh]#chmod 600 ~/.ssh/authorized_keys
设置SSH配置:
用root用户登录服务器修改SSH配置文件/etc/ssh/sshd_config的下列内容
[root@master .ssh]#vim /etc/ssh/sshd_config
[if !vml]
[endif]
(注:参数说明如下:
RSAAuthentication yes #启用RSA认证
PubkeyAuthentication yes #启用公钥私钥配对认证方式
AuthorizedKeysFile .ssh/authorized_keys #公钥文件路径,和上面生成的文件相同)
[if !vml]
[endif]
设置完之后重启SSH服务,能使刚才设置有效。
[root@master .ssh]#service sshd restart
[if !vml]
[endif]
验证是否成功。
[root@master .ssh]#ssh localhost
[if !vml]
[endif]
从上图得知无密码登录本机已经设置完毕,接下来是把公钥复制所有的slave机器上。
在往下做之前,把其他几台的公钥私钥全部产生,参照以上步骤。
使用下面的命令格式进行复制公钥:
scp ~/.ssh/id_rsa.pub远程用户名@远程服务器IP:~/
把master上的公钥复制到slave1上:
[hadoop@master .ssh]$scp ~/.ssh/id_rsa.pub hadoop@slave1:~/
[if !vml]
[endif]
从被复制的Slave机上可以用ls –a查看确实存在id_rsa.pub这个文件:
[root@slave1 ~]#ll
-a
[if !vml]
[endif]
依据以上方式,分别复制到其他几台slave主机的根目录下。
在所有slave机上,将公钥添加到授权密钥文件authorized_keys内(添加完成后,把/home/hadoop/目录下的id_rsa.pub文件删除掉):
[root@slave1 ~]#cat
~/id_rsa.pub >> ~/.ssh/authorized_keys
[if !vml]
[endif]
配置所有slave无密码登录master
和master无密码登录所有slave原理一样,就是把slave的公钥追加到master的.ssh文件夹下的authorized_keys中,记得是追加(>>)。
思想:分别在其他几台slave机上使用scp命令,将slave上的公钥发到master上去,然后每发送一个,在master上,使用cat命令将slave的公钥添加到master的授权文件中。然后把传过来的公钥文件删除。
比如我这里的slave1机发送公钥到master机:
[root@slave1 ~]#scp
~/.ssh/id_rsa.pub [email protected]:~/
[if !vml]
[endif]
然后master机上,将slave1的公钥添加到master的授权文件中:
[root@master .ssh]#cat ~/id_rsa.pub >> ~/.ssh/authorized_keys
[if !vml]
[endif]
到此,配置已完成。验证一下ssh可以master和slave之间的无密码相互登陆
[if !vml]
[endif]
安装NTP服务(所有节点)
集群中所有主机必须保持时间同步,如果时间相差较大会引起各种问题。具体思路如下:
1.master节点作为ntp服务器与外界对时中心同步时间,随后对所有datanode节点提供时间同步服务。
2.所有datanode节点以master节点为基础同步时间。
所有节点安装相关组件:ntp与ntpdate。
查看当前系统是否已安装ntp:
[root@master ~]#rpm
-qa | grep ntp
[if !vml]
[endif]
如果当前系统没有安装ntp,则安装:
yum -y install ntp ntpdate
或者下载安装ntpd的稳定版本。比如ntp-4.2.6p3.
wgethttp://www.eecis.udel.edu/~ntp/ntp_spool/ntp4/ntp-4.2/ntp-4.2.6p3.tar.gz
tar zxf ntp-4.2.6p3.tar.gz
mkdir /app/ntp
cd ntp-4.2.6p3
./configure --prefix=/app/ntp --enable-all-clocks--enable-parse-clocks
make clean && make check && make
&& make intall
(注意:/app/ntp为ntpd的安装后文件路径)
完成后,配置开机启动。
[root@master ~]#chkconfig
ntpd on
[root@master ~]#chkconfig
--list ntpd
[if !vml]
[endif]
其中2-5为on状态就代表成功。
配置内网NTP服务器(master节点)
在配置之前,先使用ntpdate手动同步一下时间,免得本机与对时中心时间差距太大,使得ntpd不能正常同步。这里选用65.55.56.206作为对时中心。
[root@master ~]#ntpdate
-u 65.55.56.206
[if !vml]
[endif]
(注:在公司由于网络受限,导致对时失败,可以先不用管)
ntp服务只有一个配置文件,配置好了就OK。这里只给出有用的配置,不需要的配置都用#注掉,这里就不再给出:
[root@master ~]#vim
/etc/ntp.conf
driftfile /var/lib/ntp/drift
restrict 127.0.0.1
restrict -6 ::1
restrict default nomodify notrap
server 65.55.56.206 prefer
server 127.127.1.0 # local clock
fudge 127.127.1.0 stratum 10
includefile /etc/ntp/crypto/pw
keys /etc/ntp/keys
[if !vml]
[endif]
配置文件完成,保存退出,启动服务,执行如下命令:
service ntpd start
chkconfig ntpd on (设置开机启动)
一般等待5-10分钟才能同步
配置NTP客户端(所有slave节点)
[root@slave1 ~]#vim
/etc/ntp.conf
driftfile /var/lib/ntp/drift
restrict 127.0.0.1
restrict -6 ::1
restrict default kod nomodify notrap nopeer noquery
restrict -6 default kod nomodify notrap nopeer noquery
server 10.1.34.59
includefile /etc/ntp/crypto/pw
keys /etc/ntp/keys
[if !vml]
[endif]
保存退出,请求服务器前,请先使用ntpdate手动同步一下时间:
[root@slave1 ~]#ntpdate
-u 10.1.34.59
[if !vml]
[endif]
(注:这里可能出现同步失败的情况,请不要着急,一般是本地的ntp服务器还没有正常启动,一般需要等待5-10分钟才可以正常同步。启动服务:
service ntpd start
chkconfig ntpd on)
附:其他可能用到的ntp设置
/etc/ntp.conf配置文件中,还可以设置其他属性,以更好的完成时间同步任务:
#允许内网其他机器同步时间
restrict 192.168.1.0 mask 255.255.255.0 nomodify
notrap
#中国这边最活跃的时间服务器: http://www.pool.ntp.org/zone/cn
server 210.72.145.44 perfer #中国国家受时中心
server 202.112.10.36 #1.cn.pool.ntp.org
server 59.124.196.83 #0.asia.pool.ntp.org
#允许上层时间服务器主动修改本机时间
restrict 210.72.145.44 nomodify notrap noquery
restrict 202.112.10.36 nomodify notrap noquery
restrict 59.124.196.83 nomodify notrap noquery
#外部时间服务器不可用时,以本地时间作为时间服务
server 127.127.1.0 # local clock
fudge 127.127.1.0 stratum 10
安装配置(master节点)
检查系统是否已安装MySQL
先检查系统是否已经安装了MySQL,运行命令
[root@master ~]#rpm
-qa | grep -i mysql
如果安装了MySQL,就会有提示,有的系统没有安装MySQL数据库,但可能安装了MySQL的库文件,类似于mysql-libc-XXX,这个也要卸载。
卸载命令rpm -e --nodeps mysql-xxx
卸载完成后,运行 rpm -qa | grep mysql 查看是否卸载完全。
[if !vml]
[endif]
安装MySQL
(以下安装步骤适用于MySQL5.7.17版本,若要安装5.6.34等版本,请参考博客:
CentOS6.4离线安装mysql5.6.22
http://www.voidcn.com/blog/q383965374/article/p-6299314.html)
卸载完成后,上传MySQL安装包到hadoop的master服务器的某路径下,比如我这里上传到了:/home/hadoop/mysql-5.7.17-1.el6.x86_64.rpm-bundle.tar
解压缩tar包:
[root@master hadoop]#tar -xvf mysql-5.7.17-1.el6.x86_64.rpm-bundle.tar
[if !vml]
[endif]
依次序执行安装操作:(注意:是依次执行,不要乱了顺序,因为它们之间有依赖关系)
[root@master hadoop]#rpm -ivh mysql-community-common-5.7.17-1.el6.x86_64.rpm
[root@master hadoop]#rpm -ivh mysql-community-libs-5.7.17-1.el6.x86_64.rpm
[root@master hadoop]#rpm -ivh mysql-community-client-5.7.17-1.el6.x86_64.rpm
[root@master hadoop]#rpm -ivh mysql-community-server-5.7.17-1.el6.x86_64.rpm
[if !vml]
[endif]
以上安装操作完成,启动MySQL
[root@master hadoop]#service mysqld start
(注:若是安装5.6.34版本,安装顺序如下:
MySQL-server-5.6.34-1.linux_glibc2.5.x86_64.rpm
MySQL-client-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivh MySQL-shared-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivh MySQL-devel-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivh MySQL-shared-compat-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivh MySQL-embedded-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivh MySQL-test-5.6.34-1.linux_glibc2.5.x86_64.rpm
)
修改密码
启动后在/var/log/mysqld.log中获取root账户的初始密码
[root@master hadoop]#vim /var/log/mysqld.log
[if !vml]
[endif]
(注:可通过
#grep
"password" /var/log/mysqld.log命令获取MySQL的临时密码)
连接MySQL数据库:
[root@master hadoop]#mysql -u root -p
[if !vml]
[endif]
修改数据库root用户的密码:
mysql>alter
user 'root'@'localhost' identified by '123456';
[if !vml]
[endif]
MySQL对用户密码安全性有所加强,所以设置的密码必须包含有数字,大写字母,小写字母,特殊符号,如果你设置的密码过于简单,会提示:
ERROR 1819 (HY000): Your password does not satisfy the currentpolicy requirements
修改密码后,刷新:
mysql>flush
privileges;
(注:若想使用简单密码,修改方法见附录)
设置MySQL远程连接
查看MySQL的用户:
mysql>selecthost, user from mysql.user;
设置允许所有地址访问:
mysql>update mysql.user
set host="%" where user="root";
mysql>flush
privileges;
关闭防火墙或设置3306端口允许访问:
要访问3306可以用两种方式,一个就是让防火墙开放3306端口,另一个是关闭防火墙。推荐使用开放3306端口
1. 开放3306端口
方法1:
[root@master hadoop]#iptables -I INPUT -i eth0 -p tcp --dport 3306 -j ACCEPT
[root@master hadoop]#iptables -I OUTPUT -o eth0 -p tcp --sport 3306 -j ACCEPT
对应阻止3306端口的命令为:
[root@master hadoop]#iptables -I INPUT -i eth0 -p tcp --dport 3306 -j DROP
[root@master hadoop]#iptables -I OUTPUT -o eth0 -p tcp --sport 3306 -j DROP
保存设置:
[root@master hadoop]#/etc/rc.d/init.d/iptables save
方法2:
修改/etc/sysconfig/iptables文件,增加如下一行:
-A RH-Firewall-1-INPUT -m state --state NEW -m tcp -p tcp --dport3306 -j ACCEPT
然后重启防火墙:
[root@master hadoop]#service iptables restart
1. 关闭防火墙
重启后生效:
[root@master hadoop]#chkconfig iptables off
即时成效,但重启后会再次启动:
[root@master hadoop]#service iptables stop
至此,应该可以远程连接MySQL了。
设置MySQL不区分大小写
Linux下的MySQL安装完之后默认是区分表名的大小写,不区分列名的大小写。
改变表名大小写区分规则的方法:
root账户登录,在/etc/my.cnf或/etc/mysql/my.cnf中的[mysqld]后添加lower_case_table_names=1,重启MySQL服务。
[if !vml]
[endif]
重启MySQL服务:
[root@master ~]#service
mysqld restart
[if !vml]
[endif]
(注:如果在/etc或/etc/mysql找不到my.cnf文件,需要从其他地方拷贝过来,因为使用rpm安装MySQL时,需要手工拷贝my.cnf文件。操作如下:
到/usr/share/mysql/下找到*.cnf文件,拷贝其中一个到/etc/并改名为my.cnf:
[root@master mysql]#cp /usr/share/mysql/my-medium.cnf /etc/my.cnf
my-small.cnf是为小型数据库设计的,不应该把这个模型用于含有一些常用项目的数据库
my-medium.cnf是为中等规模的数据库而设计的
my-large.cnf是为专用于一个SQL数据库的计算机而设计的
my-huge.cnf是为企业中的数据库而设计的
拷贝完成后,进入etc目录下,编辑my.cnf
修改MySQL默认编码
MySQL数据库的默认编码并不是utf-8,启动服务并登陆MySQL,可以查看MySQL数据库的编码
mysql>show
variables like '%char%';
[if !vml]
[endif]
由上图可知,database和server的字符集使用了latin1编码方式,不支持中文,即存储中文时会出现乱码。一下修改为utf-8编码:
关闭MySQL服务:
[root@master mysql]#service mysqld stop
[if !vml]
[endif]
打开my.cnf,在文件内的[mysqld]下增加如下两行设置,并保存退出
character_set_server=utf8
init_connect=’SET NAMES utf8’
[if !vml]
[endif]
重启MySQL服务
[root@master mysql]#service mysqld start
登陆MySQL后,可以看到,编码方式已经修改为utf8
[if !vml]
[endif]
设置MySQL开机启动
[root@master ytfiles]#hkconfig mysqld on
c[if !vml]
[endif]
创建数据库
进入mysql命令行,创建以下数据库:
#hive
>create database hive DEFAULT CHARSET
utf8 COLLATE utf8_general_ci;
#activity monitor
>create database amon DEFAULT CHARSET
utf8 COLLATE utf8_general_ci;
#hue
>create database hue DEFAULT CHARSETutf8 COLLATE utf8_general_ci;
#activity oozie
>create database oozie DEFAULT CHARSET
utf8 COLLATE utf8_general_ci;
#Reports Manager
>create database reportsmanager DEFAULT
CHARSET utf8 COLLATE utf8_general_ci;
授权root用户在主节点拥有所有数据库的访问权限
>grant all privileges on *.* to
'root'@'master' identified by 'xxxx' with grant option;
>flush privileges;
安装Cloudera Manager Server和Agent
解压安装包至/opt默认目录
在master节点解压安装包至/opt默认目录
[root@master tmp]#tar
-zxvf cloudera-manager-el6-cm5.10.1_x86_64.tar.gz -C /opt
为Cloudera Manager 5建立数据库
将准备好的mysql-connector-java-5.1.33-bin.jar文件放到/opt/cm-5.10.1/share/cmf/lib/中。
并分别复制到:
/opt/cloudera/parcels/CDH-5.10.1-1.cdh5.10.1.p0.10/lib/hive/lib/ (hive需要使用)
/opt/cloudera/parcels/CDH-5.10.1-1.cdh5.10.1.p0.10/lib/oozie/lib/ (oozie需要使用)
/var/lib/oozie/ (oozie需要使用)
[root@master tmp]#cp
mysql-connector-java-5.1.33.jar /opt/cm-5.10.1/share/cmf/lib/
在master节点初始化CM5的数据库
[root@master tmp]#/opt/cm-5.10.1/share/cmf/schema/scm_prepare_database.sh
mysql cm -hlocalhost -uroot -p123456 --scm-host localhost scm 123456 scm
note:在这里后面的参数分别是:数据库类型数据库名称数据库主机名数据库用户名密码 --scm-host cmserver主机名数据库用户名 数据库用户对应的密码 scm(未知参数,未查到用途,去掉也可以执行成功,暂且保留,与网上保持一致)
配置Agent
修改/opt/cm-5.10.1/etc/cloudera-scm-agent/config.ini中的server_host为主节点的主机名master。
[root@master ~]#vim
/opt/cm-5.10.1/etc/cloudera-scm-agent/config.ini
[if !vml]
[endif]
同步Agent到所有slave节点
[root@master lib]#scp
-r /opt/cm-5.10.1/ root@slave3:/opt/
在所有节点创建cloudera-scm用户
[root@master lib]#useradd
--system --home=/opt/cm-5.10.1/run/cloudera-scm-server/ --no-create-home
--shell=/bin/false --comment "Cloudera SCM User" cloudera-scm
[if !vml]
[endif]
准备Parcels,用以安装CDH5
将CHD5相关的Parcel包放到主节点的/opt/cloudera/parcel-repo/目录中
相关的文件如下:
CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel.sha1
CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel
manifest.json
最后将CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel.sha1,重命名为CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel.sha,这点必须注意,否则,系统会重新下载CDH-5.10.1-1.cdh5.10.1.p0.10-el6.parcel文件。
执行启动脚本
在master节点启动服务端:
[root@master ~]#/opt/cm-5.10.1/etc/init.d/cloudera-scm-server
start
在所有节点启动Agent:
[root@slave1 ~]#/opt/cm-5.10.1/etc/init.d/cloudera-scm-agent
start
以上脚本是启动命令,相关停止或重启命令仅需将start变成stop或restart即可。
[if !vml]
[endif]
配置CDH集群
登录网页,安装CDH5
Cloudera Manager Server和Agent都启动以后,就可以进行CDH5的安装配置了。
在浏览器打开http://master:7180进入CDH管理界面,由于CM
Server的启动需要花点时间,这里可能要等待一会才能访问,默认的用户名和密码均为admin。
[if !vml]
[endif]
以下选择安装的CM版本,选Express免费版或者Enterprise试用版都行。
[if !vml]
[endif]
[if !vml]
[endif]
选择安装的集群,这里注意只有已启动cloudera-scm-agent的主机才能被CM管理。
点击继续,各个Agent节点正常启动后,可以在当前管理的主机列表中看到对应的节点。选择要安装的节点,点继续。
[if !vml]
[endif]
接下来,出现以下包名,说明本地Parcel包配置无误,直接点继续就可以了
[if !vml]
[endif]
如果此处发现不到parcel包,就重启所有节点的agent服务,和master的server服务,然后重新尝试。并且确认CDH版本小于或者等于CM的版本
[if !vml]
[endif]
本地通过Parcel安装过程与本地通过Package安装过程完全一致,不同的是两者的本地源的配置。
区别如下:
Package本地源:软件包是.rpm格式的,数量通常较多,下载的时候比较麻烦。通过”createrepo .”的命令创建源,并要放到存放源文件主机的web服务器的根目录下,详见创建本地yum软件源,为本地Package安装Cloudera Manager、Cloudera Hadoop及Impala做准备
Parcel本地源:软件包是以.parcel结尾,相当于压缩包格式的,一个系统版本对应一个,下载的时候方便。如centos
6.x使用的CDH版本为CDH-X.X.X-1.cdhX.X.X.p0.22-el6.parcel,而centos 5.x使用的CDH版本为CDH-X.X.X-1.cdhX.X.X.p0.22-el5.parcel。
这些文件放好之后,CM会获取这个包,并出现在主机->包裹的页面。出现的快慢跟你设置的包的刷新频率有关,默认是1小时。也可以重启CM服务和agent服务识别。
可以在管理页面的属性标签下的包裹种类里修改。
parcel安装,查看日志
[if !vml]
[endif]
正常情况下,内网网速速好的话10分钟左右激活完毕,最多不超过30分钟,如果卡住了,建议看看日志
安装过程中有什么问题,可以用
/opt/cm-5.10.1/etc/init.d/cloudera-scm-agentstatus
/opt/cm-5.10.1/etc/init.d/cloudera-scm-serverstatus
查看服务器客户端状态
也可以通过
/var/log/cloudera-scm-server/cloudera-scm-server.log
/var/log/cloudera-scm-agent/cloudera-scm-agent.log
查看日志
如果上面的路径找不到则在
日志文件夹"/opt/cm-5.10.1/log"查看日志,里面包含server和agent的log,使用命令如下:
tail -f/opt/cm-5.10.1/log/cloudera-scm-server/cloudera-scm-server.log
tail -f/opt/cm-5.10.1/log/cloudera-scm-agent/cloudera-scm-agent.log
成功激活后继续右下角点击继续
[if !vml]
[endif]
主机检查
会进入自动检查主机(耗时2分钟左右)然后给出报告,包括需要修改的部分和组件的版本
[if !vml]
[endif]
解决警告
这里有2个警告需要解决一下,至于版本里的不可用不适用不需要管。
警告一
Cloudera 建议将 /proc/sys/vm/swappiness 设置为最大值 10。当前设置为 60。使用 sysctl 命令在运行时更改该设置并编辑 /etc/sysctl.conf,以在重启后保存该设置。您可以继续进行安装,但 Cloudera
Manager 可能会报告您的主机由于交换而运行状况不良。以下主机将受到影响
解决方法
每台受影响的主机运行
echo 10 > /proc/sys/vm/swappiness 即可解决。
[if !vml]
[endif]
[root@master ~]#vim
/etc/sysctl.conf
[if !vml]
[endif]
警告二
已启用透明大页面压缩,可能会导致重大性能问题。请运行“echo
never > /sys/kernel/mm/transparent_hugepage/defrag”以禁用此设置,然后将同一命令添加到 /etc/rc.local 等初始脚本中,以便在系统重启时予以设置。以下主机将受到影响
解决方法
每台受影响的主机运行命令
[root@master ~]#echo
never > /sys/kernel/mm/transparent_hugepage/defrag
[root@master ~]#echo
never > /sys/kernel/mm/transparent_hugepage/enabled
[if !vml]
[endif]
并且
vim /etc/rc.local
加入
echo never >
/sys/kernel/mm/transparent_hugepage/defrag
echo never >
/sys/kernel/mm/transparent_hugepage/enabled
[if !vml]
[endif]
然后点击重新运行进行重新检查
[if !vml]
[endif]
[if !vml]
[endif]
全部绿勾了,然后点击右下角的完成。
选择安装哪些组件服务--这里根据需求选择即可。
[if !vml]
[endif]
右下角点击继续,然后配置角色。一般情况下保持默认就可以了(Cloudera
Manager会根据机器的配置自动进行配置,如果需要特殊调整,自行进行设置就可以了)。
我这里使用默认配置,所以直接点击继续就可以了。
[if !vml]
[endif]
配置数据库
然后配置数据库
这里需要输入自己的mysql的对应数据库名称和用户名以及密码。
我们之前在mysql中新建的数据名分布对应填入然后点击测试连接。
hive root 123456
oozie root 123456
hue root 123456
[if !vml]
[endif]
如果测试连接全部是Successful,则点击右下角的继续。
[if !vml]
[endif]
参考博文
hadoop基础----hadoop实战(七)-----hadoop管理工具---使用Cloudera
Manager安装Hadoop---Cloudera
Manager和CDH5.8离线安装
http://www.voidcn.com/blog/q383965374/article/p-6326985.html
CDH5 Hadoop集群完全离线安装步骤总结
http://blog.csdn.net/it_taojingzhan/article/details/51537258
Centos7 CM5和CDH5(5.9.0) 离线安装
http://blog.csdn.net/myself_way/article/details/54864651
ERROR 1819 (HY000): Your password does not satisfy the currentpolicy requirements
http://www.cnblogs.com/ivictor/p/5142809.html
附录
CentOS7以下系统的防火墙操作
本机连接好着,远程连接不上telnet 192.168.1.561521
Linux自身的防火墙名为“iptables”
chkconfig命令只是查看和设置服务的自动启动情况,并不能反映当前服务的状态.
service iptables status
可以查看到iptables服务的当前状态
查看防火墙状态:
/etc/init.d/iptablesstatus
暂时关闭防火墙:
/etc/init.d/iptables stop
永久关闭防火墙:
chkconfig iptables off
开启防火墙:
/etc/init.d/iptablesstart
永久开启防火墙:
chkconfig iptableson
禁止防火墙在系统启动时启动:
/sbin/chkconfig --level2345 iptables off
重启iptables:
/etc/init.d/iptablesrestart
开放防火墙端口(1521、1158)
/sbin/iptables -I INPUT-p tcp --dport 1521 -j ACCEPT
/sbin/iptables -I INPUT-p tcp --dport 1158 -j ACCEPT
保存设置命令:
/etc/rc.d/init.d/iptablessave
查看端口打开情况命令:
/etc/init.d/iptablesstatus
CentOS7以上系统的防火墙操作
centos6的版本防火墙使用的iptables,iptables是一个静态防火墙,也就是说它不能够动态的添加开启端口,必须在配置文件中添加开启端口,然后重启防火墙才能生效。
centos7的防火墙使用的是firewalld,它是动态的,可以通过命令添加开启端口,不用重启服务就可以使改变生效。
启动:#systemctlstart firewalld
查看状态:#systemctl
status firewalld或者firewall-cmd --state
停止:#systemctl
stop firewalld
禁用:#systemctl
disable firewalld
永久开启80端口:firewall-cmd --zone=public --add-port=80/tcp –permanent
说明:--add-port=80/tcp #添加端口,格式为:端口/通讯协议
--permanent #永久生效,没有此参数重启后失效
更新防火墙规则:#firewall-cmd
--reload
#firewall-cmd
--complete-reload
两者的区别就是第一个无需断开连接,就是firewalld特性之一动态添加规则,第二个需要断开连接,类似重启服务
CentOS7以上系统修改主机名
第一种:hostname 主机名
hostname 主机名称
这种方式,只能修改临时的主机名,当重启机器后,主机名称又变回来了。
第二种:hostnamectl set-hostname
hostnamectl set-hostname 主机名
使用这种方式修改,可以永久性的修改主机名称!
MySQL5.6.34相关操作
(参考博文:)
安装MySQL5.6.34的执行顺序:
rpm -ivhMySQL-server-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivhMySQL-client-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivhMySQL-shared-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivh MySQL-devel-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivhMySQL-shared-compat-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivhMySQL-embedded-5.6.34-1.linux_glibc2.5.x86_64.rpm
rpm -ivhMySQL-test-5.6.34-1.linux_glibc2.5.x86_64.rpm
[if !vml]
[endif]
安装完成后,查看生成的临时随机密码:
[root@master ytfiles]#vim /root/.mysql_secret
[if !vml]
[endif]
启动MySQL服务:
[root@master ytfiles]#service mysql start
[if !vml]
[endif]
登录MySQL:
[root@master ytfiles]#mysql -u root -p
[if !vml]
[endif]
修改MySQL初始密码:
mysql> set password for 'root'@'localhost'=password('123456');
[if !vml]
[endif]
找到my.cnf配置文件
如果"/etc/"目录下没有my.cnf配置文件,请到"/usr/share/mysql/"下找到my-default.cnf文件,拷贝其中一个合适的配置文件到"/etc/"并改名为"my.cnf"中。命令如下:
cp /usr/share/mysql/my- default.cnf /etc/my.cnf
编辑MySQL的配置文件"/etc/my.cnf"为保证MySQL能够正常工作,需要指明"mysql.sock"文件的产生位置,以及默认编码修改为UTF-8。用下面命令:
vim /etc /my.cnf
[mysqld] #下添加以下命令
socket = /var/lib/mysql/mysql/mysql.sock
datadir=/mysql_data/mysql #如果你的数据存储位置要改变的话需要在这里指定存储目录
character-set-server=utf8
lower_case_table_names=1
[if !vml]
[endif]
#(注意linux下mysql安装完后是默认:区分表名的大小写,不区分列名的大小写;# lower_case_table_names =0 0:区分大小写,1:不区分大小写)
注意:
1)还有在此配置文件还有[client]的一项配置,其中也可以设置socket,datadir两个选项
2)如果你修改了数据的存储位置目录,则需要修改MySQL启动脚本/etc/rc.d/init.d/mysql,修改 datadir=/mysql_data/mysql。
vim /etc/rc.d/init.d/mysql
问题:有时候发现设置的my.cnf值没生效:
了解一下mysql配置文件的加载顺序:
$ mysqld --help --verbose|grep -A1 -B1 cnf
Default options are read from the following files in the givenorder:
/etc/my.cnf/etc/mysql/my.cnf/usr/my.cnf
~/.my.cnf
mysql按照上面的顺序加载配置文件,后面的配置项会覆盖前面的。把/usr/my.cnf这个文件删掉,/etc/my.cnf里面的就生效了。
[root@master usr]#mv
my.cnf my.cnf.bak
[if !vml]
[endif]
错误:
MySQL> update user set host='%' where user =
'root';ERROR 1062 (23000):
Duplicate entry '%-root' for key 'PRIMARY'然后查看了下数据库的host信息如下:MySQL> select host from user where user =
'root';+-----------------------+| host |+-----------------------+| % || 127.0.0.1 || localhost.localdomain |+-----------------------+3 rows in set (0.00 sec)host已经有了%这个值,所以直接运行命令:复制代码 代码如下:MySQL>flush privileges;再用MySQL
administrator连接...成功!!
MySQL5.7修改简单密码
MySQL对用户密码安全性有所加强,所以设置的密码必须包含有数字,大写字母,小写字母,特殊符号,如果你设置的密码过于简单,会提示:
ERROR 1819 (HY000): Your password does not satisfy the currentpolicy requirements
这个其实与validate_password_policy的值有关。
validate_password_policy有以下取值:
PolicyTests Performed
0 or LOWLength
1 or MEDIUMLength; numeric, lowercase/uppercase, and special characters
2 or STRONGLength; numeric, lowercase/uppercase, and special characters; dictionary file
默认是1,即MEDIUM,所以刚开始设置的密码必须符合长度,且必须含有数字,小写或大写字母,特殊字符。
有时候,只是为了自己测试,不想密码设置得那么复杂,譬如说,我只想设置root的密码为123456。
必须修改两个全局参数:
首先,修改validate_password_policy参数的值
mysql> set global validate_password_policy=0;
Query OK, 0 rows affected (0.00sec)
这样,判断密码的标准就基于密码的长度了。这个由validate_password_length参数来决定。
[if !vml][endif]
mysql> select @@validate_password_length;
+----------------------------+
| @@validate_password_length |
+----------------------------+
| 8 |
+----------------------------+
1 row in set (0.00sec)
[if !vml][endif]
validate_password_length参数默认为8,它有最小值的限制,最小值为:
validate_password_number_count
+validate_password_special_char_count
+ (2 *validate_password_mixed_case_count)
其中,validate_password_number_count指定了密码中数据的长度,validate_password_special_char_count指定了密码中特殊字符的长度,validate_password_mixed_case_count指定了密码中大小字母的长度。
这些参数,默认值均为1,所以validate_password_length最小值为4,如果你显性指定validate_password_length的值小于4,尽管不会报错,但validate_password_length的值将设为4。如下所示:
[if !vml][endif]
mysql> select @@validate_password_length;
+----------------------------+
| @@validate_password_length |
+----------------------------+
| 8 |
+----------------------------+
1 row in set (0.00sec)
mysql> set global validate_password_length=1;
Query OK, 0 rows affected (0.00sec)
mysql> select @@validate_password_length;
+----------------------------+
| @@validate_password_length |
+----------------------------+
| 4 |
+----------------------------+
1 row in set (0.00sec)
[if !vml][endif]
如果修改了validate_password_number_count,validate_password_special_char_count,validate_password_mixed_case_count中任何一个值,则validate_password_length将进行动态修改。
[if !vml][endif]
mysql> select @@validate_password_length;
+----------------------------+
| @@validate_password_length |
+----------------------------+
| 4 |
+----------------------------+
1 row in set (0.00sec)
mysql> select @@validate_password_mixed_case_count;
+--------------------------------------+
| @@validate_password_mixed_case_count |
+--------------------------------------+
| 1 |
+--------------------------------------+
1 row in set (0.00sec)
mysql> set global validate_password_mixed_case_count=2;
Query OK, 0 rows affected (0.00sec)
mysql> select @@validate_password_mixed_case_count;
+--------------------------------------+
| @@validate_password_mixed_case_count |
+--------------------------------------+
| 2 |
+--------------------------------------+
1 row in set (0.00sec)
mysql> select @@validate_password_length;
+----------------------------+
| @@validate_password_length |
+----------------------------+
| 6 |
+----------------------------+
1 row in set (0.00sec)
[if !vml][endif]
当然,前提是validate_password插件必须已经安装,MySQL5.7是默认安装的。
那么如何验证validate_password插件是否安装呢?可通过查看以下参数,如果没有安装,则输出将为空。
[if !vml][endif]
mysql> SHOW VARIABLES LIKE 'validate_password%';
+--------------------------------------+-------+
|Variable_name | Value |
+--------------------------------------+-------+
|validate_password_dictionary_file | |
|validate_password_length | 6 |
|validate_password_mixed_case_count | 2 |
|validate_password_number_count | 1 |
|validate_password_policy |LOW |
| validate_password_special_char_count | 1 |
+--------------------------------------+-------+
6 rows in set (0.00sec)
(注:出自博客:http://www.cnblogs.com/ivictor/p/5142809.html)
Linux系统备份与还原
Linux不像windows,它不限制根用户存取任何东西,因此,你完全可以把一个分区上每一个的文件放入一个TAR文件中。
使用root用户切换到根目录
[root@master ~]#cd
/
然后,创建backup文件夹,用以存放备份的系统压缩包:
[root@master /]#mkdir
backup
然后,使用下面的命令备份完整的系统:
[root@master /]#tar
cvpzf /backup/backup_full.tar.gz --exclude=/proc --exclude=/lost+found
--exclude=/backup --exclude=/mnt --exclude=/sys /
说明:
tar 部分就是我们将要使用的软件。
'cvpfz'是我们给tar加的选项,像“创建一个压缩文档”(这是显然的),“保存权限”(以便使每一个相同的文件有相同的权限),以及“gzip”(缩减大小)。接下来,是压缩文档将获得的名称,在我们的例子中是backup.tgz。
紧随其后的是我们想要备份的根目录。既然我们想备份所有东西:/。接着就是我们要剔除的目录了:我们不想备份每一样东西,因为包括有些目录不是非常有用。同时确保你没有把备份文件本身也加进去了,否则,你会得到怪异的结果的。你也许同样不打算把/mnt文件夹包括进来——如果你在那儿挂载了其他分区——否则最终你会把那些也备份的。同时确保你没有任何东西挂载在 /media(即没有挂载任何cd或可移动介质)。否则,剔除/media。
在进程的最后,你也许会得到一条信息,写着“tar:由于先前错误的耽搁而存在错误”或者其他什么,不过大多数情况下你可以仅仅忽略它。
作为选择,你可以使用Bzip来压缩你的备份。这意味着较高的压缩比但是也意味着较低的速度。如果压缩比对你很重要,只需用“j”替换命令中的“z”,同时给备份命一个相应的扩展名。这些会使命令变成这样:
[root@master /]#tar cvpjf /backup/backup_full.tar.bz2
--exclude=/proc --exclude=/lost+found --exclude=/backup --exclude=/mnt
--exclude=/sys /
恢复:
如果系统被毁坏,那么我们就可以用备份好的tar包进行恢复。
在分区的backup目录下的backup_full.tar.gz文件
[root@master /]#tar
xvpfz /backup/backup_full.tar.gz -C /
如果你使用 bz2:
[root@master /]#tar
xvpfj /backup/backup_full.tar.bz2 -C /
警告:这会把你分区里所有文件替换成压缩文档里的文件!
确保在你做其他任何事情之前,重新创建你剔除的目录:
[root@master /]#mkdir
proc
[root@master /]#mkdir
lost+found
[root@master /]#mkdir
mnt
[root@master /]#mkdir
sys
/proc 权限:文件所有者:root群组:root 所有者:读取执行群组:读取执行其它:读取执行
/lost+found 权限:文件所有者:root群组:root 所有者:读取写入执行群组:读取执行其它:读取执行
/mnt 权限:文件所有者:root群组:root 所有者:读取写入执行群组:读取执行其它:读取执行
/sys 权限:文件所有者:root群组:root 所有者:读取写入执行群组:读取执行其它:读取执行
当你重启以后,所以的事情都会和你备份的时候一模一样。
(注:参考博客:http://www.centoscn.com/image-text/2013/0418/318.html)