首先在安装HIVE之前要安装Hadoop、Zookeeper和mysql,Hadoop和mysql的安装方法在我之前的博客里有,有需要的可以去看一下的。
首先下载Zookeeper安装压缩包
自取:https://pan.baidu.com/s/1ZHtPyPS9XODT8sL16DpiVg
提取码:8ase
1.下载完成后上传到Linux系统上的opt文件夹下。
2.解压该压缩包
tar -zxf /opt/zookeeper-3.4.5-cdh5.14.2.tar.gz
3.个人习惯把安装的软件放在soft文件夹下,没有的自己创建一下。
mv zookeeper-3.4.5-cdh5.14.2 soft/zk345
4.修改配置文件,进入到zookeeper文件夹下的conf文件夹,里面会有三个文件,复制zoo_sample.cfg为zoo.cfg
cd /opt/soft/zk345/conf/
cp zoo_sample.cfg zoo.cfg
5.进入zoo.cfg
vi zoo.cfg
将dataDir后面的值改一下,这主要是存放zookeeper数据的位置,最好不要放在默认的文件夹下,放在zookeeper文件夹下,即改为:/opt/soft/zk345/tmp
再在最后一行添加
server.1=192.168.56.101:2287:3387
后面两个端口:(最好选择不会被占用的端口号,不可以和别的端口号重复)
第一个端口主要是用于leader和跟班进行数据交换的端口。
第二个端口主要是当leader断线之后用于新的leader和跟班进行数据交换的端口。
这就完成了!!!
然后去添加一下环境变量就行了
vi /etc/profile
在最后一行添加以下两句话
export ZOOKEEPER_HOME=/opt/soft/zk345
export PATH=$PATH:$ZOOKEEPER_HOME/bin
然后激活一下配置文件就好了
source /etc/profile
到此为止,Zookeeper就安装好了
启动Zookeeper
zkServer.sh start
查看后台进程有QuorumPeerMain就可以了
同样首先下载HIVE的安装包
自取:https://pan.baidu.com/s/159XCZUvZH9u6P25aCNb3pA
提取码:pyak
1.将下载好的安装包上传到Linux系统上
2.解压安装包
tar -zxf hive-1.1.0-cdh5.14.2.tar.gz
3.将软件移动到soft文件夹下(个人习惯)
mv hive-1.1.0-cdh5.14.2 soft/hive110
4.修改配置文件,默认是没有hive-site.xml文件的,需要新建
cd /opt/soft/hive110/conf
vi hive-site.xml
将以下的配置文件拷贝到该文件中
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/usr/hive/warehouse</value>
</property>
<property>
<name>hive.metastore.local</name>
<value>false</value> //如果是连接本地数据库,则该值为true
</property>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://192.168.56.101:3306/hive?createDatabaseIfNotExist=true</value>
//如果是本地数据库则为localhost:3306,我这里连接的是linux上的数据库
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>ok</value> //这里是数据库密码,根据个人情况自行更改
</property>
//从这里往下的配置文件主要适用于用beeline登录hive数据库时所需的配置,如果不需要可以不写一下配置
<property>
<name>hive.server2.authentication</name>
<value>NONE</value>
</property>
<property>
<name>hive.server2.thrift.client.user</name>
<value>root</value>
</property>
<property>
<name>hive.server2.thrift.client.password</name>
<value>root</value>
</property>
</configuration>
同样也要添加环境变量
vi /etc/profile
在最后一行添加以下两句话
export HIVE_HOME=/opt/soft/hive110
export PATH=$PATH:$HIVE_HOME/bin
添加完成后一定要激活
source /etc/profile
注意:还有最重要的一步:因为HIVE要连接数据库,所以需要连接数据库的驱动文件(很重要!!!)
将jar包放在/opt/soft/hive110/lib里面就可以了
自取:https://pan.baidu.com/s/1sHVPyRk8yI5UHCXtS3n8pw
提取码:re2k
然后就是启动HIVE
注意:第一次启动HIVE需要输入以下命令,这样才能在mysql中建立HIVE的数据库以存放元数据(即所需存取数据的结构,并非数据)。
schematool -dbType mysql -initSchema
只有第一次安装才需要,以后启动HIVE就不需要写了
启动HIVE的顺序,但是启动HIVE之前一定要启动Hadoop和ZooKeeper
hive启动方法
1.hive --service metastore //启动HIVE服务
2.hive //启动HIVE
//如果是用beeline启动,则需要在hive-site.xml中添加我上面备注的配置,不然没法使用beeline
beeline启动方法
1.hiveserver2
2.beeline -u jdbc:hive2://192.168.56.101:10000 -n root