Hive安装


Hive安装

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 

Hive是一个客户端工具,需要在哪台机器上运行就在哪台机器上安装,根据metastore的位置可以将hive的安装模式分为3种:内嵌模式,本地模式,远程模式。

Hive的安装是需要在hadoop基础上的,关于hadoop集群的搭建在之前已经讲过,在此基础上我们来安装hive。

1 在master机器的~目录下解压hive-0.7.1.tar.gz,并重命名为hive。

2 在~/.bashrc中添加以下内容:



 
 



 
 

3 在HDFS中建立tmp和/user/hive/warehouse目录并改写权限


Hive安装_第1张图片
 
 

4 在命令行下输入hive,出现如下界面,则安装成功。




 

以上是内嵌模式的安装过程,内嵌模式仅仅允许一个会话,只适用于简单的测试。

如果要支持多用户多会话,则需要一个独立的元数据库,目前比较流行的是使用mysql作为元数据库,配置一个独立的元数据库需要在内嵌的基础上增加以下步骤

5 在本地安装mysql客户端和服务器端,并启动mysql服务。

sudo apt-get install mysql-server mysql-client



 
 

6 为hive建立相应的mysql账号,并赋予足够的权限。


Hive安装_第2张图片
 
 

7 建立hive专用的数据库



 
 

8 修改HIVE_HOME/conf目录下的hive-site.xml文件(如果不存在,从hive-default.xml复制)

打开hive-site.xml文件,修改以下属性值:



 



 



 



 


 

9 将mysql的驱动包放到HIVE_HONE/lib目录下

10 在命令行下输入hive,出现如下界面,则安装成功。


Hive安装_第3张图片
 

以上是hive独立模式的安装,hive的独立模式可以满足大多数的开发需要。

在独立模式的基础上,我们来配置远程模式

11 打开HIVE_HOME/conf/hive-site.xml文件,修改如下两项:



 



 

(其中的192.168.0.21是远程mysql所在的地址)

添加如下一项

 

(其中的192.168.0.21是hive所在的地址)

12 启动如下两项服务(在此之前,保证你的远程mysql已经启动)



 



 

13 在命令行下输入hive,出现如下界面,则安装成功。


Hive安装_第4张图片
 

以上是远程模式的安装过程。

 

你可能感兴趣的:(Hadoop,数据库,大数据)