安装过程中遇到的问题从以下博客学习而得,现对其进行整理
在Hadoop1.2.1分布式集群环境下安装hive0.12
CentOS下Hive2.0.0单机模式安装详解
CentOS下Hive2.0.0集群模式安装详解
解决Hive installation issues: Hive metastore database is not initialized
hive启动报错 java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7B
java 1.7以上
hadoop版本参见hive官网的支持版本号,并启动hadoop集群。
Hive官网地址: http://hive.apache.org/
下载安装包后用tar -xzvf命令解压,并用mv对文件夹重命名为hive
vim /etc/profile,加入下面几行
HIVE_HOME=/home/hive
CLASSPATH=$CLASSPATH:$HIVE_HOME/lib
PATH=$PATH:$HIVE_HOME/bin
export HIVE_HOME CLASSPATH PATH
保存后使用命令:source /etc/profile使环境变量立即生效
进入hive/conf根据各template创建这两个文件
HADOOP_HOME=/home/hadoop
此处需要修改的部分2.1.0版本都不用修改,低版本可能需要修改
把hive.metastore.schema.verification=true,修改为 hive.metastore.schema.verification=false
至此hive的相关配置工作完成。
Hive默认使用derby数据库存储元数据,但是该数据库不适用于生产环境,这边使用MySQL作为元数据的存储数据库。
所以需要先安装好MySQL
。
安装过程使用sudo apt-get install mysql-server mysql-client命令安装即可,但是注意如果出现Encountered a section with no Package: header错误时,使用如下命令解决:
sudo rm /var/lib/apt/lists/* -vf
sudo apt-get update
安装MySQL过程中会为root用户设置密码,安装完毕后输入mysql -u root -p以及密码启动MySQL来创建数据库用户create user 'hive' identified by 'hive';
grant all privileges on *.* to 'hive' with grant option;
flush privileges;
create database hive;
下载地址:http://dev.mysql.com/downloads/connector/j/ ,解压后拷贝其中的mysql-connector-java-5.1.39-bin.jar
到hive的lib文件夹下。
javax.jdo.option.ConnectionURL
jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true
JDBC connect string for a JDBC metastore
javax.jdo.option.ConnectionDriverName
com.mysql.jdbc.Driver
Driver class name for a JDBC metastore
javax.jdo.option.ConnectionUserName
hive
username to use against metastore database
javax.jdo.option.ConnectionPassword
hive
password to use against metastore database
在使用hive或者hive --service cli来运行之前需要初始化数据库,如果在初始化之前已经运行了上述命令并且失败,则需要删除产生的metastore_db文件
使用命令schematool -initSchema -dbType mysql初始化mysql数据库
出现以下几行说明初始化成功:
Starting metastore schema initialization to 2.1.0
Initialization script hive-schema-2.1.0.derby.sql
Initialization script completed
schemaTool completed
在使用hive或者hive --service cli运行hive时出现java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bsystem:user.name%7D错误
需要修改hive-site.xml的以下部分
hive.exec.scratchdir
/tmp/hive
HDFS root scratch dir for Hive jobs which gets created with write all (733) permission. For each connecting user, an HDFS scratch dir: ${hive.exec.scratchdir}/ is created, with ${hive.scratch.dir.permission}.
hive.exec.local.scratchdir
/tmp/hive/local
Local scratch space for Hive jobs
hive.downloaded.resources.dir
/tmp/hive/resources
Temporary local directory for added resources in the remote file system.
使用命令:
show tables;
create table test1(id int,name string);
select * from test1;
drop table test1;
来测试HiveQL是否能使用。