使用内嵌的derby
数据库储存元数据, 默认即为内嵌模式
运行hive会在当前目录生成一个derby
文件和一个metastore_db
目录
同一个目录下同时只能有一个hive客户端能使用数据库, 适合用来测试, 不适用于生产环境
需要在 Hive 根目录下的 conf 文件夹中创建 hive-site.xml
文件并添加如下配置:
javax.jdo.option.ConnectionURL
jdbc:derby:;databaseName=metastore_db;create=true
javax.jdo.option.ConnectionDriverName
org.apache.derby.jdbc.EmbeddedDriver
hive.metastore.local
true
hive.metastore.warehouse.dir
/user/hive/warehouse
hive.metastore.warehouse.dir
/user/hive/warehouse
本地安装 MySQL替代 derby
存储元数据, 不再使用内嵌的 derby
作为元数据的存储介质,而是使用其他数据库比如 MySQL 来存储元数据
Hive 服务和 metastore 服务运行在同一个进程中, MySQL 是单独的进程, 可以同一台机器, 也可以在远程机器上
需要将 MySQL 的驱动 jar 包拷贝到 $HIVE_HOME/lib
目录下, 并启动 MySQL 服务
hive-site.xml
配置如下
hive.metastore.warehouse.dir //数据库储存路径
/user/hive_remote/warehouse
hive.metastore.local //本地模式
true
javax.jdo.option.ConnectionURL //所连接的 MySQL 数据库的地址
jdbc:mysql://localhost/hive_local?createDatabaseIfNotExist=true //问号后固定格式防止定时任务报错
javax.jdo.option.ConnectionDriverName // MySQL 驱动
com.mysql.jdbc.Driver
javax.jdo.option.ConnectionUserName //数据库账户
hive
javax.jdo.option.ConnectionPassword //数据库密码
password
Hive 服务和 metastore 在不同的进程内, 可能是不同的机器, 该模式需要将 hive.metastore.uris
设置为 metastore 服务器URL
使用三台机器模拟:
host1 Mysql 服务端
host2 Hive 服务端
host3 Hive 客户端
需要修改 HIve 服务端和客户端的hive-site.xml
配置文件
host2 下的hive-site.xml
配置(服务端)
hive.metastore.warehouse.dir //数据库储存路径
/user/hive_remote/warehouse
hive.metastore.local //本地模式
true
javax.jdo.option.ConnectionURL //所连接的 MySQL 数据库的地址
jdbc:mysql://host1:3306/hive?createDatabaseIfNotExist=true //指定MySQL服务所在地址
javax.jdo.option.ConnectionDriverName // MySQL 驱动
com.mysql.jdbc.Driver
javax.jdo.option.ConnectionUserName //数据库账户
hive
javax.jdo.option.ConnectionPassword //数据库密码
password
host3 下的 hive-site.xml 配置(客户端)
hive.metastore.warehouse.dir //数据库储存路径
/user/hive_remote/warehouse
hive.metastore.local //注意这里是false, 不是本地模式
false
hive.metastore.uris //注意这里是false, 不是本地模式
thrift://host2:9083
如果有多个 metastore 服务器, 将 URL 之间用逗号分隔, metastore 服务器 URL 的格式为 thrift:host:port thrift://127.0.0.1:9083