通过数据库客户端界面工具DBeaver连接Hive

我的原创地址:https://dongkelun.com/2018/07/13/dbeaverConnectHive/

前言

本文讲解如何通过数据库客户端界面工具DBeaver连接hive,并解决驱动下载不下来的问题。

1、为什么使用客户端界面工具

为什么使用客户端界面工具而不用命令行使用hive

  • 通过界面工具查看分析hive里的数据要方便很多
  • 业务人员没有权限通过命令行连接hive
  • 领导喜欢在界面工具上查看hive里的数据

2、为什么使用DBeaver

其实在网上搜一下,连接hive的工具还有很多,使用DBeaver的原因是因为我之前连接关系型数据库使用的就是DBeaver,正好DBeaver支持连接hive,且个人认为DBeaver确实挺好用的,支持各种关系型数据库,如连接Oracle数据库不需要像plsql那样自己配置连接文件,只需要在界面上输入url、用户名、密码即可,还有就是DBeaver的快捷键和Eclipse是一样的,比如注释、删除一行、复制一行到下一行等。

3、DBeaver下载、安装

之前我一直用的旧版的,现在在官网上下载了最新版的DBeaver,发现界面功能比旧版好用了很多,亲测连hive没有问题。
下载地址:https://dbeaver.io/download/
我下载的免安装版(不带jre),windows64位,大家可以根据自己情况下载对应版本。
通过数据库客户端界面工具DBeaver连接Hive_第1张图片

因为我下载的免安装版,所以解压后,直接点击dbeaver.exe就可以使用了!

4、启动hive相关

测试连接前先启动hive相关的服务

1、启动hdfs、yarn

opt/hadoop-2.7.5/sbin/start-dfs.sh
/opt/hadoop-2.7.5/sbin/start-yarn.sh

2、启动hiveserver2(hive-0.11.0以后的版本)
如果想远程连接hive,则需要启动hiveserver2

/opt/apache-hive-2.3.2-bin/bin/hive --service hiveserver2

通过数据库客户端界面工具DBeaver连接Hive_第2张图片

关于hadoop和hive的配置可以参考centos7 hadoop 单机模式安装配置、centos7 hive 单机模式安装配置

  • 注:图中的startall.sh就是上面hdfs、yarn的启动命令

5、创建hive测试表

CREATE TABLE IF NOT EXISTS test_20180713 (id INT,name STRING)ROW FORMAT DELIMITED FIELDS TERMINATED BY " " LINES TERMINATED BY "\n";

insert into test_20180713 values(1,'tom');

通过数据库客户端界面工具DBeaver连接Hive_第3张图片

6、DBeaver连接hive

DBeaver连接关系型数据库比较的简单,连接hive的话因为要配置下载驱动,所以这里详细说明一下。

6.1 文件->新建->数据库连接(新版是中文的,而之前旧版的是英文的,这点我还是比较喜欢的~)

通过数据库客户端界面工具DBeaver连接Hive_第4张图片

6.2 选择新连接类型->Apache Hive(从这里看到,DBeaver支持的数据库还是很多的)

通过数据库客户端界面工具DBeaver连接Hive_第5张图片

6.3 填一下hiveserver2的ip和hive的数据库名

通过数据库客户端界面工具DBeaver连接Hive_第6张图片

6.4 编辑驱动设置-下载/更新(第一次打开需要下载maven的依赖配置,需等待一会)

通过数据库客户端界面工具DBeaver连接Hive_第7张图片

这里需等待一会,截图太多,记不清楚是不是这个图了~

通过数据库客户端界面工具DBeaver连接Hive_第8张图片

6.5 选择hive的版本,我这里的版本为2.3.2

到这里就有问题了,之前我在公司的测试机用ambari装的hive的版本是1.2.1,然后下载1.2.1需要的hive的jar包,很快就下载下来了,之后就可以查询hive里的数据了,但是在自己的虚拟机版本为2.3.2,2.3.2的jar就下不下来了
通过数据库客户端界面工具DBeaver连接Hive_第9张图片
通过数据库客户端界面工具DBeaver连接Hive_第10张图片

尝试将maven库改为阿里云的无效,且测试和DBeaver的版本无关,旧版和最新版的都下载不下来

通过数据库客户端界面工具DBeaver连接Hive_第11张图片

7、用hive自带的jdbc jar

多次尝试依然解决不了驱动下载不下来的问题,只能尝试用hive安装包自带的jdbc jar了,幸好DBeaver和hive很好的支持了这种方法。hive帮我们集成了jdbc相关的一个jar包,这样我们就不用一个一个去lib下找相关的jar包了~
首先将hive安装包里的jdbc包下载到本地,jar包位置:

/opt/apache-hive-2.3.2-bin/jdbc/hive-jdbc-2.3.2-standalone.jar 

然后将DBeaver默认的jar删除,再添加上我们刚才下载的jar包,然后下一步,命名我们的连接。
通过数据库客户端界面工具DBeaver连接Hive_第12张图片
通过数据库客户端界面工具DBeaver连接Hive_第13张图片
通过数据库客户端界面工具DBeaver连接Hive_第14张图片

8、测试连接

右键连接名->编辑连接->测试连接,然后发现报了一个异常
通过数据库客户端界面工具DBeaver连接Hive_第15张图片
通过数据库客户端界面工具DBeaver连接Hive_第16张图片

9、解决异常

但是在ambari安装的hive上测试这种方法是没有问题的,经过网上查询该异常,发现是我的hdfs配置问题,修改hdfs的core-site.xml即可
先关掉hdfs、yarn、hiveserver2服务

vim /opt/hadoop-2.7.5/etc/hadoop/core-site.xml 

添加

<property>
    <name>hadoop.proxyuser.root.hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.root.groups</name>
    <value>*</value>
</property>

然后重启hdfs、yarn、hiveserver2
具体可参考[Hive]那些年我们踩过的Hive坑里的第十个异常。

10、再次测试

再次测试连接,成功!
通过数据库客户端界面工具DBeaver连接Hive_第17张图片

从这里可以看出DBeaver的界面功能还是挺丰富的,使用起来也比较方便

你可能感兴趣的:(大数据,hive)