HiveServer、HiveServer2 区别

hiveServer/HiveServer2 区别

1:简单介绍
两者都允许远程客户端使用多种编程语言,通过HiveServer或者HiveServer2,客户端可以在不启动CLI的情况下对Hive中的数据进行操作,这两个和都允许远程客户端使用多种编程语言如java,python等向hive提交请求,取回结果(从hive0.15起就不再支持hiveserver了),但是在这里我们还是要说一下hiveserver
HiveServer或者HiveServer2都是基于Thrift的,但HiveSever有时被称为Thrift server,而HiveServer2却不会。既然已经存在HiveServer,为什么还需要HiveServer2呢?这是因为HiveServer不能处理多于一个客户端的并发请求,这是由于HiveServer使用的Thrift接口所导致的限制,不能通过修改HiveServer的代码修正。因此在Hive-0.11.0版本中重写了HiveServer代码得到了HiveServer2,进而解决了该问题。HiveServer2支持多客户端的并发和认证,为开放API客户端如JDBC、ODBC提供更好的支持。

2:两者的区别
Hiveserver1 和hiveserver2的JDBC区别:
version Connection URL Driver Class
HiveServer2 jdbc:hive2://: org.apache.hive.jdbc.HiveDriver
HiveServer1 jdbc:hive://: org.apache.hadoop.hive.jdbc.HiveDriver

Hive数据导入六种方式:

1.加载本地文件到hive表
2.加载hdfs文件到hive中
3.加载数据覆盖表中已有的数据
4.创建表时通过select加载
5.创建表通过insert加载
6.创建表的时候通过location指定加载

Hive数据导出四种方式

1.通过insert导出
2.通过Hadoop 命令导出
3.通过hive shell 命令导出
4.使用sqoop导出

Sqoop增量导入:2种方法

1.)Sqoop 增量导入的功能是: 不必把关系型数据库中的数据重新导一次, 只需要导入新增的即可。
2.)创建Sqoop Job 可以。

你可能感兴趣的:(Hive)