E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hive0.11
hive之文件格式与压缩
文本文件:文本文件就是txt文件,我们默认的文件类型就是txt文件ORC文件:ORC介绍:ORC(OptimizedRowColumnar)fileformat是
Hive0.11
版里引入的一种列
小唐同学爱学习
·
2023-07-24 22:34
hive
hive
hadoop
数据仓库
关闭hive自动开启mapjoin
Hive的mapjoin可以将小表放到内存然后进行表的关联,极大的提升了hive语句的执行效率,在
Hive0.11
前,必须使用MAPJOIN来标记显示地启动该优化操作,在
Hive0.11
后,Hive默认启动该优化
天河~
·
2023-04-20 20:27
hive
hive
hcatalog简介和使用
所以只能降级使用hcatalog0.4,由于hcatalog中所有的底层数据信息都是保存在hivemetastore里,所以hive版本升级后schema变动或者api变动会对hacatalog产生影响,因此在
hive0.11
本宝宝天然萌
·
2021-05-21 08:06
两种数据格式(Parquet/ORCfile)浅析
Orcfile(OptimizedRowColumnar)是
hive0.11
版里引入的新的存储格式,是对之前的RCFile存储格式的优化,是HortonWorks开源的。
young-ming
·
2020-08-16 21:00
Hadoop
好玩的大数据之19:Hive实验2(hive beeline)
一、简介Hive客户端工具后续将使用Beeline替代HiveCLI,并且后续版本也会废弃掉HiveCLI客户端工具,Beeline是
Hive0.11
版本引入的新命令行客户端工具,它是基于SQLLineCLI
张文斌_2020
·
2020-08-14 16:42
详解hive的join优化
Hive0.11
改进了这些情况的优化器:Join过程中加入有表可以存于内存。在新的优化中:该表会作为哈希表加载到内存中只需要扫描较大的表事实表在内存中的占用空间较小星型模型
大数据星球-浪尖
·
2020-08-07 09:31
hive beeline详解
Hive客户端工具后续将使用Beeline替代HiveCLI,并且后续版本也会废弃掉HiveCLI客户端工具,Beeline是
Hive0.11
版本引入的新命令行客户端工具,它是基于SQLLineCLI的
Yobhel
·
2020-08-03 19:31
hive增量更新
hive0.11
之后开始支持update和delete。但是hive频繁更新与hive的设计原则相反,并且hive增量更新很缓慢。
weixin_42349937
·
2020-07-28 21:24
Hive
HIve 分析和窗口函数 WindowingAndAnalytics
但是,
Hive0.11
之后引入了窗口查询功能,使用WINDOW语句我们可以基于分区和窗口,在实现分组分析的目的的同时,为每条数据都生成一行结果记录。
我叫龙翔天翼
·
2020-07-15 06:24
Hive
大数据
Hive分析函数和窗口函数
Hive分析函数和窗口函数在
Hive0.11
之后支持的,扫描多个输入的行计算每行的结果。通常和OVER,PARTITIONBY,ORDERBY,WINDOWING配合使用。
yanzhelee
·
2020-07-14 02:25
hive
hive学习总结(2)—Hive几种导出数据方式
hadoopfs–cpsource_pathtarget_path2.导出到本地文件系统--不能使用insertintolocaldirectory来导出数据,会报错--只能使用insertoverwritelocaldirectory来导出数据--
hive0.11
hahakama
·
2020-07-09 16:57
大数据
hive
hive学习总结(2)—Hive几种导出数据方式
hadoopfs–cpsource_pathtarget_path2.导出到本地文件系统--不能使用insertintolocaldirectory来导出数据,会报错--只能使用insertoverwritelocaldirectory来导出数据--
hive0.11
weixin_33978016
·
2020-06-28 09:09
hive insert directory指定分隔符
hiveinsertdirectory指定分隔符1.hive0.11以前的版本
hive0.11
以前的版本不支持insertdirectory后面指定分隔符,但可以通过concat方式来完成如:insertoverwritedirectory'hdfs
wangjinyuan161
·
2020-06-27 13:06
hive
实战hadoop海量数据处理系列04预热篇:窗函数row_number 从理论到实践
实战hadoop海量数据处理系列04预热篇:窗函数row_number从理论到实践作者写第一版书的时候,,hive还没有官方支持row_number,需要使用UDF来实现额外的jar;不过幸运的是,从
hive0.11
titer1
·
2020-06-26 19:47
大数据
Hive 如何使用mapjoin
Reduce任务也就不需要经过shuffle阶段,从而能在一定程度上节省资源提高JOIN效率简单总结一下,mapjoin的使用场景:1.关联操作中有一张表非常小2.不等值的链接操作具体使用:方法一:在
Hive0.11
小癫僧
·
2020-03-24 08:23
Hive分析函数和窗口函数
Hive分析函数和窗口函数在
Hive0.11
之后支持的,扫描多个输入的行计算每行的结果。通常和OVER,PARTITIONBY,ORDERBY,WINDOWING配合使用。
yanzhelee
·
2019-12-28 16:47
Hive碎碎念(2):分析函数和窗口函数
文章转载自文章在
Hive0.11
之后支持的,扫描多个输入的行计算每行的结果。通常和OVER,PARTITIONBY,ORDERBY,WINDOWING配合使用。
xxlee
·
2019-04-26 16:24
HIVE仓库扩展:连接hive数据库
Beeline是从
Hive0.11
版本引入的。Beeline工作模式有
花露丝雨
·
2019-01-28 17:12
Hive开发使用-
3.2BeeLineHiveServer2还提供了新的CLI:BeeLine,它是
Hive0.11
引入的新的交
老子跑的动
·
2018-12-16 21:34
大数据
Hive
Sql
Hive _ Hive2 新版连接工具 beeline 详解
Beeline是从
Hive0.11
版本引入的。HiveServer2支持一个新的命令行Shell,称为Beeline,它是基于SQLLineCLI的JDBC客户端。
高达一号
·
2018-06-13 22:32
Hive
HIVE仓库扩展:连接hive数据库
Beeline是从
Hive0.11
版本引入的。Beeline工作模式有
世界之大追梦者
·
2018-03-08 14:46
HIVE
实战hadoop海量数据处理系列04预热篇:窗函数row_number 从理论到实践
实战hadoop海量数据处理系列04预热篇:窗函数row_number从理论到实践作者写第一版书的时候,,hive还没有官方支持row_number,需要使用UDF来实现额外的jar;不过幸运的是,从
hive0.11
titer1
·
2017-06-09 12:00
hadoop
hive
海量数据
ROW-NUMBER
Hive Beeline
Beeline是
Hive0.11
引入的新的交互式CLI,基于SQLLine,可以作为HiveJDBCClient端访问HiveServer2,启动一个Beeline就是维护一个session。
post_yuan
·
2017-03-10 15:27
大数据
Hive
新一代Hive客户端工具:Beeline
Beeline是从
Hive0.11
版本引入的。HiveServer2支持一个新的命令行Shell,称为Beeline,它是基于SQLLineCLI的JDBC客户端。
Free World
·
2016-08-17 10:11
Hive
Hive实战
hive学习 —Hive几种导出数据方式
hadoopfs–cpsource_pathtarget_path2.导出到本地文件系统--不能使用insertintolocaldirectory来导出数据,会报错--只能使用insertoverwritelocaldirectory来导出数据--
hive0.11
mtj66
·
2016-08-07 16:20
hive0.11
的编译/安装/配置
一、获取hive 0.11文件 1、直接在apache网站下载release版 2、自己下载源码编译。方法: git clone https://github.com/amplab/hive.git -b sh
·
2015-11-11 14:46
hive
Hive0.11
安装配置学习笔记
转:http://springsfeng.iteye.com/blog/1734517 1 . 首先请安装好MySQL并修改root账户密码,使用root账户执行下面命令: su - root mysql &n
·
2015-10-28 07:07
hive
hive insert directory指定分隔符
hiveinsertdirectory指定分隔符1.hive0.11以前的版本
hive0.11
以前的版本不支持insertdirectory后面指定分隔符,但可以通过concat方式来完成 如: insertoverwritedirectory'hdfs
wangjin161
·
2015-10-27 11:00
Improvements to the Hive Optimizer
LanguageManualJoinOptimizationImprovementstotheHiveOptimizerHive可以自动优化,在
Hive0.11
里面改进了一些优化用例1、JOIN的一边适合放在内存
Free World
·
2015-06-21 23:50
Hive
Improvements to the Hive Optimizer
LanguageManualJoinOptimizationImprovementstotheHiveOptimizerHive可以自动优化,在
Hive0.11
里面改进了一些优化用例1、
jiangshouzhuang
·
2015-06-21 23:00
Hive几种导出数据方式
hadoopfs–cpsource_pathtarget_path2.导出到本地文件系统--不能使用insertintolocaldirectory来导出数据,会报错--只能使用insertoverwritelocaldirectory来导出数据--
hive0.11
duncandai
·
2015-05-11 21:05
hive
Hive几种导出数据方式
source_pathtarget_path 2.导出到本地文件系统 --不能使用insertintolocaldirectory来导出数据,会报错--只能使用insertoverwritelocaldirectory来导出数据 --
hive0.11
daizj
·
2015-05-11 13:00
数据
hive
hive0.11
hiveserver custom认证bug
最近在测试hive0.11hiveserver时遇到的一个关于认证的bug,具体表现:在配置中指定了custom的认证方式时,通过beeline连接hiveserver2,发现连接hang住。hive配置: hive.server2.authenticationa CUSTOM hive.server2.custom.authentication.class com.vipshop.hive
菜菜光
·
2015-01-11 21:23
bug
custom
0.11
hiveserver
hive0.11
hiveserver custom认证bug
最近在测试hive0.11hiveserver时遇到的一个关于认证的bug,具体表现:在配置中指定了custom的认证方式时,通过beeline连接hiveserver2,发现连接hang住。hive配置:hive.server2.authenticationaCUSTOMhive.server2.custom.authentication.classcom.vipshop.hive.servic
菜菜光
·
2015-01-11 21:23
bug
custom
hiveserver
0.11
hive
hive0.11
hiveserver custom认证bug
最近在测试hive0.11hiveserver时遇到的一个关于认证的bug,具体表现:在配置中指定了custom的认证方式时,通过beeline连接hiveserver2,发现连接hang住。hive配置: hive.server2.authenticationa CUSTOM hive.server2.custom.authentication.class com.vipshop.hive
菜菜光
·
2015-01-11 21:23
bug
custom
0.11
hiveserver
hive0.13.1 orc兼容性问题fix
线上使用cdh4.6.0和hive0.13.1,在
hive0.11
之后开始支持orcfile,hive0.13.1使用的是pb2.5.0,cdh4.6.0是用的2.4.0a,线上测试orcfile,建表正常
菜菜光
·
2015-01-04 22:32
protobuf
hive0.13
orcfile
hive0.13.1 orc兼容性问题fix
线上使用cdh4.6.0和hive0.13.1,在
hive0.11
之后开始支持orcfile,hive0.13.1使用的是pb2.5.0,cdh4.6.0是用的2.4.0a,线上测试orcfile,建表正常
菜菜光
·
2015-01-04 22:32
protobuf
orcfile
hive0.13
hive
hive0.13.1 orc兼容性问题fix
线上使用cdh4.6.0和hive0.13.1,在
hive0.11
之后开始支持orcfile,hive0.13.1使用的是pb2.5.0,cdh4.6.0是用的2.4.0a,线上测试orcfile,建表正常
菜菜光
·
2015-01-04 22:32
protobuf
hive0.13
orcfile
hive学习总结(2)—Hive几种导出数据方式
source_pathtarget_path 2.导出到本地文件系统 --不能使用insertintolocaldirectory来导出数据,会报错--只能使用insertoverwritelocaldirectory来导出数据 --
hive0.11
vieky
·
2014-12-02 16:00
hive学习总结(2)—Hive几种导出数据方式
hadoopfs–cpsource_pathtarget_path2.导出到本地文件系统--不能使用insertintolocaldirectory来导出数据,会报错--只能使用insertoverwritelocaldirectory来导出数据--
hive0.11
nucheima
·
2014-11-20 15:51
Hive
hive cli 启动缓慢问题
hive-0.13.1启动缓慢的原因发现时间主要消耗在下面3个地方:1.hadoopjar的时候要把相关的jar包上传到hdfs中(这里大概消耗5s,
hive0.11
一样,这个地方不太好优化)2.在每次
manburen01
·
2014-09-01 18:00
hive
hive0.13 cli启动缓慢问题
cli的启动时间由5s增加为10s,影响了部分etljob的运行时间,经过debug,发现时间主要消耗在下面3个地方:1.hadoopjar的时候要把相关的jar包上传到hdfs中(这里大概消耗5s,
hive0.11
菜菜光
·
2014-08-18 21:06
hive0.13
启动慢
hive0.13 cli启动缓慢问题
cli的启动时间由5s增加为10s,影响了部分etljob的运行时间,经过debug,发现时间主要消耗在下面3个地方:1.hadoopjar的时候要把相关的jar包上传到hdfs中(这里大概消耗5s,
hive0.11
菜菜光
·
2014-08-18 21:06
hive0.13
启动慢
hive
HIVE RegexSerDe使用详解
在
hive0.11
中,自带了两个RegexSerDe类:org.apache.hadoop.hive.contrib.serde2.RegexSerDe;org.apache.hadoop
仲渊
·
2014-08-08 11:21
数据平台
hive
hadoop
Hive0.11
查询结果保存到文件并指定列之间的分隔符
在Hive0.11.0版本新引进了一个新的特性,也就是当用户将Hive查询结果输出到文件,用户可以指定列的分割符,而在之前的版本是不能指定列之间的分隔符,这样给我们带来了很大的不变,在Hive0.11.0之前版本我们一般是这样用的:1hive>insertoverwritelocaldirectory'/home/wyp/Documents/result'2hive>select*fromtest
libing13810124573
·
2014-08-02 15:00
hive0.13 rows loaded为空问题源码分析及fix
rowsloaded的信息在
hive0.11
中由HiveHistory类的printRowCount输出。HiveHistory类的主要用途是记录job运行的信息,包括task的counter等。
菜菜光
·
2014-07-24 00:40
rows
hive0.13
loaded
hive0.13 rows loaded为空问题源码分析及fix
rowsloaded的信息在
hive0.11
中由HiveHistory类的printRowCount输出。HiveHistory类的主要用途是记录job运行的信息,包括task的counter等。
菜菜光
·
2014-07-24 00:40
hive0.13
rows
loaded
hive
hive0.13用户自建表无权限bug fix
1.首先在
hive0.11
中和hive0.13中分别做建表测试,通过查看数据库中的元数据,发现在
hive0.11
中如果设
菜菜光
·
2014-07-19 09:42
权限
bug
hive0.13
hive
hive0.13用户自建表无权限bug fix
1.首先在
hive0.11
中和hive0.13中分别做建表测试,通过查看数据库中的元数据,发现在
hive0.11
中如果设
菜菜光
·
2014-07-19 09:14
权限
bug
hive0.13
Hive语言手册之五:ORC文件格式
一、关于ORC文件格式(ORC从
Hive0.11
开始引入)ORC(OptimizedRowColumnar)格式可以高效地存储Hive数据,被设计用来规避其他文件格式存在的缺陷,使用ORC文件格式可以提升
guoxy_nb
·
2014-04-24 21:30
大数据
Hive
上一页
1
2
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他