E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HiveQL
一个数据仓库时代开始--Hive
它提供了一种类SQL的查询语言
HiveQL
(HiveQueryL
隐峯
·
2023-03-28 17:37
CDH5.13.x文档翻译SQL Differences Between Impala and Hive
https://www.cloudera.com/documentation/enterprise/5-13-x/topics/impala_langref_unsupported.html#langref_
hiveql
_deltaImpala
gregocean
·
2023-03-24 07:10
Spark入门之六:SparkSQL实战
SchemaRDD可以通过RDD、Parquet文件、JSON文件、或者通过使用
hiveql
查询hive数据来建立。
铁猴
·
2023-03-23 22:05
Spark
Spark入门简单学
SparkSQL
hiveContext
sqlContext
Spark SQL之:概述及操作应用
RDD转换为DataFrame四、SparkSQL和数据库的应用一、SparkSQL概述了解Shark(1)从shark说起 shark即HiveOnSpark,为了实现与Hive的兼容,Shark在
HiveQL
落落free
·
2023-03-15 08:47
大数据阶段
#
Spark
spark
集群
Day 1314:架构师训练营作业(w12)
分析如下
HiveQL
,生成的MapReduce执行程序,map函数输入是什么?输出是什么,reduce函数输入是什么?输出是什么?
kafkaliu
·
2023-02-17 16:16
Kyuubi 解锁 Spark SQL on CDH 6
Spark3.0的重磅发布,在性能方面又迎来了一次飞跃,本文将描述把Spark3集成到CDH6.3.1(未开启Kerberos)的过程,并使用Kyuubi替换HiveServer2,实现OLAP、ETL等场景下从
HiveQL
517001e7cb6e
·
2023-01-28 19:10
hive.groupby.skewindata=true注意点
和SQL一样,
HiveQL
中同样支持DISTINCT操作,如下示例:(1)SELECTcount(DISTINCTuid)FROMlog(2)SELECTip,count(DISTINCTuid)FROMlogGROUPBYip
清风686
·
2023-01-28 04:51
Hive/
HiveQL
常用优化方法全面总结
目录列裁剪和分区裁剪谓词下推sortby代替orderbygroupby代替distinctgroupby配置调整map端预聚合倾斜均衡配置项join基础优化buildtable(小表)前置多表join时key相同利用mapjoin特性分桶表mapjoin倾斜均衡配置项优化SQL处理join数据倾斜空值或无意义值单独处理倾斜key不同数据类型buildtable过大MapReduce优化调整map
首席撩妹指导官
·
2022-12-23 10:07
大数据
大数据
hive
数据库
Hive/
HiveQL
常用优化方法全面总结(上篇)
对Hive的调优既包含对
HiveQL
语句本身的优化,也包含Hive配置项和MR方面的调整。由于在写的过程中发现篇幅过长,因此决定拆成上下两篇发布。上篇包含从开头到join优化的内容。
liu_weiliang10405
·
2022-12-23 10:06
大数据
hive
大数据
Spark DataFrame和Dataset简介
Spark程序无缝混合,允许您使用SQL或DataFrameAPI对结构化数据进行查询;支持多种开发语言;支持多达上百种的外部数据源,包括Hive,Avro,Parquet,ORC,JSON和JDBC等;支持
HiveQL
Cynicism_Kevin
·
2022-12-18 19:41
spark
大数据
hive
Hive实现词频统计(详细讲解)
Hive中提供了类似于SQL语言的查询语言——
HiveQL
,可以通过
HiveQL
语句快速实现简单的MapReduce统计,Hive自身可以将
HiveQL
语句快速转换成MapReduce任务进行运行,
青春是首不老歌丶
·
2022-12-16 00:42
hive
hadoop
hdfs
Hive的安装与配置——第2关:Hive Shell入门基础命令
相关知识HiveShell运行在Hadoop集群环境上,是Hive提供的命令行接口(CLI),在Hive提示符输入
HiveQL
命令,HiveShell把HQL查询转换为一系列MapReduce作业对任务进行并行处理
真题OK撒
·
2022-12-12 09:48
hadoop
hive
hadoop
大数据
spark基本架构及原理
其他Spark的库都是构建在RDD和SparkCore之上的SparkSQL:提供通过ApacheHive的SQL变体Hive查询语言(
HiveQL
)与Spark进行交互的API。
一只哈士奇
·
2022-12-09 09:55
Spark
大数据
大数据开发之Hive篇3-Hive数据定义语言
2.1.1文章目录一.Hive关系模型概述1.1.Database1.2Table1.2.1管理表和外部表1.2.2永久表和临时表1.3Partition1.4Bucket二.数据定义语言(DDL)2.1
HiveQL
只是甲
·
2022-11-29 16:23
大数据和数据仓库
#
Hive
hive
大数据
DDL
分区表
外部表
Spark 操作 Hive
包含Hive支持的SparkSQL可以支持Hive表访问、UDF(用户自定义函数)以及Hive查询语言(
HiveQL
/HQL)等。需要强调的一点是,如果要在SparkSQL中包含Hive的
Alienware^
·
2022-11-20 10:45
#
Spark
hive
spark
big
data
Hive调优策略之架构优化
对Hive的调优既包含对
HiveQL
语句本身的优化,也包含Hive配置项和MR方面的调整。1、执行引擎Hive支持多种执行引擎,分别是MapReduce、Tez、Spark、Flink。可以
悠然予夏
·
2022-10-18 10:37
Hadoop生态圈技术
hive
hadoop
大数据
10 Hive调优策略
对Hive的调优既包含对
HiveQL
语句本身的优化,也包含Hive配置项和MR方面的调整。从以下三个方面展开:架构优化参数优化SQL优化10.1架构优化执行引擎Hive支持多
微毂
·
2022-10-18 10:36
hive
大数据
hive
大数据
Spark3.x入门到精通-阶段四(SparkSql详解&java&scala实战)
Spark程序无缝混合,允许您使用SQL或DataFrameAPI对结构化数据进行查询;支持多种开发语言;支持多达上百种的外部数据源,包括Hive,Avro,Parquet,ORC,JSON和JDBC等;支持
HiveQL
顶尖高手养成计划
·
2022-08-18 20:44
spark
大数据
【HQL】
HiveQL
库和表的创建、修改、删除
今天继续学习
HiveQL
。
HiveQL
和MySQL接近,但也有差异。它不支持行级插入操作、更新操作、删除操作,不支持事务。关注公众号回复803获取《Hive编程指南》pdf。
和风与影
·
2022-07-29 19:22
Hive
大数据
hive
如何通俗地理解Hive的工作原理?
HiveQL
可以将结构化的数据文件映射为一张数据表,允许熟悉SQL的用户查询数据,也允许熟悉MapReduce的开发者开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作
Blue92120
·
2022-06-09 19:38
python
开发语言
Hadoop(四)C#连接Hive
HiveHive将
HiveQL
(类sql语言)转为MapReduce,完成数据的查询与分析,减少了编写MapReduce的复杂度。
chester·chen
·
2022-05-04 09:00
HiveQL
进阶之以柔克刚 - 将简单语法运用到极致
前言初衷如何高效地使用
HiveQL
,将
HiveQL
运用到极致。
·
2022-05-01 14:25
hive大数据sql
开发一个不需要重写成Hive QL的大数据SQL引擎
摘要:开发一款能支持标准数据库SQL的大数据仓库引擎,让那些在Oracle上运行良好的SQL可以直接运行在Hadoop上,而不需要重写成
HiveQL
。
华为云开发者社区
·
2022-04-29 11:00
Hive 简介
自然具有相同优点)2.Hive与传统数仓传统数仓:既是数据存储产品又是数据处理分析产品(同时支持数据的存储与处理分析)Hive:本身并不支持数据的存储与处理分析(一个面向用户的编程接口,提供一种编程语言,通过该语言
HiveQL
Doooooing
·
2022-04-24 15:10
学习笔记
python用户画像_python用户画像
在本案例的开发工作中,基于spark计算引擎,主要涉及的语言包括
hiveql
、python、scala、shell等。1.
weixin_39843151
·
2022-04-07 07:44
python用户画像
Hive全解
文章目录一.Hive基本介绍1.基本名词解释2.hive概述3.hive可以做什么以及适用场景a不适合:b适合:4.hive特点5.hive安装与配置二.
Hiveql
与Hive基础指令1.基础指令2.join
Sunny_god
·
2022-02-23 12:28
Hive
大数据之hive安装和配置
hive正是实现了这个,hive是要类SQL语句(
HiveQL
)来实现对hadoop下的数据管理MySQL安装官网下载mysql-server(yum安装)wgethttp://dev.mysql.co
ohoy
·
2022-02-05 12:23
大数据
大数据
Spark综合学习笔记(二十二)SparkSQL实战4-花式查询
Spark5QL模块中,将结构化数据封装到DataFrame或Dataset集合中后,提供了两种方式分析处理数据:1、SQL编程,将DataFrame/Dataset注册为临时视图或表,编写SQL语句,类似
HiveQL
斯特凡今天也很帅
·
2021-11-29 14:21
大数据
spark
scala
spark
big
data
scala
SparkSQL数据源之Hive数据库
包含Hive支持的SparkSQL可以支持Hive表访问、UDF(用户自定义函数)以及Hive查询语言(
HiveQL
/HQL)等。
大数据小同学
·
2021-06-09 08:06
一定要弄懂的Hive基础知识
Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–
HiveQL
,可通过HQL语句实现简单的MR统计,Hive
丨程序之道丨
·
2021-06-06 04:50
HiveQL
数据定义:数据库创建和删除
CREATEDATABASE语句CREATEDATABASE|SCHEMA[IFNOTEXISTS]IFNOTEXISTS是一个可选子句,通知用户已经存在相同名称的数据库。可以使用SCHEMA在DATABASE的这个命令。下面的查询执行创建一个名为userdb数据库:hive>CREATEDATABASE[IFNOTEXISTS]userdb;或hive>CREATESCHEMAuserdb;下面
无敌的肉包
·
2021-05-01 15:47
hive学习笔记之七:内置函数
blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶
HiveQL
·
2021-03-30 11:43
云计算
hive学习笔记之六:
HiveQL
基础
blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶
HiveQL
·
2021-03-25 11:52
云计算
hive学习笔记之五:分桶
blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶
HiveQL
·
2021-03-24 15:56
云计算
hive学习笔记之四:分区表
blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶
HiveQL
·
2021-03-23 13:15
云计算
hive学习笔记之三:内部表和外部表
blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶
HiveQL
·
2021-03-22 14:29
云计算
Hive-常见调优方式 && 两个面试sql
对Hive的调优既包含对
HiveQL
语句本身的优化,也包含Hive配置项和MR方面的调整。从以下三个方面展开:架构优化参数优化SQL优化1.架构方面执行引擎方面针对公司内平台的资源,选择更合
·
2021-03-19 22:13
大数据
hive学习笔记之二:复杂数据类型
blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶
HiveQL
·
2021-03-11 19:48
云计算
hive学习笔记之一:基本数据类型
blog_demos内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶
HiveQL
·
2021-03-10 21:52
云计算
hive中groupby优化_HiveSQL常用优化方法全面总结
对Hive的调优既包含对
HiveQL
语句本身的优化,也包含Hive配置项和MR方面的调整。列裁剪和分区裁剪最基本的操作。所谓列裁剪就是在查询时只读取需要的列,分区裁剪就是只读取需要的分区。
周天无极
·
2020-12-31 05:16
hive中groupby优化
hive中groupby优化_HiveSQL常用优化方法
对Hive的调优既包含对
HiveQL
语句本身的优化,也包含Hive配置项和MR方面的调整。列裁剪和分区裁剪最基本的操作。所谓列裁剪就是在查询时只读取需要的列,分区裁剪就是只读取需要的分区。
工业狂魔
·
2020-12-28 01:59
hive中groupby优化
Hive架构原理与实战——apache-hive-3.1.2+Mysql部署与配置
它提供SQL类型语言查询叫
HiveQL
或HQL。它是熟知,快速,可扩展和可扩展的。Hive架构下面的组件图描绘了
codenow.fun
·
2020-09-23 23:30
大数据
Hive
HiveQL
之数据类型和存储格式
目录一、数据类型1、基本数据类型2、复杂类型二、存储格式(1)textfile(2)SequenceFile(3)RCFile(4)ORCFile(5)Parquet三、数据格式正文回到顶部一、数据类型1、基本数据类型Hive支持关系型数据中大多数基本数据类型类型描述示例booleantrue/falseTRUEtinyint1字节的有符号整数-128~1271Ysmallint2个字节的有符号整
*MuYu*
·
2020-09-16 23:54
HIVE
大数据知识点—spark概念,核心架构,运行流程
其他Spark的库都是构建在RDD和SparkCore之上的SparkSQL提供通过ApacheHive的SQL变体Hive查询语言(
HiveQL
)
BAO7988
·
2020-09-16 10:45
大数据
大数据
spark
HIVE使用指南
HIveQL
的使用知识点框架如导图,先看知识导图再详细深入知识点,会对HQL的使用和理解有帮助。一、执行HIVE查询#用法hive-f/home/test
Just Jump
·
2020-09-16 05:38
hive使用
hive使用
Hive基本操作,使用API通过JDBC连接访问
1.Hive基本操作:建库、建表、查询Hive提供了一个被称为Hive查询语言(简称
HiveQL
或是HQL)的SQL方言,其语法基本与MySql一致,比较容易上手,因为大多数的开发工程师对MySql很熟悉
xiaoyaGrace
·
2020-09-16 04:19
Nifi Processor | PutHiveQL
传入的FlowFile的内容应该是要执行的
HiveQL
命令。
HiveQL
命令可能会使用?逃避参数。
野狼e族
·
2020-09-16 03:50
Nifi
大数据
HiveQL
迁移至Spark SQL入门示例(PySpark版)
目录一、示例
HiveQL
二、迁移至Pyspark三、Linux执行命令四、查看报错的方式五、执行脚本时遇到【XXXnotfound】报错的处理方式(配置hive-site.xml)六、其他希望读者了解到的面向群体
蓝天之猪
·
2020-09-15 16:39
大数据
Spark
Hive
Pyspark
Hive-2.
HiveQL
查询中常用函数
1.SELECT....FROM语句1、创建表CREATEEXTERNALTABLEemployees(IDSTRING,nameSTRING,AGEINT,BIRTHDAYDATE,subordinatesARRAY,scoreMAP,addressSTRUCT)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t'COLLECTIONITEMSTERMINATEDBY
福利2020
·
2020-09-14 23:43
分布式数据计算技术
数仓应用工具Hive:从底层设计窥见其优化策略
Hive可以自动将
HiveQL
语句转换成一系列成MapReduce作业并执行,二不再需要程序员手动编写MR任务(SQL如何转化为MapRed
qingdsj
·
2020-09-14 21:09
大数据
人工智能
互联网
hive
大数据
大数据开发
大数据分析
大数据学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他