E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HiveOnSpark
Spark3每个job之间任务间隔过长
Spark3比CDH的
hiveonspark
2.4.0要快不少。AQE和CBO真的挺强的。但是使用中发现了一个很奇怪的事情。这个问题在网上搜过,并没有实际解决。
黑眼圈@~@
·
2023-03-30 02:28
Spark
hive
hadoop
大数据
spark
Hive on Spark配置
1.版本兼容
HiveonSpark
仅使用特定版本的Spark进行测试,因此只能确保给定版本的Hive与特定版本的Spark一起使用。其他版本的Spark可能与给定版本的Hive一起使用,但这不能保证。
fantasticMao
·
2023-03-19 16:14
Spark SQL之:概述及操作应用
概述及操作应用一、SparkSQL概述二、DataFrame三、RDD转换为DataFrame四、SparkSQL和数据库的应用一、SparkSQL概述了解Shark(1)从shark说起 shark即
HiveOnSpark
落落free
·
2023-03-15 08:47
大数据阶段
#
Spark
spark
集群
【离线数仓-5-数据仓库环境准备】
离线数仓-5-数据仓库环境准备离线数仓-5-数据仓库环境准备1.数据仓库运行环境1.Hive环境搭建1.Hive引擎2.
HiveonSpark
配置2.Yarn环境配置2.数据仓库开发环境3.模拟数据准备离线数仓
Apache Minor Trend
·
2023-02-24 18:28
数据仓库
大数据
数据治理
数据仓库
大数据
【Hive任务优化】—— Map、Reduce数量调整
https://blog.csdn.net/u013332124/article/details/97373278以下的内容都是基于
hiveonspark
来讲解的,不过大部分概念都是互通的,也可以应用到
疯狂的哈丘
·
2023-01-26 02:33
离线数仓07—— 数据仓库设计
数据仓库构建流程5.2.1数据调研5.2.2明确数据域5.2.3构建业务总线矩阵5.2.4明确统计指标5.2.5维度模型设计5.2.6汇总模型设计上一篇:离线数仓06——数据仓库建模概述下一篇:离线数仓08——配置
HiveonSpark
就是这个范~
·
2022-12-31 16:38
离线数仓
数据仓库
Hive配置Spark计算引擎,速度快!
1.2
HiveonSpark
配置1)兼容性说明注
子清.
·
2022-12-29 13:39
#
Hive
大数据
spark
hive
SparkSQL-----各种方式加载DataFrame
HiveonSpark
:Hive即作为存储又负责sql的解析优化
计算机界的小学生
·
2022-12-18 19:16
spark
spark
大数据
big
data
Spark on Hive & Hive on Spark,傻傻分不清楚
上车前需知Sparkonhive与
HiveonSpark
的区别SparkonhiveSpark通过Spark-SQL使用hive语句,操作hive,底层运行的还是sparkrdd。
王知无(import_bigdata)
·
2022-11-20 10:42
大数据成神之路
hive
spark
big
data
spark on hive 和 hive on spark
就是通过saprksql,加载hive配置文件,获取hive的元数据信息sparksql获取到hive的元数据信息之后就可以拿到hive的所有表的数据接下来就可以通过sparksql来操作hive表中的数据
hiveonspark
qq_42915325
·
2022-11-20 10:11
SparkSQL基础
JSON文件获取数据;组件扩展:SQL语法解析器、分析器、优化器均可重新定义;性能优化:内存列存储、动态字节码生成等优化技术,内存缓存数据;多语言支持:Scala、Java、Python;Shark即
HiveonSpark
Ta-ttoo
·
2022-11-01 10:14
spark
Spark SQL与Hive on Spark的比较
简要介绍了SparkSQL与
HiveonSpark
的区别与联系一、关于Spark简介在Hadoop的整个生态系统中,Spark和MapReduce在同一个层级,即主要解决分布式计算框架的问题。
weixin_42073629
·
2022-11-01 10:14
Spark
Hive
hive on spark 配置 和 spark on hive
HiveonSpark
配置1)兼容性说明注意:官网下载
GOD_WAR
·
2022-09-21 13:10
hive
spark
spark
hive
【hive on spark】hive on spark任务报错Connection to remote Spark driver was lost
记一次
hiveonspark
任务运行过程中报错ConnectiontoremoteSparkdriverwaslost报错信息如下:org.apache.hive.service.cli.HiveSQLException
骑蜗牛追大象
·
2022-09-21 13:10
笔记
hive
spark
hadoop
Hive 上配置 Hive on Spark
Hive的安装配置见:Hive安装配置在Hive上配置
HiveonSpark
安装在服务器ns1上安装,此服务器之前已经安装好Hive;下载解压官网地址:http://spark.apache.org/downloads.html
开发老张
·
2022-09-21 13:10
HADOOP
Hive
hive
spark
大数据
hive
on
spark
hadoop
spark安装以及hive on spark和spark on hive 的配置
spark安装以及
hiveonspark
和sparkonhive的配置1.上传并解压安装包:tar-zxvfspark-3.2.1-bin-hadoop3.2-scala2.13.tgz-C/export
独孤雨鸿
·
2022-09-21 13:38
spark
hive
hadoop
hive报错 spark_hive on spark 错误解决
Hiveonspark
错误解决1.环境Hive2.0.0Hadoop-2.6.3Spark-1.5Scala2.10.42.步骤2.1.将spark进行编译打包:.
weixin_39637723
·
2022-09-21 13:07
hive报错
spark
Hive on Spark配置
2.
HiveonSpark
配置1)兼容性说明注意:
曾牛
·
2022-09-21 13:35
hive
spark
hive
Hive On Spark搭建报错:Failed to create Spark client for Spark session xx: ..TimeoutException
错误描述按照官方文档,搭建
HiveOnSpark
时,出现以下错误。
桥路丶
·
2022-09-07 20:46
问题解决
大数据
CDH开启sentry后hive on spark报错: Failed to create Spark client for Spark session
cdh开启sentry之后,
hiveonspark
报错,网上的方法试了一遍都没有解决我的问题,经过一番摸索,最终解决。
qiangzi_lg
·
2022-09-07 20:44
大数据
hive
spark
大数据
记录
hiveonspark
:Execution Error, return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask
问题描述:在部署
hiveonspark
,测试时报错,执行建表操作成功,但是插入insert出现以下错误:Failedtoexecutesparktask,withexception‘org.apache.hadoop.hive.ql.metadata.HiveException
FunnyPrince_
·
2022-09-07 20:58
#
Hadoop
#
数据仓库
issue
hive
spark
数仓4.0笔记——数仓环境搭建——Hive on Spark
1Hive环境搭建---
HiveonSpark
配置注意:官网下载的Hive3.1.2和Spark3.0.0默认是不兼容的。
丝丝呀
·
2022-08-13 18:47
hive
spark
大数据
【尚硅谷】电商数仓V4.0丨大数据数据仓库项目实战【学习记录】第一节
1.为什么用
hiveonspark
来处理数据?2.什么是零点漂移问题,怎么解决?3.事实表有哪几类?4.维度建模的四个过程?5.hive在装载dim后,会出现为null值的一行,为什么?
在学习的王哈哈
·
2022-08-05 14:31
大数据项目
大数据
Hive 整合 Spark 全教程 (Hive on Spark)
文章目录Hive引擎简介环境配置(ssh已经搭好)JDK准备Hadoop准备部署配置集群配置历史服务器配置日志的聚集启动集群LZO压缩配置Hadoop3.x端口号总结MySQL准备Hive准备Spark准备
HiveonSpark
Alienware^
·
2022-07-11 13:38
Bigdata技术
大数据
hadoop
hive
spark
详解Hive on Spark配置
HiveonSpark
配置Hive引擎默认的是MapReduce,就是没执行一个Hive语句,其实都是运行了一个MR程序,都知道的,MR虽好,但是慢呢。
牧码文
·
2022-07-11 13:38
Spark
hive
hive
spark
解决Hive on Spark与Spark on Hive之间表数据不互通问题
解决
HiveonSpark
与SparkonHive之间表数据不互通问题问题描述通过Ambari2.7.5安装HDP3.1.5集群后,spark-sql和hive虽然已经实现了整合,无论在hive还是spark-sql
勇远有李
·
2022-07-11 13:07
Hive
hive
spark
big
data
漫谈大数据 - Spark on Hive & Hive on Spark
目录Sparkonhive与
HiveonSpark
的区别Hive查询流程及原理Hive将SQL转成MapReduce执行速度慢
HiveOnSpark
优化Hive元数据库的功能Hive开启MetaStore
昊昊该干饭了
·
2022-07-11 13:06
大数据
mysql
sql
hive
spark
HIVE 生成过多小文件的问题
生成大量小文件小文件的危害为什么会生成多个小文件不同的数据加载方式生成文件的区别解决小文件过多的问题今天运维人员突然发来了告警,有一张表生成的小文件太多,很疑惑,然后排查记录了下HIVE的版本2.x,使用的引擎是MR;注意:
HIVEONSPARK
半吊子Kyle
·
2022-07-11 13:34
Hive
hive
Spark15:Spark SQL:DataFrame常见算子操作、DataFrame的sql操作、RDD转换为DataFrame、load和save操作、SaveMode、内置函数
一、SparkSQLSparkSQL和我们之前讲Hive的时候说的
hiveonspark
是不一样的。
hiveonspark
是表示把底层的mapreduce引擎替换为spark引擎。
SRE菜鸟的成长之路
·
2022-06-16 01:21
spark
spark
sql
hive
hive 和 spark的爱恨情仇恩怨交织
最近在面试一些应聘大数据岗位的技术小伙伴时,发现不少朋友对业界所谓的
hiveonspark
和sparkonhive分不太清楚;同时在日常工作中,也因为对这两个技术术语的理解不太一致,影响了进一步的技术交流
明哥的IT随笔
·
2022-05-28 07:53
数据仓库
大数据
java
编程语言
hive
大数据Hadoop之——Spark on Hive 和 Hive on Spark的区别与实现
一、SparkonHive和
HiveonSpark
的区别1)SparkonHiveSparkonHive是Hive只作为存储角色,Spark负责sql解析优化,执行。
大数据老司机
·
2022-04-30 08:44
SparkSql概念总结
SparkSql目录SparkSql1、SparkonHive和
HiveonSpark
2、DataFrame和DataSet3、SparkSql底层架构4、什么是谓词下推?
每日小新
·
2022-03-02 07:14
Java+大数据之旅
spark
Spark之没什么卵用笔记1之Spark SQL背景
SparkSQL的前身是Shark,又叫"
HiveOnSpark
"。Shark通过将hiveSQL转换成RDD的代码,运行在Spark上。
没什么卵用的杂鱼
·
2022-02-18 12:07
Spark综合学习笔记(二十七)SparkSQL整合Hive-1 SparkSQL命令行
p=64)
HiveOnSpark
和SparkOnHive·
HiveOnSpark
:SparkSql诞生之前的Shark项目使用的,是把Hive的执行引擎换成Spark,剩下的使用Hive的,严重依赖Hi
斯特凡今天也很帅
·
2021-11-30 17:58
spark
HIVE
大数据
spark
big
data
hive
hive on spark参数调整
HiveonSpark
是指使用Spark替代传统MapReduce作为Hive的执行引擎,在HIVE-7292提出。
·
2021-11-02 11:44
hivespark大数据
Apache hive 3.1.2从单机到高可用部署 HiveServer2高可用 Metastore高可用 hive on spark hiveserver2 web UI 高可用集群启动脚本
后面配置
hiveonspark
可以使用spark2.3.0。而spark2.3.0对应的hadoop版本是2.x。重新编译,参考本人写的另一篇文章hive3.1.4
薛定谔的猫不吃猫粮
·
2021-05-21 16:59
Hive
hive
大数据
hadoop
spark
hive on spark 参数设置
hiveonspark
相关参数设置#设置计算引擎sethive.execution.engine=spark;#设置spark提交模式setspark.master=yarn-cluster;#设置作业提交队列
上官沐雪
·
2021-05-08 14:43
spark
大数据
hive
大数据开发之Hive篇20-Hive的高级特性
备注:Hive版本2.1.1文章目录一.HiveACIDandTransactions二.HiveonTez三.
HiveonSpark
四.HCatalog参考这个blog介绍Hive的高级特性1)HiveACIDandTransactions2
只是甲
·
2021-01-18 09:57
大数据和数据仓库
#
Hive
tez
hive
on
spark
hcatalog
hive事务
大数据
hive on spark参数配置
hiveonSpark
参数:setspark.master=yarn-cluster;#设置spark提交模式sethive.execution.engine=spark;#设置计算引擎setspark.yarn.queue
weiha666
·
2020-09-14 11:23
hive
hive
Hive on Spark参数调优姿势小结
前言
HiveonSpark
是指使用Spark替代传统MapReduce作为Hive的执行引擎,在HIVE-7292提出。
大数据星球-浪尖
·
2020-09-12 16:30
spark
大数据
hadoop
算法
hive
hive使用spark引擎的几种情况
使用spark引擎查询hive有以下几种方式:1>使用spark-sql(sparksqlcli)2>使用spark-thrift提交查询sql3>使用
hiveonspark
(即hive本身设置执行引擎为
weixin_30275415
·
2020-09-11 04:26
Spark on hive 与 Hive on spark 的区别
读了百度上的一些关于Sparkonhive与
HiveonSpark
的区别的文章,感觉理解太复杂,自己总结一下SparkonHive:数据源是:hiveSpark获取hive中的数据,然后进行SparkSQL
适合不合适
·
2020-09-11 03:49
大数据相关技术总结
Hive on Spark 与Spark SQL比较
HiveonSpark
与SparkSQL比较背景
HiveonSpark
是由Cloudera发起,由Intel、MapR等公司共同参与的开源项目,其目的是把Spark作为Hive的一个计算引擎,将Hive
吉阿
·
2020-09-10 23:14
Spark
Hive
Hive on Spark 运行于Yarn模式下如何调优
Hiveonspark
性能远比hiveonmr要好,而且提供了一样的功能。用户的sql无需修改就可以直接运行于
hiveonspark
。udf函数也是全部支持。
大数据技术架构
·
2020-08-24 16:29
升级CDH到5.7.0
Spark升级到1.6.0,支持
hiveonspark
各服务版本:ComponentPackageVersion
大数据部
·
2020-08-24 12:11
配置hive on spark后启动报错
因为hive底层用的执行引擎是MapReduce,所以导致了运行起来非常慢,所以我们要更换执行引擎,就有了
hiveonspark
,基于hive的基础上将执行引擎换成spark版本:hive3.1.2spark3.0.0
一过人_
·
2020-08-22 17:36
可能遇到的问题及解决方案
spark
hive
Hadoop版本升级(2.7.6 => 3.1.2)
自己的主机上的Hadoop版本是2.7.6,是测试用的伪分布式Hadoop,在前段时间部署了
HiveonSpark
,但由于没有做好功课,导致了Hive无法正常启动,原因在于Hive3.x版本不适配Hadoop2
aju1790
·
2020-08-21 13:25
SparkSQL基础
2、Shark即
HiveonSpark
,本质上是通过Hive的HQL解析,把HQL翻译成Spark上的RDD操作,然后通过Hive的metadata获取数据库里的表信息,实际HDFS上的数据
Z尽际
·
2020-08-21 12:04
spark2.3.0 without hive 编译
搭建
Hiveonspark
环境--Spark编译https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark:+Getting+Started
大罗北
·
2020-08-18 11:07
Hive
Spark
hadoop
【Spark篇】---SparkSQL on Hive的配置和使用
二、具体配置1、在Spark客户端配置
HiveOnSpark
在Spark客户端安装包下spark-1.6.0/conf中创建文件hive-site.xml:配置hive的metastore路径hive.metastore.uristhrift
L先生AI课堂
·
2020-08-18 10:06
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他