E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hive:ORC
Ubuntu 20.04 安装docker报错
sudoapt-keyadv--keyserverkeyserver.ubuntu.com--recv-keys7EA0A9C3F273FCD8chmoda+r/usr/share/keyrings/docker-arc
hive
-keyring.gpg
柯九思kk
·
2023-12-28 13:31
ubuntu
docker
容器
探究Presto SQL引擎(1)-巧用Antlr
从Hadoop生态的
Hive
,Spark,Presto,Kylin,Druid到非Hadoop生态的Clic
vivo互联网技术
·
2023-12-28 12:14
Hive
详解、配置、数据结构、
Hive
CLI
一、
Hive
认识1.
Hive
应用问题:公司的经营状况?
Byyyi耀
·
2023-12-28 12:37
hive
笔记
hadoop
【C#】程序以单例形式运行
33896726/article/details/89587575【2】WPF的单实例这里有设置显示和前端显示的方法:【3】https://www.cnblogs.com/Charles2008/arc
hive
一叶清风扬
·
2023-12-28 12:04
C#
WPF
Hadoop安装笔记_单机/伪分布式配置_Hadoop3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
将下发的ds_db01.sql数据库文件放置mysql中12、编写Scala代码,使用Spark将MySQL的ds_db01库中表user_info的全量数据抽取到
Hive
的ods库中表user_info
Stitch .
·
2023-12-28 12:32
我的大学笔记
Hadoop
分布式
大数据
hadoop
笔记
hadoop
hive
spark flink 安装
下载地址Indexof/distubuntu安装hadoop集群准备IP地址主机名称192.168.1.21node1192.168.1.22node2192.168.1.23node3上传hadoop-3.3.5.tar.gz、jdk-8u391-linux-x64.tar.gzJDK环境node1、node2、node3三个节点解压tar-zxvfjdk-8u391-linux-x64.tar
nsa65223
·
2023-12-28 11:59
hadoop
hive
spark
Hive
DDL语法
Hive
的语法和MySQL大部分都相同一、数据库操作1.1、创建数据库CREATEDATABASE[IFNOTEXISTS]databasename[COMMENTdatabase_comment][LOCATIONhdfspath
有人看我吗
·
2023-12-28 11:28
大数据
hive
hadoop
数据仓库
hql、数据仓库、sql调优、
hive
sql、python
SQL/HQLHQL(HibernateQueryLanguage)是面向对象的查询语言SQL的操作对象是数据列、表等数据库数据;而HQL操作的是类、实例、属性#FROMStringhql="fromcom.demo.bean.User"="select*fromuser"#WHERE"formUseruwhereu.id=1"="select*formuserwhereid=1"#查询出一个St
许一世流年 绝不嵩手 cium
·
2023-12-28 11:46
数据仓库
sql
hive
Hive
实战:统计总分与平均分
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据文件1、在虚拟机上创建文本文件2、将文本文件上传到HDFS指定目录(二)实现步骤1、启动
Hive
Metastore服务2、启动
Hive
客户端3、
howard2005
·
2023-12-28 10:16
数仓技术Hive入门
hive
总分
平均分
了解Anaconda Navigator 2.5.1
Indexof/anaconda/arc
hive
/|清华大学开源软件镜像站|TsinghuaOpenSour
Q1780020
·
2023-12-28 09:45
python
conda
AI编程
数据分析
Spark从入门到精通23:Spark SQL简介
我们知道
Hive
是Hadoop生态中的一个数据分析引擎,它可以将
Hive
SQL转换成MapReduce任务提交到Hadoop集群中执行,大大简化了编写MapReduce程序的
金字塔下的小蜗牛
·
2023-12-28 09:20
JavaScript获取DOM元素位置和尺寸大小
--摘自《博客园》博主:谦行,原文链接:http://www.cnblogs.com/dolphinX/arc
hive
/2012/11/19/2777756.html在一些复杂的页面中经常会用JavaScript
亦花茶
·
2023-12-28 08:31
常用资料
Servlet之间的几个跳转方法(转载整理)
原文地址:http://www.cnblogs.com/clara/arc
hive
/2011/07/21/2112732.html1.Forword转向(forward)是通过RequestDispatcher
oQianQu
·
2023-12-28 07:22
Java
web
Java - Lambda 表达式
个人博客:转载自:https://erzbir.com/arc
hive
s/java—lambdabiao-expressionLambda语法:使用lambda表达式的一般语法是:(Parameters
Erzbir
·
2023-12-28 03:37
学习记录
java
idea中java单元测试报错
1.报错内容Errorrunning'
Hive
Test.loadData':Commandlineistoolong.Shortencommandlinefor
Hive
Test.loadDataoralsoforJUnitdefaultconfiguration
sunweiking
·
2023-12-28 03:59
intellij-idea
java
ide
sqoop运行报错
Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/commons/lang/StringUtilsatorg.apache.sqoop.tool.BaseSqoopTool.validate
Hive
Options
sunweiking
·
2023-12-28 03:29
hadoop
sqoop
hadoop
hive
Hive
Hive
概述由于MapReduce开发难度大,学习成本高,Hdfs文件没有字段名、没有数据类型,不方便进行数据的有效管理。因此使用MapReduce框架开发,项目周期长,成本高。
之古
·
2023-12-28 02:58
Hadoop集成对象存储和HDFS磁盘文件存储
1.环境配置1.1版本说明组件版本是否必须其他事项Hadoop3.3.0+是hadoop3.3.0之后原生支持国内主要对象存储
Hive
3.1.3否实测没有
Hive
也可以使用sparksql,使用
hive
tuoluzhe8521
·
2023-12-28 02:38
Hadoop
hadoop
hdfs
大数据
阿里云
Hadoop集群找不到native-hadoop
1.问题描述========
hive
运行中的问题,需要把把native复制进去/usr/lib2023-02-1519:59:42,165WARNscheduler.TaskSetManager:Losttask11.0instage1.0
tuoluzhe8521
·
2023-12-28 02:38
Hadoop
hadoop
大数据
分布式
EMR集群迁移自建Hadoop(元数据及HDFS数据)
EMR版本:3.1.2自建Hadoop版本:3.1.32.集群迁移步骤2.1数据迁移nohuphadoopdistcp-i-phdfs://emrhdf存储地址/usr/
hive
/warehouse/*
tuoluzhe8521
·
2023-12-28 02:37
Hadoop
hadoop
hdfs
大数据
大数据开发之Sqoop详细介绍
用户可以在Sqoop的帮助下,轻松地把关系型数据库的数据导入到Hadoop与其相关的系统(如HBase和
Hive
)中;同时也可以把数据从Hadoop系统里抽取并导出到关系型数据库里。
lcz-2000
·
2023-12-27 23:31
大数据
sqoop
hadoop
Hive
部署
一、介绍Apache
Hive
是一个分布式、容错的数据仓库系统,支持大规模的分析。
有人看我吗
·
2023-12-27 23:54
hive
hadoop
数据仓库
Hive
实战:词频统计
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据文件1、在虚拟机上创建文本文件2、将文本文件上传到HDFS指定目录(二)实现步骤1、启动
Hive
Metastore服务2、启动
Hive
客户端3、
howard2005
·
2023-12-27 23:24
数仓技术Hive入门
hive
hadoop
spark开发笔记(三、Spark SQL笔记)
基本概念Shark、SparkSQL和
Hive
之间的关系:Shark借用了
Hive
大部分的组件,包括词法分析、语法分析和逻辑分析阶段,只是在最后将逻辑执行计划转化为物理执行计划这一步,将底层的实现从MapReduce
眼君
·
2023-12-27 22:27
HarmonyOS共享包HAR
共享包概述OpenHarmony提供了两种共享包,HAR(HarmonyArc
hive
)静态共享包,和HSP(HarmonySharedPackage)动态共享包。
阿玮编程_
·
2023-12-27 21:41
harmonyos
华为
鸿蒙系统
大数据-
Hive
练习-环比增长率、同比增长率、复合增长率
目录12.1环比增长率1.概述2.公式3.示例4.练习-需求:计算各类商品的月环比增长率12.2同比增长率1.概述2.公式3.示例4.练习-需求:计算各类商品的月同比增长率12.3复合增长率1.概述2.公式3.示例4.练习-需求:计算各类商品的月同比增长率练习数据表--创建销量表sales_monthly--product表示产品名称,ym表示年月,amount表示销售金额(元)CREATETAB
王哪跑nn
·
2023-12-27 21:08
大数据
大数据
hive
hadoop
大数据库分析
ElasticSearch和impala首先,对于两个数据库作出说明,有
hive
查询比较慢,hbase会针对于列的查询不太友好,所以CDH推出了impala搜索引擎,都是基于HDFS的。
靈08_1024
·
2023-12-27 19:00
Impala 基于
hive
的交互式实时分析工具(一) 概念及原理介绍
技术背景impala是参照谷歌的新三篇论文(caffeine-网络搜索引擎,pregel-图形数据库,dremel-瞬时类sql查询)当中的dremel而来,号称是当前大数据领域最快的sql查询工具,比sparksql还要快速。但是sparksql是计算效率和数据安全的性价比最优的。谷歌旧三篇论文(GFS-分布式文件存储,Bigtable-分布式数据库,Mapreduce-分布式计算)设计目的为了
章云邰
·
2023-12-27 19:59
hive
总结06_企业级调优
去重统计笛卡尔积行列过滤动态分区调整分桶分区数据倾斜合理设置Map数小文件进行合并复杂文件增加Map数合理设置Reduce数并行执行严格模式JVM重用推测执行压缩执行计划(Explain)Fetch抓取Fetch抓取是指,
Hive
自由地带
·
2023-12-27 18:21
hive
hive
优化
Hive
执行计划 & 性能调优
一、执行计划explain,查看基本信息explaindependency,查看依赖信息explainauthorization,查看权限信息1.explain用法--explain+执行语句例如:explainselects2.s_id,avg(s2.s_score)asavg_scorefromedu.studentsjoinedu.scores2ons.s_id=s2.s_idwheres.
巷子里的猫X
·
2023-12-27 18:51
数据分析
hive
java
mysql
【
Hive
】性能调优 - Map JOIN
Hive
版本:
hive
-3.1.3map-sideJOIN和MapJOIN的区别map-sideJOIN就是预聚合,在map阶段先聚合一下,这样数据到了reduce有可能就不倾斜了MapJOIN就是缓存小表
青云游子
·
2023-12-27 18:21
Hive
hive
大数据
hadoop
大数据篇--
Hive
调优
文章目录一、表设计层面1.关闭动态分区:2.开启分桶:3.采用合适的存储格式:二、参数调优1.严格模式:2.FetchTask功能:3.reduce个数控制:4.mapjoin:5.skewjoin方案:6.groupby导致的数据倾斜:7.调整切片数(Map任务数):8.本地模式:三、语法层面调优1.orderby和sortby:2.clusterby和distributeby:3.执行计划Ex
小强签名设计
·
2023-12-27 18:20
大数据面试
hive
调优
Hive
优化-SQL调优
Hive
优化-SQL调优此博客参考了其他博客:
hive
sqlhttps://www.cnblogs.com/fnlingnzb-learner/p/13087976.html后续还会继续更新和优化优化的根本思想
ShyGlow
·
2023-12-27 18:20
大数据
#
Hive
hive
大数据
Hive
在工作中的调优总结
总结了一下在以往工作中,对于
Hive
SQL调优的一些实际应用,是日常积累的一些优化技巧,如有出入,欢迎在评论区留言探讨~一、EXPLAIN查看执行计划二、建表优化2.1分区分区表基本操作,partitioned
fx67ll
·
2023-12-27 18:50
大数据开发文档
hive
大数据
hadoop
大数据之
hive
_
hive
的企业级调优
简单调优:1.测试数据可以本地模式运行2.select字段时禁止使用*还可以加上where进行行列过滤3.selectfromajoinb时避免直接join,因为会产生笛卡尔积,建议加上on进行过滤,减少数据量4.使用groupbyname进行count(name)聚合,比count(distinctname)聚合效率更高5.count(1)>count(*)>count(字段)6.可以适当减少或
普罗米修斯之火
·
2023-12-27 18:50
hive
大数据
Hive
之企业级调优实战
1:Fetch抓取Fetch抓取是指,==
Hive
中对某些情况的查询可以不必使用MapReduce计算例如:select*fromscore;在这种情况下,
Hive
可以简单地读取employee对应的存储目录下的文件
不要迷恋发哥
·
2023-12-27 18:50
Hive
大数据
hive
数据仓库
【
Hive
_05】企业调优1(资源配置、explain、join优化)
1、计算资源配置1.1Yarn资源配置1.2MapReduce资源配置2、Explain查看执行计划(重点)2.1Explain执行计划概述2.2基本语法2.3案例实操3、分组聚合优化3.1优化说明(1)map-side聚合相关的参数3.2优化案例4、join优化4.1Join算法概述(1)CommonJoin(2)MapJoin(3)BucketMapJoin(4)SortMergeBucket
温欣2030
·
2023-12-27 18:49
#
【Hive】
【大数据】
hive
hadoop
数据仓库
Hive
学习——企业级调优
目录一、计算资源调优(一)Yarn资源配置——集群1.Yarn配置说明(1)yarn.nodemanager.resource.memory-mb(2)yarn.nodemanager.resource.cpu-vcores(3)yarn.scheduler.maximum-allocation-mb(4)yarn.scheduler.minimum-allocation-mb(二)MapRedu
雷神乐乐
·
2023-12-27 18:49
#
Hive
学习
大数据
java
hive
【
hive
】
hive
的调优经验
一、
hive
自己进行优化对union这样的命令进行了优化二、数据本地化率hdfs数据本地化率对
hive
性能产生影响在数据大小一定的情况下,500个128M的文件和2个30G的文件跑
hive
任务,性能是有差异的
kiraraLou
·
2023-12-27 18:49
hive
hive
hadoop
big
data
ubuntu 16安装git出错
ubuntu16安装git:出现:在终端中敲入以下两句sudorm/var/cache/apt/arc
hive
s/locksudorm/var/lib/dpkg/lock如果不行,多试验几次就ok
lsp_addf
·
2023-12-27 18:37
Flink实时电商数仓之Doris框架(七)
主要实现的功能有:实时看板面向企业内部分析师和管理者的报表面向用户或者客户的高并发报表分析即席查询统一数仓构建:替换了原来由Spark,
Hive
,Kudu,Hbase等旧框架数据湖联邦查询:通过外表的方式联邦分析位于
十七✧ᐦ̤
·
2023-12-27 16:47
flink
大数据
doris
centos7使用shell脚本安装mysql8.0
脚本配置文件my.cnf:数据库配置文件mysql-8.0.19-1.el7.x86_64.rpm-bundle.tar:数据库安装包,下载方式:https://downloads.mysql.com/arc
hive
s
西瓜是小鱼
·
2023-12-27 15:55
数据库
shell
HBase基础知识(六):HBase 对接
Hive
1.HBase与
Hive
的对比1.
Hive
(1)数据仓库
Hive
的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。
依晴无旧
·
2023-12-27 14:49
大数据
hbase
hive
数据库
Windows 下 PyTorch 入门深度学习环境安装与配置 GPU 版
2.下载安装Anaconda(建议安装迅雷下载,同时浏览器添加扩展“迅雷Chrome支持”)https://www.anaconda.com/https://repo.anaconda.com/arc
hive
HLJ洛神千羽
·
2023-12-27 14:39
软件配置问题
深度学习
windows
pytorch
Y9000P + ubuntu22.04深度学习环境的搭建:英伟达驱动+CUDA11.8+cuDNN8.60+ TensorRT8.5.3.1的配置过程
当然也可以采用命令安装或者到NVIDIA官网下载手动安装驱动装好后在终端执行:nvidia-smi如果出现如下图则安装成功二.CUDA的安装CUDAToolkitArc
hive
|NVIDIADeveloper
LSG_Dawn
·
2023-12-27 14:57
深度学习
人工智能
linux
hive
复合数据类型array
createtabletemp.array_test(namestring,active_datestring,active_numarray)partitionedby(dtstring)storedasorc;createtabletemp.actvice_array_test(namestring,active_datestring,active_numarray)partitionedby
解脱了
·
2023-12-27 12:00
Spark生产集群各种使用
1.环境配置1.1版本说明要求版本是否必须其他事项Hadoop3.3.4是hadoop3.3.0之后原生支持国内主要对象存储
Hive
3.1.3否实测没有
Hive
也可以使用sparksql,使用
hive
更好的管理
tuoluzhe8521
·
2023-12-27 10:15
hive相关
spark
大数据
分布式
七牛云存储
datax 同步mongodb数据库到
hive
(hdfs)和elasticserch(es)
(有点老了,后来发现flinkcdc都只能监控一张表,多张表无法监控)2.datax版本:自己编译的DataX-datax_v2022103.hdfs版本:3.1.34.
hive
版本:3.1.2二、同步思路
tuoluzhe8521
·
2023-12-27 10:14
数据同步
mongodb
hive
数据库
json
hadoop
黑猴子的家:
Hive
运行日志信息配置
Hive
的log默认存放在/tmp/victor/
hive
.log目录下(当前用户名下)1、创建
hive
-log4j.properties修改
hive
-log4j.properties.template
黑猴子的家
·
2023-12-27 09:00
[转载] Oracle:start with...connect by子句的用法
转自:http://www.blogjava.net/xzclog/arc
hive
/2010/03/05/314642.htmlconnectby是结构化查询中用到的,其基本语法是:select…fromtablenamestartwith
重庆八怪
·
2023-12-27 08:44
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他