E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hive安装和配置
Hive
优化-SQL调优
Hive
优化-SQL调优此博客参考了其他博客:
hive
sqlhttps://www.cnblogs.com/fnlingnzb-learner/p/13087976.html后续还会继续更新和优化优化的根本思想
ShyGlow
·
2023-12-27 18:20
大数据
#
Hive
hive
大数据
Hive
在工作中的调优总结
总结了一下在以往工作中,对于
Hive
SQL调优的一些实际应用,是日常积累的一些优化技巧,如有出入,欢迎在评论区留言探讨~一、EXPLAIN查看执行计划二、建表优化2.1分区分区表基本操作,partitioned
fx67ll
·
2023-12-27 18:50
大数据开发文档
hive
大数据
hadoop
大数据之
hive
_
hive
的企业级调优
简单调优:1.测试数据可以本地模式运行2.select字段时禁止使用*还可以加上where进行行列过滤3.selectfromajoinb时避免直接join,因为会产生笛卡尔积,建议加上on进行过滤,减少数据量4.使用groupbyname进行count(name)聚合,比count(distinctname)聚合效率更高5.count(1)>count(*)>count(字段)6.可以适当减少或
普罗米修斯之火
·
2023-12-27 18:50
hive
大数据
Hive
之企业级调优实战
1:Fetch抓取Fetch抓取是指,==
Hive
中对某些情况的查询可以不必使用MapReduce计算例如:select*fromscore;在这种情况下,
Hive
可以简单地读取employee对应的存储目录下的文件
不要迷恋发哥
·
2023-12-27 18:50
Hive
大数据
hive
数据仓库
【
Hive
_05】企业调优1(资源配置、explain、join优化)
1、计算资源配置1.1Yarn资源配置1.2MapReduce资源配置2、Explain查看执行计划(重点)2.1Explain执行计划概述2.2基本语法2.3案例实操3、分组聚合优化3.1优化说明(1)map-side聚合相关的参数3.2优化案例4、join优化4.1Join算法概述(1)CommonJoin(2)MapJoin(3)BucketMapJoin(4)SortMergeBucket
温欣2030
·
2023-12-27 18:49
#
【Hive】
【大数据】
hive
hadoop
数据仓库
Hive
学习——企业级调优
目录一、计算资源调优(一)Yarn资源配置——集群1.Yarn配置说明(1)yarn.nodemanager.resource.memory-mb(2)yarn.nodemanager.resource.cpu-vcores(3)yarn.scheduler.maximum-allocation-mb(4)yarn.scheduler.minimum-allocation-mb(二)MapRedu
雷神乐乐
·
2023-12-27 18:49
#
Hive
学习
大数据
java
hive
【
hive
】
hive
的调优经验
一、
hive
自己进行优化对union这样的命令进行了优化二、数据本地化率hdfs数据本地化率对
hive
性能产生影响在数据大小一定的情况下,500个128M的文件和2个30G的文件跑
hive
任务,性能是有差异的
kiraraLou
·
2023-12-27 18:49
hive
hive
hadoop
big
data
ubuntu 16安装git出错
ubuntu16安装git:出现:在终端中敲入以下两句sudorm/var/cache/apt/arc
hive
s/locksudorm/var/lib/dpkg/lock如果不行,多试验几次就ok
lsp_addf
·
2023-12-27 18:37
Flink实时电商数仓之Doris框架(七)
主要实现的功能有:实时看板面向企业内部分析师和管理者的报表面向用户或者客户的高并发报表分析即席查询统一数仓构建:替换了原来由Spark,
Hive
,Kudu,Hbase等旧框架数据湖联邦查询:通过外表的方式联邦分析位于
十七✧ᐦ̤
·
2023-12-27 16:47
flink
大数据
doris
centos7使用shell脚本安装mysql8.0
脚本配置文件my.cnf:数据库配置文件mysql-8.0.19-1.el7.x86_64.rpm-bundle.tar:数据库安装包,下载方式:https://downloads.mysql.com/arc
hive
s
西瓜是小鱼
·
2023-12-27 15:55
数据库
shell
HBase基础知识(六):HBase 对接
Hive
1.HBase与
Hive
的对比1.
Hive
(1)数据仓库
Hive
的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。
依晴无旧
·
2023-12-27 14:49
大数据
hbase
hive
数据库
Windows 下 PyTorch 入门深度学习环境安装与配置 GPU 版
2.下载安装Anaconda(建议安装迅雷下载,同时浏览器添加扩展“迅雷Chrome支持”)https://www.anaconda.com/https://repo.anaconda.com/arc
hive
HLJ洛神千羽
·
2023-12-27 14:39
软件配置问题
深度学习
windows
pytorch
Y9000P + ubuntu22.04深度学习环境的搭建:英伟达驱动+CUDA11.8+cuDNN8.60+ TensorRT8.5.3.1的配置过程
当然也可以采用命令安装或者到NVIDIA官网下载手动安装驱动装好后在终端执行:nvidia-smi如果出现如下图则安装成功二.CUDA的安装CUDAToolkitArc
hive
|NVIDIADeveloper
LSG_Dawn
·
2023-12-27 14:57
深度学习
人工智能
linux
hive
复合数据类型array
createtabletemp.array_test(namestring,active_datestring,active_numarray)partitionedby(dtstring)storedasorc;createtabletemp.actvice_array_test(namestring,active_datestring,active_numarray)partitionedby
解脱了
·
2023-12-27 12:00
Spark生产集群各种使用
1.环境配置1.1版本说明要求版本是否必须其他事项Hadoop3.3.4是hadoop3.3.0之后原生支持国内主要对象存储
Hive
3.1.3否实测没有
Hive
也可以使用sparksql,使用
hive
更好的管理
tuoluzhe8521
·
2023-12-27 10:15
hive相关
spark
大数据
分布式
七牛云存储
datax 同步mongodb数据库到
hive
(hdfs)和elasticserch(es)
(有点老了,后来发现flinkcdc都只能监控一张表,多张表无法监控)2.datax版本:自己编译的DataX-datax_v2022103.hdfs版本:3.1.34.
hive
版本:3.1.2二、同步思路
tuoluzhe8521
·
2023-12-27 10:14
数据同步
mongodb
hive
数据库
json
hadoop
黑猴子的家:
Hive
运行日志信息配置
Hive
的log默认存放在/tmp/victor/
hive
.log目录下(当前用户名下)1、创建
hive
-log4j.properties修改
hive
-log4j.properties.template
黑猴子的家
·
2023-12-27 09:00
Web期末复习知识点
1、掌握tomcat服务器的
安装和配置
参数下载Tomcat:前往ApacheTomcat官方网站(https://tomcat.apache.org)下载适合您操作系统的Tomcat版本。
青春pig头少年
·
2023-12-27 09:53
Web
前端
web
[转载] Oracle:start with...connect by子句的用法
转自:http://www.blogjava.net/xzclog/arc
hive
/2010/03/05/314642.htmlconnectby是结构化查询中用到的,其基本语法是:select…fromtablenamestartwith
重庆八怪
·
2023-12-27 08:44
【WSL2】
安装和配置
ubuntu
文章目录1.安装WSL22.安装ubuntu2.1.通过MicrosoftStore2.1.通过命令行3.ubuntu的使用3.1.创建管理员root账户3.2.换源3.3.安装图形化界面1.安装WSL2在控制面板-程序-程序与功能中点击启用或关闭Windows功能,选择虚拟机平台适用于Linux的Windows子系统在命令提示符中输入以下命令安装WSL2:>wsl--update正在安装:适用于
盛世隐者
·
2023-12-27 08:09
Linux
ubuntu
wsl
R语言和Rstudio下载 以及 R 包安装
R语言和Rstudio下载TheComprehensiveRArc
hive
Network(r-project.org)进入官网下载与电脑相符的R语言比如我的电脑是Windowsx64,下载的是:DownloadR
伏尔加河的卷毛
·
2023-12-27 08:58
r语言
开发语言
删除azkaban的执行历史
azkaban通常用在大数据任务调度场景,把任务提交之后,如果任务是spark,
hive
,hadoop,flink等任务的话,
飞有飞言
·
2023-12-27 07:09
Hadoop-Hbase集群搭建
1.下载http://arc
hive
.cloudera.com/cdh5/cdh/5/hbase-1.2.0-cdh5.7.0.tar.gz2.解压#解压到指定的文件夹tarxzvfhbase-1.2.0
GuangHui
·
2023-12-27 07:17
[spark] 存储到hdfs时指定分区
在SparkSQL中指定多个分区字段进行数据存储:类似
hive
分区存储文章目录代码示例代码importorg.apache.spark.sql.SparkSessionvalspark=SparkSession.builder
言之。
·
2023-12-27 06:33
spark
hdfs
大数据
hive
中如何判断字符串是否是数字
1.通过nvl函数实现判断字符串是否是数字SELECTnvl('1.x'+0,null)isnotnull;falseSELECTnvl('1'+0,null)isnotnull;true2.通过正则匹配判断select'123456'rlike'^\d+$';true;select'123456a'rlike'^\d+$';false;
不爱吃鱼的馋猫
·
2023-12-27 06:05
hive
hive
posexplode炸裂函数
withtmpas(select'A/B'asa,'1/3'asbunionallselect'B/C/D'asa,'4/5/2'asb)selecta,b,cc,cc2from(selecta,b,pos,cc,pos2,cc2fromtmplateralviewposexplode(split(a,'/'))t2aspos,cclateralviewposexplode(split(b,'/'
不爱吃鱼的馋猫
·
2023-12-27 06:05
hive
hadoop
数据仓库
hive
学习笔记
一、
Hive
基本概念1.1
hive
是什么
hive
是基于hadoop的一个数仓分析工具,
hive
可以将hdfs上存储的结构化的数据,映射成一张表,然后让用户写HQL(类SQL)来分析数据telupdown138383843813451567138383843953451567138383844012411657713838384413453157571383838434353551567567
不爱吃鱼的馋猫
·
2023-12-27 06:05
hive
大数据
hadoop
hive
中metastore服务、
hive
server2服务、
hive
客户端、beeline客户端连接元数据的方式
1.前言
hive
是Hadoop的客户端,启动
hive
前必须启动hadoop,同时
hive
的元数据存储在mysql中,是由于
hive
自带的derby数据库不支持多客户端访问。
不爱吃鱼的馋猫
·
2023-12-27 06:35
hive
一文秒懂
Hive
的两个组件
Hive
server2和Metastore server访问元数据的关系?及Cli命令行和beeline的关系
Hive
不是数据库,不是数据库,不是数据库!
不爱吃鱼的馋猫
·
2023-12-27 06:34
hive
数据库
大数据
java
mysql
KMeans算法实现《逍遥游》的聚类分词,python
KMeans算法介绍:https://www.cnblogs.com/zhahuhu/arc
hive
/2019/10/26/11745484.htmlConditions:1、熟悉python基础语法和数据结构
吾系司机
·
2023-12-27 06:16
【大数据HA】HAProxy实现thrift协议HMS服务的高可用-附Chatgpt协助截图
背景之前安装了HMS(
Hive
metastoreservice),独立于
hive
运行,安装部署过程见我下面列出的另一篇文章,需要为它建立HA高可用功能。防止在访问时出现单点故障问题。
秦拿希
·
2023-12-27 05:08
hive
大数据
metastore
HMS
HAProxy
android transformDexArc
hive
WithExternalLibsDexMergerForDebug 问题的解决
transformDexArc
hive
WithExternalLibsDexMergerForDebug问题的解决方法,很好用(感谢作者提供)
泡泡之意境
·
2023-12-27 03:14
Hexo博客如何添加404公益页面
_config.ymlvimBlog/themes/maupassant_config.yml编辑效果如下menu:-page:homedirectory:.icon:fa-home-page:arc
hive
directory
种地的pele
·
2023-12-27 03:36
内网离线搭建之----kafka集群
zookeeper:http://arc
hive
.apache.org/dist/zookeeper/zookeeper-3.4.13/zookeeper-3.4.13.tar.gzkafka
落世繁华
·
2023-12-27 01:02
kafka
分布式
zookeeper
linux
集群
基于python对葡萄酒质量的预测(浅学)
首先,通过网址https://arc
hive
.ics.uci.edu/ml/datasets/Wine+Quality下载数据集winequality-red.csv,winequality-white.csv
自柰
·
2023-12-27 00:26
python
开发语言
python红酒数据提取与分析
importpandasaspdimportmatplotlib.pyplotasplt#读取红酒数据集url="https://arc
hive
.ics.uci.edu/ml/machine-learning-databases
li0210
·
2023-12-27 00:25
python
开发语言
第524封信|致柏舒柏弘
本周主题:Unit23Lesson1HereistheBee
hive
童言童语:柏舒:最近变得有点黏人了,考虑周边课程给他安排一下。有时候我要上课根本顾不上他,他一个人自言自语可以说半天话。
端老师
·
2023-12-26 23:14
DM、
HIVE
和Kingbase8(人大金仓数据库)给列增加备注
DM数据库给列增加备注1、创建表CREATETABLEtest222(idintNOTNULLPRIMARYKEY,namevarchar(1000)DEFAULTNULL,emailvarchar(1000)DEFAULTNULL,phonevarchar(1000)DEFAULTNULL)2、给列添加注释commentoncolumnTEST222.NAMEis'这是一个列注释';例如:com
宁儿测开进阶
·
2023-12-26 23:36
数据库
3分钟快速安装 ClickHouse、配置服务、设置密码和远程登录以及修改数据目录
下面是一个完整的ClickHouse
安装和配置
流程,包括安装ClickHouse、配置服务、设置密码和远程登录以及修改数据目录。
ascarl2010
·
2023-12-26 22:15
clickhouse
clickhouse
ZooKeeper Client API 安装及使用指北
下载wgethttps://arc
hive
.apache.org/dist/zookeeper/zookeeper-3.5.4-beta/zookeeper-3.5.4-beta.tar.gz解压tar-zxfzookeeper
gongyuandaye
·
2023-12-26 22:27
Linux服务器编程
zookeeper
linux
笔记
服务器
hive
下库里有表数据,删不了库的解决办法
hive
下库里有表数据,删不了库的解决办法报错:FAILED:ExecutionError,returncode1fromorg.apache.hadoop.
hive
.ql.exec.DDLTask.InvalidOperationException
北凉-徐凤年
·
2023-12-26 20:07
日常工作遇到的问题
hive
【Spark-HDFS小文件合并】使用 Spark 实现 HDFS 小文件合并
3、core-site.xml、hdfs-site.xml、
hive
-site.xml、yarn-site.xmlx等文件
bmyyyyyy
·
2023-12-26 17:15
Spark
spark
hdfs
大数据
#HDFS小文件合并
oracle instantclient basic +pl/sql
安装和配置
C#实现不安装Oracle客户端访问远程服务器数据2011-05-2615:40:57|分类:Oracle|字号订阅概述:C#通过使用ADO的方式在未安装Oracle数据库的前提下,客户端程序远程访问服务器,会出现:“System.Data.OracleClient需要Oracle客户端软件8.1.7或更高版本”问题,本文讲述如何通过简单方式快速实现免安装客户访问Oracle数据库,以解决当前问题
高明
·
2023-12-26 17:41
datasophon组件安装时踩坑记录
identifiedby'xxxx';1.安装hdfs后有一个namenode进程未启动解决:在那个未启动的节点上执行hdfsnamenode-bootstrapStandby之后在web页面重启hdfs2.
hive
onspark
州周
·
2023-12-26 17:56
hadoop
hdfs
大数据
window系统maven官方下载安装包maven安装配置
Maven–DownloadApacheMaven##历史版本下载位置##maven历史版本下载Indexof/dist/maven/maven-3##下载二进制包不建议升到太高版本与idea有不兼容,会报错3.9.0版本https://arc
hive
.apache.org
蚰蜒螟
·
2023-12-26 16:11
maven
java
【
Hive
】——函数案例
1
Hive
多字节分隔符处理1.1默认规则
Hive
默认序列化类是LazySimpleSerDe,其只支持使用单字节分隔符(char)来加载文本数据,例如逗号、制表符、空格等等,默认的分隔符为”\001”。
那时的样子_
·
2023-12-26 15:40
hive
hadoop
数据仓库
V、
Hive
-DML
1、load数据LOADDATA[LOCAL]INPATH'filepath'[OVERWRITE]INTOTABLEtablename[PARTITION(partcol1=val1,partcol2=val2...)]加载emp数据LOADDATALOCALINPATH'/opt/module/input/emp.txt'INTOTABLEemp;加载dept数据LOADDATALOCALIN
一种依耐丶从未离开
·
2023-12-26 13:57
[
hive
] sql中distinct的用法和注意事项
在
Hive
SQL中,DISTINCT用于去重查询结果中的行。它返回唯一的行,消除结果集中的重复项。
言之。
·
2023-12-26 13:09
hive
sql
hadoop
Hive
01_安装部署
Hive
的安装上传安装包解压tarzxvfapache-
hive
-3.1.2-bin.tar.gzmvapache-
hive
-3.1.2-bin
hive
解决
Hive
与Hadoop之间guava版本差异cd
程序喵猴
·
2023-12-26 12:47
hive
hive
Maven依赖管理项目构建工具
文章目录Maven依赖管理项目构建工具目录一、Maven简介1.Maven介绍2.Maven主要作用理解3.Maven软件工作原理模型图(了解)二、Maven
安装和配置
1.Maven安装2.Maven环境配置
丁总学Java
·
2023-12-26 12:27
Maven
maven
intellij-idea
java
上一页
40
41
42
43
44
45
46
47
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他