E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hive性能调优
大数据数据流分析和处理的工具pig,从入门到精通!
Pig的特点包括:面向过程的数据流语言:与
Hive
等其他大数据处理工具相比,Pig更注重数据处理的过程性,适用于
知识分享小能手
·
2024-01-27 09:05
学习心得体会
大数据
大数据
数据分析
数据库
Hive
实战 —— 电商数据分析(全流程详解 真实数据)
目录前言需求概述数据清洗数据分析一、前期准备二、项目1.数据准备和了解2.确定数据粒度和有效列3.HDFS创建用于上传数据的目录4.建库数仓分层5.建表5.1近源层建表5.2.明细层建表为什么要构建时间维度表?如何构建时间维度表?5.3轻聚层建表6.指标数据分析7.1计算每月总收入7.2计算每个季度的总收入7.3按年计算总收入7.4按工作日计算总收入7.5按时间段计算总收入7.6按时间段计算平均消
Byyyi耀
·
2024-01-27 08:25
hive
数据分析
hadoop
Hive
3.1.3基础
参考B站尚硅谷目录什么是
Hive
Hive
架构原理
Hive
安装
Hive
安装地址
Hive
安装部署安装
Hive
启动并使用
Hive
MySQL安装安装MySQL配置MySQL配置
Hive
元数据存储到MySQL配置元数据到
魅美
·
2024-01-27 08:55
hive
大数据
Hive
之set参数大全-15
指定
Hive
Server2使用的认证方式
hive
.server2.authentication是
Hive
中的一个参数,用于指定
Hive
Server2使用的认证方式。
OnePandas
·
2024-01-27 08:55
Hive
hive
数据仓库
Hive
之set参数大全-16
配置
Hive
Server2中TezWorkloadManager(WM)ApplicationMaster(AM)注册的超时时间在
Hive
中,
hive
.server2.tez.wm.am.registry.timeout
OnePandas
·
2024-01-27 08:55
Hive
hive
数据仓库
hive
- explode 用法以及练习
hive
explode的用法以及练习一行变多行explode例如:临时表temp_table,列名为1st1st1,2,34,5,6变为123456方式一:直接使用explodeselectexplode
Logan_addoil
·
2024-01-27 08:24
大数据学习之旅
hive
hadoop
数据仓库
Hive
之set参数大全-14
指定在复制过程中的最大负载任务数的近似值在
Hive
中,
hive
.repl.approx.max.load.tasks是一个配置参数,用于指定在复制过程中的最大负载任务数的近似值。
OnePandas
·
2024-01-27 08:23
Hive
hive
数据仓库
Flink问题解决及
性能调优
-【Flink根据不同场景状态后端使用调优】
Flink实时groupby聚合场景操作时,由于使用的是rocksdb状态后端,发现CPU的高负载卡在rocksdb的读写上,导致上游算子背压特别大。通过调优使用hashmap状态后端代替rocksdb状态后端,使吞吐量有了质的飞跃(20倍的性能提升),并分析整理。实例代码--SETtable.exec.state.ttl=86400s;--24hour,默认:0msSETtable.exec.s
PONY LEE
·
2024-01-27 08:21
Flink问题解决及性能调优
flink
大数据
cin c语言中文网,c++ cin>>详解
参考地址:http://www.cnblogs.com/A-Song/arc
hive
/2012/01/29/2331204.html程序的输入都建有一个缓冲区,即输入缓冲区。
盐选科普
·
2024-01-27 07:32
cin
c语言中文网
How to complete git branch management with command git checkout
http://www.cnblogs.com/hutaoer/arc
hive
/2013/05/07/git_checkout.html
qwfys200
·
2024-01-27 07:44
Version
git
checkout
branch
[ruby on rails] concerns的使用
module来实现的model中的concernmoduleVisibleextendActiveSupport::ConcernVALID_STATUSES=['public','private','arc
hive
d
微信-since81192
·
2024-01-27 07:39
ruby
on
rails
python
后端
1分钟了解基于Hadoop的数据仓库工具
Hive
(附超实用示例)
Hive
功能
Hive
是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL
yuyuyuyo
·
2024-01-27 05:53
linux apt-get 安装本地文件
只要把相应的包安装在服务器的/var/cache/apt/arc
hive
s文件夹下即可。然后sudoapt-getupdatesudoapt-getinstall
Desny
·
2024-01-27 04:54
linux
apt-get
install
Spark Thrift Server 架构和原理介绍
://blog.csdn.net/u013332124/article/details/90339850一、SparkThriftServer介绍SparkThriftServer是Spark社区基于
Hive
Server2
疯狂的哈丘
·
2024-01-27 04:17
combinatory categorial grammar 文章群
http://groups.inf.ed.ac.uk/ccg/publications.html转载于:https://www.cnblogs.com/cy163/arc
hive
/2010/07/26/
weixin_30563917
·
2024-01-27 02:25
hive
练习题(含面试题目)
1、学生表如下:自动编号学号姓名课程编号课程名称分数12005001张三0001数学6922005002李四0001数学8932005001张三0001数学69删除除了自动编号不同,其他都相同的学生冗余信息:deletetablenamewhere自动编号notin(selectmin(自动编号)fromtablenamegroupby学号,姓名,课程编号,课程名称,分数)2、一个叫team的表,
@Heartworm
·
2024-01-27 02:18
笔记
hive
面试
hadoop
Hive
调优策略
Hive
调优策略
Hive
作为大数据领域常用的数据仓库组件,在设计和开发阶段需要注意效率。
奋斗的蛐蛐
·
2024-01-26 23:24
服务器Ubuntu 22.04 64位安装 MySQL5.7
我们新建一个文件夹,路径/usr/local/mysql这里选择下载5.7.29的ubuntu版本注意是amd64不是arm64,或者执行下面命令wgethttps://downloads.mysql.com/arc
hive
s
于双瑜
·
2024-01-26 23:55
ubuntu
服务器
mysql
数据库
记录Ubuntu22.04安装Mysql5.7.42
一:mysql安装与下载本次安装的版本是5.7.42下载地址:MySQL::DownloadMySQLCommunityServer(Arc
hive
dVersions)1.选择对应的版本和系统,点击下载
tingyu_g
·
2024-01-26 23:21
adb
Ubuntu22.04执行sudo apt-get update时报错:sh: 1: /usr/lib/cnf-update-db: not found
报错如下,错误原因使用的sources-list配置和系统版本不匹配$sudoapt-getupdate获取:16http://us.arc
hive
.ubuntu.com/ubuntujammy-updates
FakeOccupational
·
2024-01-26 23:20
其他
ubuntu
MySQL技术探究(1)「索引技术」体验前所未有的技术探险,看穿索引的本质和技术体系(上篇)
数据库类型OLAP:联机分析处理----对海量历史数据进行分析,产生决策性的策略----数据仓库—
Hive
OLTP:联机事务处理----要求很短时效内返回对应的结果----数据库—关系型
洛神灬殇
·
2024-01-26 22:26
snprintf、strcpy、strncpy的用法
https://www.cnblogs.com/dongzhiquan/arc
hive
/2012/01/09/2317622.htmlstrcpy不安全strncpy也有安全隐患:一个典型的用法是:charbuf
一帘忧梦
·
2024-01-26 20:11
c语言
linux
Spark 2.3.4 StandAlone 集群模式部署
配置$SPARK_HOME/conf/spark-defaults.conf配置$SPARK_HOME/conf/slaves分发配置启动Spark验证Spark相关文档介质路径:https://arc
hive
.apache
JP.Hu
·
2024-01-26 19:07
Spark
spark
大数据
分布式
linux上使用jmeter压测
一、安装jmeter1.下载安装包地址:https://arc
hive
.apache.org/dist/jmeter/binaries/方法1:下载到本地后上传到远程linux服务器上传到服务器的命令,
sz891016
·
2024-01-26 18:54
测试
linux
jmeter
索引是越多越好吗?
理解索引的适当使用和潜在的代价是数据库设计和
性能调优
的关键部分。以下是索引数量的权衡:索引的优势:提高查询速度:索引可以显著提高数据检索的速度,尤其是在大型数据集上。
来自宇宙的曹先生
·
2024-01-26 18:03
数据库
索引
Hive
SQL:gouping sets
https://blog.csdn.net/MOUNINGA/article/details/99408470?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-6.baidujsUnder6&depth_1-utm_source=distribute.pc_r
木亦木木兮_0432
·
2024-01-26 17:14
搭建
Hive
3.x并整合MySQL8.x存储元数据
Hive
简介
Hive
官方文档:https://cwiki.apache.org/confluence/display/
Hive
Hive
产生的背景:在使用MapReduce进行编程的时候,会发现实现一个简单的功能例如
端碗吹水
·
2024-01-26 16:06
第三篇:跨平台QT开发<安装>
1:安装qt5.9教程主要注意qt的安装不管是文件路径还是,项目文件都不要出现空格官网:https://download.qt.io/new_arc
hive
/qt/5.9/下载自己想要的版本即可没有账户可以注册一个安装之后需要设置编译路径和添加
坑真多
·
2024-01-26 12:58
qt
开发语言
奇牛编程
QT5.9.6
oracle12c备份与恢复,Oracle Database12c Oracle RMAN备份与恢复(第4版)
OracleDatabase12c快速入门指南31.1预备步骤41.2为RMAN操作配置数据库41.2.1确定FRA的正确位置并创建FRA51.2.2登录到数据库并将其配置为使用FRA51.2.3将数据库置于ARC
HIVE
LOG
天帝君豪
·
2024-01-26 12:11
oracle12c备份与恢复
Hive
3.1.3基础学习
文章目录一、
Hive
入门与安装1、
Hive
入门1.1简介1.2
Hive
架构原理2、
Hive
安装2.1安装地址2.2
Hive
最小化安装(测试用)2.3MySQL安装2.4配置
Hive
元数据存储到MySQL2.5
Hive
魅Lemon
·
2024-01-26 10:36
大数据
hive
大数据之
Hive
:regexp_extract函数
目录一、正则的通配符简介1、正则表达式的符号及意义2、各种操作符的运算优先级:二、regexp_extract函数一、正则的通配符简介1、正则表达式的符号及意义符号含义实列/做为转意,即通常在"/"后面的字符不按原来意义解释如"*“匹配它前面元字符0次或多次,/a*/将匹配a,aa,aaa,加了”/"后,/a/*/将只匹配"a*".匹配任何一个字符^匹配一个输入或一行的开头/^a/匹配"anA",
浊酒南街
·
2024-01-26 10:28
大数据系列二
hive
hadoop
big
data
[软件安装]anaconda安装
建议下载网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/arc
hive
/打开终端,进入下载目录并解压安装包。
或许,这就是梦想吧!
·
2024-01-26 10:54
python
开发语言
Java操作
hive
报错:org.apache.thrift.transport.TTransportException: SASL authentication not
现象Java操作
hive
报错,关键的文本信息org.apache.thrift.transport.TTransportException:SASLauthenticationnotcomplete写的比较简单
欧阳方超
·
2024-01-26 10:57
开发遇到的小问题
hive
java
apache
centos6.8 php7 nginx,CentOS 8.x编译安装Nginx1.16.x+MySQL8.0.x+PHP7.4.x 7.3.x 7.2.x 7.1.x 7.0.x 5.6.x 5.5...
本文档最后更新于2020年4月7日前传:1、CentOS8.0.1905系统安装配置图解教程http://www.osyunwei.com/arc
hive
s/10256.html2、CentOS服务器初始化设置
weixin_39624367
·
2024-01-26 08:57
centos6.8
php7
nginx
oracle dg 搭建方式,dg搭建 全复制方式(一)
一.环境准备*数据库SID:orcl二.开始搭建(主库准备工作)1.确定主库处理归档模式(主库操作)SQL>arc
hive
loglist;如果不是的话:SQL>SHUTDOWNIMMEDIATE;SQL
Angie洛林
·
2024-01-26 08:56
oracle
dg
搭建方式
Hive
命令-权限篇
一、权限查询1、查询master用户拥有的权限showgrantusermaster;2、查询master用户对于库dw拥有的权限showgrantusermasterondatabasedw;二、赋权限给master用户赋dw库all的操作权限grantallondatabasedwtousermaster;三、服务器上切换登录用户sshnewUser@localhostsudosu-maste
BestFei
·
2024-01-26 08:45
Flink问题解决及
性能调优
-【Flink不同并行度引起sink2es报错问题】
最近需求,仅想提高sink2es的qps,所以仅调节了sink2es的并行度,但在调节不同算子并行度时遇到一些问题,找出问题的根本原因解决问题,并分析整理。实例代码--SETtable.exec.state.ttl=86400s;--24hour,默认:0msSETtable.exec.state.ttl=2592000s;--30days,默认:0msCREATETABLEkafka_table
PONY LEE
·
2024-01-26 08:12
Flink问题解决及性能调优
flink
大数据
【idea打包】idea打包项目了,虽然出现BUILD SUCCESS,但是jar是个无法启动的jar
的打包问题问题怎么解决解决后的样子运行成功的样子问题我执行打包命令后生成一个jar,但是在执行java-jar命令之后出现了一下的情况打开jar包里面的MANIFEST.MF里面是这样的Manifest-Version:1.0Arc
hive
r-Version
吃素的哈士奇
·
2024-01-26 07:54
intellij-idea
jar
java
Hive
ACID和事务表支持详解
在
Hive
0.13之前,
Hive
支持分区级别上原子性、一致性、持久性,隔离性可以通
疯狂的哈丘
·
2024-01-26 06:36
阿里云centos8安装mysql5.7.26
/s/1WDeMtFsrh7lNtQ53GXRv8Q提取码:kmcl官网下载地址:https://dev.mysql.com/downloads/mysql/5.7.html#downloadsArc
hive
s
风雨秋烟
·
2024-01-26 06:44
服务器
centos
flink1.13.0 环境搭建
https://blog.csdn.net/AinUser/article/details/120142220#1.standalone模式直接下载flink-1.13.0安装包https://arc
hive
.a
AinUser
·
2024-01-26 04:50
flink
hadoop
flink
yarn
k8s
standalone
HttpRunner(21):httprunner运行方式
/项目文件的路径locusts:基于Locust实现性能har2case:辅助工具,可将har格式(HTTPArc
hive
)转换为YAML或者
测试店小二
·
2024-01-26 04:24
测试用例
开发语言
服务器
httprunner
Linux 安装MySQL5.7.36(CentOS7为例)
MySQL5.7.35MySQL5.7.36MySQL5.7.37MySQL5.7.38[MySQL8.0(选择Windows或者Linux)](https://downloads.mysql.com/arc
hive
s
可爱的小张666
·
2024-01-26 03:54
mysql
Linux
等保
linux
mariadb
mysql
tar 命令基本用法
它的名称来自于“tapearc
hive
”(磁带存档),最初设计用于在磁带上创建备份。
xwhking
·
2024-01-26 03:50
linux
tar
压缩
PySparkSQL 入门(概述、DataFrame操作)
Spark的一个模块,用于处理海量结构化数据第一、针对结构化数据处理,属于Spark框架一个部分第二、抽象数据结构:DataFrameDataFrame=RDD+Schema信息;第三、分布式SQL引擎,类似
Hive
y鱼鱼
·
2024-01-26 02:10
大数据
大数据
spark
spark 学习_rdd常用操作
【sparkAPI函数讲解详细】https://www.iteblog.com/arc
hive
s/1399#reduceByKey[重要API接口,全面】http://spark.apache.org/
weixin_30852367
·
2024-01-26 02:40
5g
python
scala
[极客大挑战 2019]Secret File1
/Arc
hive
_room.php点secret直接跳到了end,抓包看看,找到了secr3t.php过滤了很少的关键词,提示flag在flag.php,过去发现还是看不到尝试用php伪协议读取flag.php
ғᴀɴᴛᴀsʏ
·
2024-01-26 01:15
web
使用CDH的api接口对cdh服务进行滚动重启
importtimeimportrequestsimportjsonimportsys#可操作的服务列表server_list=['hdfs','yarn','zookeeper','hbase','spark_on_yarn','
hive
Mumunu-
·
2024-01-26 01:32
大数据
python
Hbase伪分布式的安装和配置
二、具体配置步骤1、从官网下载,并解压到特定目录官网下载地址:http://arc
hive
.apa
lukeyan
·
2024-01-26 00:41
大数据|Spark介绍
前文回顾:
Hive
和数据仓库目录为什么会有SparkSpark的基本架构和组件主要体系结构和组件Spark集群的基本结构Spark系统的基本结构Spark应用程序的基本结构Spark程序运行机制⭐️Spark
啦啦右一
·
2024-01-25 21:08
大数据与数据分析
#
大数据管理与分析笔记
大数据
spark
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他