E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hive运行日志
3、电商数仓(数仓数据同步策略)
离线数仓同步数据数据通道用户行为数据由Flume从Kafka直接同步到HDFS,由于离线数仓采用
Hive
的分区表按天统计,所以目标路径要包含一层日期。具体数据流向如下图所示。
tianyi6_6
·
2023-12-18 14:46
数据仓库(电商)
大数据
linux
hadoop
kafka
分布式
Flink实时电商数仓(一)
常用的存储系统是Hadoop的HDFS文件系统,使用
Hive
进行数据计算,并将结果导入HDFS。离线数仓最明显的特点是T+1模式,今天只能算昨天的数据,时效性不够优秀。
十七✧ᐦ̤
·
2023-12-18 14:14
flink
大数据
基于hadoop下的spark安装
目录简介安装准备spark安装配置文件配置简介Spark主要⽤于⼤数据的并⾏计算,⽽Hadoop在企业主要⽤于⼤数据的存储(⽐如HDFS、
Hive
和HBase等),以及资源调度(Yarn)。
necessary653
·
2023-12-18 14:43
hadoop
spark
大数据
Hive
高级语法
--通过
hive
加载数据--创建数据表USEmy
hive
book;CREATETABLEIFNOTEXISTSstudent(idint,namestring)comment'学生表'rowFORMATdelimitedfieldsterminatedBY
xinxinyydss
·
2023-12-18 13:01
json
hive
hadoop
hdfs
大数据
2022秋招蚂蚁金服面试
一是
hive
sql用来取数;二是python、excel,用来数据可视化。4、sql问题4.1数据库底层知识:主键是什么?主键是
七天笔记本
·
2023-12-18 12:32
sql
面试
职场和发展
数据分析
树莓派禁用 Wi-Fi 和蓝牙
发布阅读量4.3k收藏10点赞数分类专栏:树莓派文章标签:树莓派wifi蓝牙禁用版权树莓派专栏收录该内容5篇文章0订阅订阅专栏树莓派禁用Wi-Fi和蓝牙本文地址:blog.lucien.ink/arc
hive
s
qq_20312079
·
2023-12-18 11:12
嵌入式硬件
最快的搜索引擎sphinx的windows安装和使用
1首先安装sphinx引擎下载地址:http://sphinxsearch.com/downloads/arc
hive
/下载下来的目录结构如下把sphinx.conf.in负责一份改名sphinx.conf
zhongchengbin
·
2023-12-18 11:12
【
Hive
_03】单行函数、聚合函数、窗口函数、自定义函数、炸裂函数
1、函数简介2、单行函数2.1算术运算函数2.2数值函数2.3字符串函数(1)substring截取字符串(2)replace替换(3)regexp_replace正则替换(4)regexp正则匹配(5)repeat重复字符串(6)split字符串切割(7)nvl替换null值(8)concat拼接字符串(9)concat_ws以指定分隔符拼接字符串或者字符串数组(10)get_json_obje
温欣2030
·
2023-12-18 11:30
【大数据】
hive
hadoop
数据仓库
HIve
窗口函数汇总整理全部带实例
文章目录窗口函数汇总一、开窗1.窗口名词解析2.over()开窗实例3.Rank函数二、其他常用函数总结(36个)1.查询当前时间戳2.将格式化的日期转化为时间戳3.将时间戳转为日期格式4.当前日期5.当前的日期加时间6.抽取格式化日期的日期部分7.获取年8.获取月9.获取日10.获取时11.获取分12.获取秒13.获取当前时间是一年中的第几周14.获取当前时间是一个月中的第几天15.获取两个日期
动若脱兔--
·
2023-12-18 11:59
hive
大数据
hadoop
sql
数据仓库
Hive
窗口函数详解
目录1、
hive
窗口函数2、在日常的开发中常用那些类型函数?3、了解哪些窗口函数,都是什么意思?
雾岛与鲸
·
2023-12-18 11:28
hive
hive
大数据
HIVE
窗口函数
什么是窗口函数
hive
中开窗函数通过over关键字声明;窗口函数,准确地说,函数在窗口中的应用;比如sum函数不仅可在groupby后聚合,在可在窗口中应用;
hive
中groupby算子和开窗over,
一个散步者的梦
·
2023-12-18 11:24
HIVE
hive
hadoop
数据仓库
开窗函数
Hive
的三种join
Hive
的三种joinMergejoinreduce阶段完成join。整个过程包括Map、Shuffle和Reduce三个阶段。
NLP_wendi
·
2023-12-18 11:24
数据研发
hive
回溯类题目总结
对于回溯法的理论描述这个就不赘述了,可以参考下面几个文章:https://www.cnblogs.com/steven_oyj/arc
hive
/2010/05/22/1741376.htmlhttps:
cheerss
·
2023-12-18 10:33
Freebayes用法简单介绍
本文转载自:http://www.bioinfo-scrounger.com/arc
hive
s/254Freebayes身为众多call变异软件中的一员,一直被使用到现在,肯定有其独到之处。
京古
·
2023-12-18 10:37
中国智慧VS西方智慧-看中国IT风云与IT产业怪状(转)
中国智慧VS西方智慧-看中国IT风云与IT产业怪状没久没见到这么帅的文章了~原文链接:http://blog.csdn.net/yincheng01/arc
hive
/2010/02/19/5312011
光辉岁月无声
·
2023-12-18 06:34
Hudi 在 vivo 湖仓一体的落地实践
一、Hudi基础能力及相关概念介绍1.1流批同源能力与
Hive
不同,Hudi数据在Spark/Flink写入后,下游可以继续使用Spark/Flink引擎以流读的形式实时读取数据。
vivo互联网技术
·
2023-12-18 03:15
数据湖
大数据计算与存储
效率提升
数据分析EPHS(9)-Excel实现一行转多行
今天我们来学习一个简单的功能,就是一行转多行,本文将介绍如何通过Excel实现,下一篇将介绍
Hive
中的实现方法。1、数据先来看看我们的数据,主要有2列,分别是班级和姓名。
文哥的学习日记
·
2023-12-18 02:05
Oracle RAC环境下redo log 文件的扩容
先来看下redolog的配置:SQL>select*fromv$log;GROUP#THREAD#SEQUENCE#BYTESBLOCKSIZEMEMBERSARC
HIVE
DSTATUSFIRST_CHANGE
dingdingfish
·
2023-12-18 02:59
Oracle数据库管理
Oracle
19c
oracle
database
redo
RAC
h2-database 安装部署学习
1,下载jar包Arc
hive
Downloads进入到下载的包的位置:cdE:\IDE\Java\jre\lib2,参考以下说明进行数据库创建:Tutorial执行如下可以进行创建默认的数据库设置用户密码
jimiStephen
·
2023-12-18 02:55
数据库
学习
Datax学习整理
一、简介DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、HDFS、
Hive
、ADS、HBase、TableStore(
耗子背刀PK猫
·
2023-12-18 02:53
学习
Hive
优化
一、问题背景
Hive
离线数仓开发,一个良好的数据任务,它的运行时长一般是在合理范围内的,当发现报表应用层的指标数据总是产出延迟,排查定位发现是有些任务执行了超10小时这样肯定是不合理的,此时就该想想如何优化
耗子背刀PK猫
·
2023-12-18 02:23
hive
数据仓库
大数据架构(一)背景和概念
一、背景1.岗位现状大数据在一线互联网已经爆发了好多年,2015年-2020年(国内互联网爆发期)那时候的大数据开发,刚毕业能写
Hive
SQL配置个离线任务、整个帆软报表都20K+起步。
野生的狒狒
·
2023-12-18 02:50
大数据
数据仓库
hive
Hive
问题
1.
Hive
基本概念数据仓库工具,底层存储为HDFS,类SQL的查询,转化为mapreduce。执行程序运行在Yarn上2.
hive
内部表和外部表的区别?
July2333
·
2023-12-18 02:57
【伊朗名菜】石榴核桃炖肉:美味俱佳和营养丰富
准备材料有:半公斤羊肉馅(或牛肉馅或鸭肉);半公斤蔬菜(细香葱C
hive
s,Coriander芫荽,Parsley欧芹,Fenugreek胡芦巴,Spinach菠菜);5汤匙石榴酱;盐和胡椒尽可能多;制作方法
西域竹君斋
·
2023-12-18 02:34
PHP安装swoole扩展
wgethttps://github.com/swoole/swoole-src/arc
hive
/v4.4.16.tar.gztarzxvfv4.4.16.tar.gzcds
palma_he
·
2023-12-18 01:53
php
Oracle 解决ORA-00257 Arc
hive
r error 报错
Oracle解决ORA-00257Arc
hive
rerror报错日期:2023-12-11作者:Tingy,H文章目录Oracle解决ORA-00257Arc
hive
rerror报错一、问题描述二、原因分析三
后浪v
·
2023-12-18 00:39
oracle
数据库
linux
提升R语言分析效率:如何精准定位CRAN中你想要的高质量R包?
CRAN(ComprehensiveRArc
hive
Network)拥有数以万计的R包,涵盖了数据处理、可视化、建模和其他众多领域。
R语言数据分析视界
·
2023-12-18 00:19
r语言
开发语言
Mysql - 引擎介绍
引擎介绍InnoDB引擎:具备外键支持功能的事务存储引擎MyISAM引擎:主要的非事务处理储存引擎Arc
hive
引擎:用于数据存档Blackhole引擎:丢弃写操作,读操作会返回空内容CSV引擎:储存数据的时候
敏姐儿
·
2023-12-17 23:18
MySQL
mysql
数据库
如何安装不在CRAN的R包
但该包在arc
hive
存档,于是我尝试了下面步骤进行安装。
定!
·
2023-12-17 23:48
r语言
Debian 系统镜像下载
的版本我无法下载,提示被最新的debian-12.4.0所代替,于是找到了这个链接Indexof/cdimage/unofficial/non-free/cd-including-firmware/arc
hive
william~
·
2023-12-17 22:30
debian
运维
pip install 报错ERROR: Cannot unpack file、Cannot determine arc
hive
format of 解决办法
使用pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simple--trusted-hostpypi.tuna.tsinghua.edu.cnmodule_name
Err0r808
·
2023-12-17 22:21
pip
python
pytorch
报错ERROR: Cannot unpack file C
报错ERROR:Cannotdeterminearc
hive
formatofC报错ERROR:CannotunpackfileC输入了pipinstall+-ihttps://mirrors.aliyun.com
何处不逢君
·
2023-12-17 22:21
python
.; ERROR: Cannot determine arc
hive
format of ...
解决:Python通过pip安装库时报错:ERROR:Cannotunpackfile…;ERROR:Cannotdeterminearc
hive
formatof…文章目录解决:Python通过pip安装库时报错
ninghes
·
2023-12-17 22:20
#
Python
Bug
python
pip
备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
Hadoop:hadoop-3.1.3.tar.gz3.1.3Jdk:jdk-8u212-linux-x64.tar.gz1.8Spark:spark-3.1.1-bin-hadoop3.2.tgz3.1.1
Hive
Stitch .
·
2023-12-17 22:18
我的大学笔记
MySQL
笔记
大数据
mysql
scala
Redis
官网:https://redis.io中文网:https://www.redis.net.cn/windows:https://github.com/microsoftarc
hive
/redis/releasesLinux
攻城狮啊尧
·
2023-12-17 21:15
Redis
redis
数据库
缓存
_pickle.UnpicklingError: invalid load key, ‘<‘.的可能解决方案
需要下载模型文件,结果没发现网络不好,模型文件只下了4k,就提示这个个报错,再次运行文件就发现了这个错误RuntimeError:PytorchStreamReaderfailedreadingziparc
hive
卜德孝
·
2023-12-17 20:22
python
flink安装
架构下载官网下载慢,可以用flink国内镜像https://mirrors.cloud.tencent.com/apache/flink或:有版本下载地址:https://arc
hive
.a
千百元
·
2023-12-17 19:21
#
flink
flink
大数据
Visual studio+Qt开发环境搭建以及注意事项和打开qt的.pro项目
下载qt-然后安装5.14.2_msvc2017不知道安装那个就全选5.14.2的父级按钮https://download.qt.io/arc
hive
/qt/5.14/5.14.2/安装Visualstudio
tiger_angel
·
2023-12-17 19:22
visual
studio
qt
数据库
2023.12.14
hive
sql的聚合增强函数 grouping set
目录1.建库建表2.需求3.使用unionall来完成需求4.聚合函数增强groupingset5.聚合增强函数cube,rollup6.rollup翻滚7.聚合函数增强--grouping判断1.建库建表--建库createdatabaseifnotexiststest;usetest;--建表createtabletest.t_cookie(monthstring,daystring,cook
白白的wj
·
2023-12-17 18:16
hive
sql
hadoop
数据仓库
大数据
database
Spark SQL 写入
hive
表 字段名称或者类型不一致
解决方案:valtargetTableSchemaArray=spark.catalog.listColumns(dbName,tableName).select("name","dataType","isPartition","isBucket").rdd.map(catalog=>{valname=catalog.getAs("name").toStringvaltypeName=catalo
团团饱饱
·
2023-12-17 17:12
Missing artifact org.wltea.analyzer:ik-analyzer:jar:5.0
】https://github.com/wks/ik-analyzerhttps://github.com/wks/ik-analyzer.githttps://code.google.com/arc
hive
spencer_tseng
·
2023-12-17 16:16
java
java
Presto连接
Hive
接前一篇文章,这里只说怎样连接
Hive
。
kongxx
·
2023-12-17 16:46
CentOS使用kkFileView实现在线预览word excel pdf等
一、环境安装1、安装LibreOfficewgethttps://downloadarc
hive
.documentfoundation.org/libreoffice/old/7.5.3.2/rpm/x86
顽石九变
·
2023-12-17 15:39
运维
centos
kkFileView
SpringCloud微服务实战——搭建企业级开发框架(三十七):微服务日志系统设计与实现
针对业务开发人员通常面对的业务需求,我们将日志分为操作(请求)日志和系统
运行日志
,操作(请求)日志可以让管理员或者运营人员方便简单的在系统界面中查询追踪用户具体做了哪些操作,便于分析统计用户行为;系统
运行日志
又分为不同的级别
全栈程序猿
·
2023-12-17 15:59
Hive
解析Json数组超全讲解
Hive
解析Json数组超全讲解在
Hive
中会有很多数据是用Json格式来存储的,如开发人员对APP上的页面进行埋点时,会将多个字段存放在一个json数组中,因此数据平台调用数据时,要对埋点数据进行解析
lz_matlab
·
2023-12-17 09:38
Hive
hive
json
大数据
oracle创建分区表,以及非分区表转分区表(转载)
什么是分区表,分区表详解:http://langgufu.iteye.com/blog/1552042本文原出处:http://blog.csdn.net/tianlesoftware/arc
hive
/
langgufu314
·
2023-12-17 08:18
ORACLE数据库
分区表
分区交换
在线重定义
oracle
Hive
Sql语法优化三 :join优化
前面提到过:
Hive
拥有多种join算法,包括CommonJoin,MapJoin,BucketMapJoin,SortMergeBucktMapJoin等;每种join算法都有对应的优化方案。
zmx_messi
·
2023-12-17 08:13
大数据
HQL优化之数据倾斜
groupby导致倾斜前文提到过,
Hive
中未经优化的分组聚合,是通过一个MapReduceJob实现的。
zmx_messi
·
2023-12-17 08:13
大数据
hive
Hive
Sql语法优化二 :join算法
Hive
拥有多种join算法,包括CommonJoin,MapJoin,BucketMapJoin,SortMergeBucktMapJoin等,下面对每种join算法做简要说明:CommonJoinCommonJoin
zmx_messi
·
2023-12-17 08:43
hive
hadoop
数据仓库
Hive
Sql语法优化四 :Bucket Map Join和Sort Merge Bucket Map Join优化
BucketMapJoin之前的mapjoin适用场景是大表join小表的情况,但是两张表都相对较大,若采用普通的MapJoin算法,则Map端需要较多的内存来缓存数据,当然可以选择为Map段分配更多的内存,来保证任务运行成功。但是,Map端的内存不可能无上限的分配,所以当参与Join的表数据量均过大时,就可以考虑采用BucketMapJoin算法。比如下面两张表进行join操作:表名大小orde
zmx_messi
·
2023-12-17 08:09
数据库
上一页
43
44
45
46
47
48
49
50
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他