E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
时序图数仓
企业级大数据项目【4】
数仓
-业务域ODS-DWD-ADS开发篇
1概要说明业务域的数据来自业务系统的数据库通过sqoop(或datax)抽取到
数仓
的ods层在ods层对有需要的表进行增量合并,字段选择,反范式话,形成dwd明细层表在明细层基础上,进行各类主题的数据统计
江湖人称涛哥
·
2024-01-14 06:32
物流实时
数仓
ODS层——Mysql到Kafka
目录1.采集流程2.项目架构3.resources目录下的log4j.properties文件4.依赖5.ODS层——OdsApp6.环境入口类——CreateEnvUtil7.kafka工具类——KafkaUtil8.启动集群项目这一层要从Mysql读取数据,分为事实数据和维度数据,将不同类型的数据进行不同的ETL处理,发送到kakfa中。代码1.采集流程2.项目架构3.resources目录下
雷神乐乐
·
2024-01-14 06:01
#
实时数仓项目
大数据
数据仓库
flink
kafka
物流实时
数仓
DWD层——1.准备工作
目录1.创建主程序——DwdOrderRelevantApp类2.创建DWD层的事实表——来源于订单表和订单明细表(1)创建订单表实体类(2)创建订单明细表实体类(3)创建交易域:下单事务事实表实体类,并整合(1)与(2),采用下单时间(4)创建交易域:支付成功事务事实表实体类,并整合(1)与(2),采用支付时间和支付状态(5)创建物流域:揽收(接单)事务事实表实体类,并整合(1)与(2),采用揽
雷神乐乐
·
2024-01-14 06:57
#
实时数仓项目
大数据
flink
java
数据仓库
交通物流
Hive命令行运行SQL将数据保存到本地如何去除日志信息
1.场景分析先有需求需要查询hive
数仓
数据并将结果保存到本地,但是在操作过程中总会有日志信息和表头信息一起保存到本地,不符合业务需要,那如何才能解决该问题呢?
tuoluzhe8521
·
2024-01-14 05:01
Hive相关
hive
sql
hadoop
美团点评实时
数仓
平台演进与实践
1.摘要数据仓库的建设是“数据智能”必不可少的一环,也是大规模数据应用中必然面临的挑战,而Flink实时
数仓
在数据链路中扮演着极为重要的角色。
笔名辉哥
·
2024-01-14 02:50
数仓
建模—埋点设计与管理
数据仓库系列文章(部分已出,持续更新)
数仓
架构发展史
数仓
建模方法论
数仓
建模分层理论
数仓
建模—宽表的设计
数仓
建模—指标体系数据仓库之拉链表
数仓
—数据集成
数仓
—数据集市
数仓
—商业智能系统
数仓
—埋点设计与管理
数仓
大数据技术派
·
2024-01-14 01:22
hiveSQL任务执行时间过长
从业务或者其他方面优化4、从接口层取数前期的
数仓
设计不合理或者临时性
amberwest
·
2024-01-13 22:16
big
data
数据仓库
hive
【spring源码分析】@Conditional的使用以及分析
@Conditional@Conditional一、基本信息二、注解描述三、注解源码四、主要功能五、最佳实践在@Bean上使用在@Configuration上使用自定义组合注解六、
时序图
七、源码分析八、
吴巴格
·
2024-01-13 17:24
spring源码
spring
数据库
mysql
spring
boot
【spring源码分析】@Autowired的使用以及分析
@Autowired@Autowired一、基本信息二、注解描述三、接口源码四、主要功能五、最佳实践六、
时序图
七、源码分析前置条件收集阶段注入阶段八、注意事项九、总结最佳实践总结源码分析总结一、基本信息转载自
吴巴格
·
2024-01-13 17:54
spring源码
spring
java
后端
【spring源码分析】@ComponentScan的使用以及分析
@ComponentScan@ComponentScan一、基本信息二、注解描述三、注解源码四、主要功能五、最佳实践六、
时序图
七、源码分析八、注意事项九、总结最佳实践总结源码分析总结一、基本信息转载自github
吴巴格
·
2024-01-13 17:19
spring源码
spring
java
后端
spring
boot
数据仓库Apache Hive
为了分析数据而来数据分析的平台2、数据仓库的特性3、数据仓库和数据库的区别OLTP系统OLAP系统注意:这里要解决一个核心的误区:
数仓
绝不是大型数据库。
江枫渔火R
·
2024-01-13 09:29
数据仓库
apache
hive
大数据
2022-02-01大数据学习日志——Hadoop离线阶段——数据仓库、Apache Hive
学习目标理解
数仓
概念、起源由来理解
数仓
(OLAP)与数据库(OLTP)区别掌握
数仓
分层架构思想掌握ApacheHive功能与架构组件理解ApacheHive远程模式部署安装内容大纲#数据仓库基础核心知识
王络不稳定
·
2024-01-13 09:28
数据仓库
big
data
hive
数据仓库 & Apache Hive
一、数据分析1、数据仓库数据仓库(英语:DataWarehouse,简称
数仓
、DW),是一个用于存储、分析、报告的数据系统。
杀神lwz
·
2024-01-13 09:52
大数据
数据分析
数据仓库
apache
hive
数仓
建设指南
数仓
建设指南数据模型架构规范数据层次的划分ODS:OperationalDataStore,操作数据层,在结构上其与源系统的增量或者全量数据基本保持一致。
左美美  ̄
·
2024-01-13 06:04
java
大数据
数据仓库
ReentrantLock底层原理学习二
以ReentrantLock作为切入点,来看看在这个场景中是如何使用AQS来实现线程的同步的ReentrantLock的
时序图
调用ReentrantLock中的lock()方法,源码的调用过程我使用了
时序图
来展现
CopyLower
·
2024-01-13 02:30
学习
Java
学习
CSDN Markdown
时序图
示例
CSDNMarkdown
时序图
示例示例1示例1```mermaidsequenceDiagram张三->>李四:你好!李四,最近怎么样?李四-->>王五:你最近怎么样,王五?
qwfys200
·
2024-01-13 01:03
Project
时序图
大数据开发工程师需要具备哪些技能?
在回答这个问题之前,需要充分了解一下当前大数据的几个就业方向,可以参考下主流互联网行业的部门架构、职责和JD,大数据开发工程师,总体来说有这么几类,不同的公司叫法不一样:1、
数仓
开发工程师2、算法挖掘工程师
郑小柒是西索啊
·
2024-01-12 21:58
大数据
Databend 开源周报第 127 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2024-01-12 20:45
数据库
开源
数据交付变革:研发到产运自助化的转型之路
作者|Chris导读本文讲述为了提升产运侧数据观察、分析、决策的效率,支持业务的快速迭代,移动生态数据研发部对
数仓
建模与BI工具完成升级,采用宽表建模与TDA平台相结合的方案,一站式自助解决数据应用需求
百度Geek说
·
2024-01-12 16:14
信息可视化
数据分析
数据挖掘
数仓建模
BI工具
GBASE南大通用 GBase 8a 产品构建
数仓
系统架构
lGBASE南大通用GBase8a产品构建
数仓
应用的系统架构:架构技术实现特点适用场景独立数据仓库(集市)系统架构一套GBase8a物理集群适用于数据规模较小的业务场景适用于各业务之间数据互访较频繁的业务场景适用于单一独立的业务场景企业级
数仓
系统架构多套
GBASE数据库
·
2024-01-12 12:04
数据库
GBASE南大通用
GBASE
【DolphinScheduler】datax读取hive分区表时,空分区、分区无数据任务报错问题解决
问题背景:最近在使用海豚调度DolphinScheduler的Datax组件时,遇到这么一个问题:之前给客户使用海豚做的离线
数仓
的分层搭建,一直都运行好好的,过了个元旦,这几天突然在
数仓
做任务时报错,具体报错信息如下
Alex_81D
·
2024-01-12 08:49
部署项目相关
大数据基础
数据治理
hive
hadoop
数据仓库
【大数据面试】常见
数仓
建模面试题附答案
数仓
架构为什么要分层?事实表的类型?维度建模步骤?维度建模的三种模式?
数仓
架构进化?数据仓库如何保证数据质量?开发流程/你们是怎么测试的?维度建模过程?维度建模的三种模式?事实表都有哪几种?
话数Science
·
2024-01-12 07:28
面试
大数据
大数据
Hive解析json数组
在使用Hive搭建数据仓库,处理数据时,同传统
数仓
的结构化数据不同,我们经常会遇到一些非结构化的数据,json格式的字符串就是常见的一种类型。
风筝flying
·
2024-01-12 03:47
Mermaid 教程
Mermaid教程Mermaid介绍Mermaid是一个用于生成流程图、
时序图
、甘特图等图表的JavaScript库。它使用类似于Markdown的文本语法,使得创建图表变得简单直观。
Persus
·
2024-01-11 19:26
前端
github
数据库
mermaid
【Databend】数据类型
文章目录数据类型列表转换数据类型数据类型扩展整数类型布尔类型浮点数类型字符串类型日期时间类型其它数据类型总结数据类型列表Databend作为一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式
数仓
有请小发菜
·
2024-01-11 17:08
Databend
数据库
mysql
python
rust
Apache Flink 和 Paimon 在自如数据集成场景中的使用
业务背景自如目前线上有基于Hive的离线
数仓
和基于Flink、Kafka的实时
数仓
,随着业务发展,我们也在探索引入湖仓一体的架构更好的支持业务,我们对比了Iceberg、Hudi、Paimon后,最终选择
Apache Flink
·
2024-01-11 13:09
apache
flink
大数据
亚信安慧AntDB团队引领数据库创新浪潮
该数据库经过多次迭代,形成了完整的“超融合流式实时
数仓
”体系,为通信运营商和各行业提供卓越的服务
亚信安慧AntDB数据库
·
2024-01-11 12:48
数据库
人工智能
大数据
antdb
antdb数据库
基于Hologres+Flink的曹操出行实时
数仓
建设作者:林震|曹操出行实时计算负责人
作者:林震|曹操出行实时计算负责人曹操出行业务背景介绍曹操出行创立于2015年5月21日,是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务,以“科技重塑绿色共享出行”为使命,将全球领先的互联网、车联网、自动驾驶技术以及新能源科技,创新应用于共享出行领域,以“用心服务国民出行”为品牌主张,致力于打造服务口碑最好的出行品牌。作为一家互联网出行平台,主要提供了网约车、顺风车、专车等一些出行服务。
阿里云大数据AI技术
·
2024-01-11 09:40
flink
大数据
【设计模式】创建型模式之单例模式(Golang实现)
单例模式的要点:某个类只能有一个实例必须自行创建该实例必须自行向整个系统提供该实例
时序图
:用处从业务概念上来看,有些数据在系统中只应该保留一份,就比较适合设计为单例类。比如,系统的配置信息。
豆沙睡不醒
·
2024-01-11 09:33
设计模式
设计模式
单例模式
golang
软件工程各种图
参考视频:6分钟学会UML类图_哔哩哔哩_bilibili5分钟学会UML
时序图
(顺序图、序列图)_哔哩哔哩_bilibili3分钟学会UML活动图_哔哩哔哩_bilibili6分钟学会UML用例图_哔哩哔哩
Scabbards_
·
2024-01-11 09:31
软件工程
1、支付宝H5支付
建议:先仔细看支付
时序图
,
Struggle霗楓
·
2024-01-11 05:15
51单片机学习笔记
调试工具矩阵键盘介绍扫描的概念定时器介绍STC89C52定时器资源定时器框图定时器的工作模式寄存器定时器/计时器0和1的相关寄存器中断寄存器串口通信介绍硬件电路电平标准接口及引脚定义常见通信接口比较单片机上的UART串口参数及
时序图
串口模式图串口相关寄存器数据显示模式
暗夜黔血
·
2024-01-11 04:00
c语言
学习
笔记
51单片机
离线
数仓
构建案例一
数据采集日志数据(文件)到Kafka自己写个程序模拟一些用户的行为数据,这些数据存在一个文件夹中。接着使用flume监控采集这些文件,然后发送给kafka中待消费。1、flume采集配置文件监控文件将数据发给kafka的flume配置文件:#定义组件a1.sources=r1a1.channels=c1#配置sourcea1.sources.r1.type=TAILDIRa1.sources.r1
躺着听Jay
·
2024-01-10 22:06
大数据
big
data
大数据
RISC Zero STARK证明系统
时序图
及规范
1.引言前序博客:RISCZerozkVM白皮书RISCZero的手撕STARKRISCZero证明系统核心是基于STARK的,实现的是DEEP-ALI和FRI。从高层来看,RISCZero的prover设计与ethSTARKDocumentation–Version1.2和https://github.com/facebook/winterfell非常相似。RISCZero证明系统代码见:htt
mutourend
·
2024-01-10 21:46
zkVM
zkVM
数仓
规范
目录:一、数据模型架构原则
数仓
分层原则主题域划分原则数据
听雪10
·
2024-01-10 15:37
hive基础知识大全
一、Hive基本概念1.1hive是什么hive是基于hadoop的一个
数仓
分析工具,hive可以将hdfs上存储的结构化的数据,映射成一张表,然后让用户写HQL(类SQL)来分析数据telupdown138383843813451567138383843953451567138383844012411657713838384413453157571383838434353551567567
不爱吃鱼的馋猫
·
2024-01-09 13:23
hive
数据仓库
c++ uml
时序图
时序图
通过描述对象之间发送消息的时间顺序显示多个对象之间的动态协作。
时序图
和流程图的区别:
时序图
强调对象之间的交互与时序关系,流程图则是针对一个过程或者活动进行全面而细致的展开。
小飞侠hello
·
2024-01-09 12:34
设计模式
uml
数仓
分层结构
--图片来源尚硅谷ODS层:数据存储格式:JSON/TSV+gzip压缩(默认)OperateDataStore--存储从mysql业务数据库和日志服务器的日志文件中采集到的数据--日志数据--格式:JSON--业务数据--历史数据--格式:--全量--Datax:TSV--增量--Maxwell:JSON--汇总数据--希望用最少的资源存储最多的数据--压缩:--gzip:Hadoop默认支持的
Young_IT
·
2024-01-09 06:40
大数据开发
大数据技术
大数据
数据仓库
某大厂大数据开发-外包面试
4.spark用过吗,用到的开发工具5.数据量多少,服务器台数6.
数仓
每层做了什么事,为什么这样做?
劝学-大数据
·
2024-01-09 06:42
面试
职场和发展
大数据
拿捏了!阿里2022最新JDK源码深度解析小册,Github全站热榜第二
如果你要看某一个框架的源码,第一步当然是访问官网,搞清其组成,确定其核心类有哪些,看源码过程中可以配合画一些
时序图
,加以
Java海
·
2024-01-09 03:28
流式湖仓增强,Hologres + Flink 构建企业级实时
数仓
流式湖仓增强,Hologres+Flink构建企业级实时
数仓
一、Hologres+Flink,阿里云上众多客户实时
数仓
的首选随着大数据从规模化走向实时化,实时数据的需求覆盖互联网、交通、传媒、金融、政府等各个领域
Elivis Hu
·
2024-01-08 22:52
数仓
flink
大数据
数仓
建设学习路线(二)模型建设(1)
OLTPVSOLAPOLTP概念全称OnLineTransactionProcessing,中文名联机事务处理系统,主要是执行基本日常的事务处理,比如数据库记录的增删查改,例如mysql、oracle。OLAP概念全称OnLineAnalyticalProcessing,中文名联机分析处理系统,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果,例如、ClickHouse、Doris、K
语兴数据
·
2024-01-08 18:58
数仓建设-学习路线
大数据
数据仓库
人工智能
数仓
建设学习路线(一)
前言
数仓
建设实践路线是语兴发布在B站的系列课程,搜索语兴呀即可学习完整的
数仓
建设理论。大数据相关岗位大数据常见的岗位主要包括实时开发、数据治理、数据安全、数据资产等。
语兴数据
·
2024-01-08 18:57
数仓建设-学习路线
大数据
数据仓库
人工智能
玩转这6个开发工具,让你每天准点下班
而无论是架构设计还是编写技术方案,画图总是必不可少的,清晰明了的架构图、流程图、
时序图
可以帮助我们更加直
雾岛听风来
·
2024-01-08 18:55
前端
后端
前端框架
低代码
数仓
建设学习路线(二)模型建设(2)
写在最前面本节内容主要讲解模型的具体设计过程,也是我们平常
数仓
工作中的重中之重。更多精彩课程关注B站语兴呀,或关注gzh:语数,获取全部课件资料。
语兴数据
·
2024-01-08 18:52
数仓建设-学习路线
大数据
数据仓库
LCD1602显示温度符号基于Arduino
LCD1602显示基于Arduino这篇文章主要是对Arduino控制LCD1602显示的介绍,具体的硬件方面知识,工作原理
时序图
,网上有许多大神详细分析过例如借鉴一https://blog.csdn.net
大神的风范
·
2024-01-08 17:53
arduino
stm32
开发工具
驱动程序
大数据技术架构
整表同步数据量大,一般是
数仓
T+1方式同步,保证数据一条不丢;还
乘风踏羽
·
2024-01-08 17:47
数据平台
大数据
vue-springboot基于JAVA的小碗菜外卖套餐订单系统的设计与实现9r2r3
注册登录的
时序图
如图3-4所示:图3-4登录注册
时序图
(
QQ_402205496
·
2024-01-08 14:32
java
vue.js
spring
boot
Android WiFi 连接
PrimaryClientModeManager2.2ClientModeImpl状态机ConnectableState2.3ISupplicantStaNetworkCallback回调监听3、简要
时序图
xhBruce
·
2024-01-08 13:49
Android
WiFI
Android
WiFi
基于DataWorks+MaxCompute的公共电影票房数据预处理实践
实验内容:对MaxCompute
数仓
公共数据进行预处理,主要对maxcompute_public_data.dwd_product_movie_basic_info(电影基本信息,包含影片名、导演、编剧
周周的奇妙编程
·
2024-01-08 00:43
odps
数据库
服务器
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他