E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓学习专栏
DataFunSummit:2023年数据湖架构峰会-核心PPT资料下载
面对如此大规模的数据,无论是分析型场景、流批一体、增量
数仓
都得益于湖仓一体等数据湖技术的发展而变得越来越容易解决。从核心架构、性能优化、湖仓一体、最佳实践等方面带来数据湖的最新技术和内容实践经验总结。
百家峰会
·
2023-12-27 16:03
大数据
数据湖
数据治理
架构
数据湖
大数据
数据治理
从报表需求到报表开发的流程
报表开发背后涉及到需求调研和
数仓
开发的支持。二、目标梳理从报表需求提出到报表需求实现整个生
qq_36120059
·
2023-12-27 12:55
数据仓库
报表
数据仓库
finebi
基于Kettle和帆软Finereport的血缘解析
开发人员排查数据质量问题步骤:首先和业务人员对接了解是哪里数据不准确,要定位是哪张报表,然后查看报表后面数据来源,然后一路排查
数仓
。往往定位到数据问题耗时比较高,开发断层导致找到相关任务比较难。
qq_36120059
·
2023-12-27 12:55
finereport
数据仓库
血缘解析
数据仓库
浅谈数据仓库运营
二、目标提高数据仓库存储性能和开发质量以及数据质量三、数据运营指标3.1开发质量表名规范性:检验数据库表名是否按照
数仓
表名规范,表名是否按照词根翻译字段名规范性:检验表字段名是否按照词根中文进行翻译字段类型规范性
qq_36120059
·
2023-12-27 12:53
数据仓库
数据仓库
电商数据分析-03-电商数据采集
第1章数据仓库概念数据仓库规划1.1
数仓
搭建我们这里所说的数据仓库,是基于大数据体系的,里面包含标签类目,区别于传统的数据仓库。下面我们来将这张图分解,逐个做简要分析。
IT从业者张某某
·
2023-12-27 11:14
数据分析入门到进阶
数据分析
电商数据分析-02-电商业务介绍及表结构
参考电商业务简介大数据项目之电商
数仓
、电商业务简介、电商业务流程、电商常识、业务数据介绍、电商业务表、后台管理系统可以把excel复制为markdown的网站举个例子:1.1电商业务流程电商的业务流程可以以一个普通用户的浏览足迹为例进行说明
IT从业者张某某
·
2023-12-27 11:14
数据分析入门到进阶
数据分析
数据库开发常见面试题
ORACLE和kettle1、DeleteTruncateDrop区别2、DML、DDL3、经常使用到得函数4、KETTLE内存溢出解决方案5、kettle中黄色的锁,绿色的对勾,红色的停止代表的意思6、
数仓
架构
'接受现实'
·
2023-12-27 06:54
数据库开发
etl
数据库
hive学习笔记
一、Hive基本概念1.1hive是什么hive是基于hadoop的一个
数仓
分析工具,hive可以将hdfs上存储的结构化的数据,映射成一张表,然后让用户写HQL(类SQL)来分析数据telupdown138383843813451567138383843953451567138383844012411657713838384413453157571383838434353551567567
不爱吃鱼的馋猫
·
2023-12-27 06:05
hive
大数据
hadoop
大数据实战项目 -- 实时
数仓
文章目录一、实时数据1.1日志采集器1.1日志生成器1.3日志分发器1.4采集流脚本二、实时采集2.1项目搭建2.2Kafka数据获取2.3Redis数据去重2.4ES数据存储2.5精准一次性消费2.6Kibana可视化配置2.7发布数据接口三、实时监控3.1Canal3.1.1配置MySQL3.1.2安装canal3.2CanalODS层数据分流3.3Maxwell3.4MaxwellODS层数
L小Ray想有腮
·
2023-12-26 18:53
BigData
电商
数仓
笔记7_数据仓库系统(
数仓
搭建-DWD层,
数仓
搭建-DWS层,
数仓
搭建-DWT层,
数仓
搭建-ADS层)
电商
数仓
一、
数仓
搭建-DWD层1、DWD层(用户行为日志)(1)日志解析思路(2)get_json_object函数使用(3)启动日志表(4)页面日志表(5)动作日志表(6)曝光日志表(7)错误日志表(
明灭18
·
2023-12-26 17:47
笔记
大数据
hadoop
hive
电商
数仓
笔记6_数据仓库系统(
数仓
搭建-ODS层,
数仓
搭建-DIM层)
电商
数仓
一、
数仓
搭建-ODS层1、ODS层(用户行为数据)(1)创建日志表ods_log(2)Shell中单引号和双引号区别(3)ODS层日志表加载数据脚本2、ODS层(业务数据)(1)ODS层业务表首日数据装载脚本
明灭18
·
2023-12-26 17:17
笔记
数据仓库
hive
hadoop
大数据
四、电商数据仓库系统——第5章 数据仓库设计
5.1数据仓库分层规划优秀可靠的
数仓
体系,需要良好的数据分层结构。合理的分层,能够使数据体系更加清晰,使复杂问题得以简化。以下是该项目的分层规划。5.2数据仓库构建流程以下是构建数据仓库的完整流程。
怕被各位卷死
·
2023-12-26 17:47
离线电商数仓5.0搭建
大数据
hadoop
kafka
分布式
hdfs
电商
数仓
项目----笔记七(
数仓
DIM层)
所谓的维度层其实就是分析数据的角度,维度层保存的表其实是分析数据的角度,比如:--性别,年龄,品牌,品类这层的表主要用于统计分析,因此DIM层的数据存储格式为orc列式存储+snappy压缩(时间短)orc列式存储的好处:查询的时候不需要扫描全部的数据,而只需要读取每次查询涉及的列,这样可以将I/O消耗降低N倍,另外可以保存每一列的统计信息(min、max、sum等),实现部分的谓词下推。由于每一
zmx_messi
·
2023-12-26 17:16
笔记
Flink电商实时
数仓
(六)
交易域支付成功事务事实表从topic_db业务数据中筛选支付成功的数据从dwd_trade_order_detail主题中读取订单事实数据、LookUp字典表关联三张表形成支付成功宽表写入Kafka支付成功主题执行步骤设置ttl,通过Intervaljoin实现左右流的状态管理获取下单明细数据:用户必然要先下单才有可能支付成功,因此支付成功明细数据集必然是订单明细数据集的子集。要注意:Interv
十七✧ᐦ̤
·
2023-12-26 07:25
flink
数据库
java
定投一天
现在想来,没参加“得到”
学习专栏
时,以前很多认知是不清晰、不正确甚至是错误的,现在感觉有较大的改变。以前会负能量,怨天尤人紧紧包裹着自己,现在是觉得自己应该如何去面对日子。
24队幸福指数88
·
2023-12-26 02:30
打造绿色计算数智动力 HashData 入选“绿色计算最具价值解决方案”
酷克数据(HashData)作为国内云原生
数仓
领军企业,受邀参加本次大会,为观众呈现了HashData云
数仓
的技
HashData酷克数据
·
2023-12-26 00:53
postgresql
数据库
创新铸就卓越 HashData再度荣获 IT168技术卓越奖
12月20日,由国内专业数据库及架构技术社区ITPUB、IT垂直门户IT168联合主办的“2023技术卓越奖”评选结果正式揭晓,酷克数据基于云原生架构打造的HashData云
数仓
,凭借创新的技术架构、强大的性能表现
HashData酷克数据
·
2023-12-26 00:53
数据库
数据分析
大数据
【C++练级之路】【Lv.2】类和对象(上)(类的定义,访问限定符,类的作用域,类的实例化,类的对象大小,this指针)
学习专栏
:《进击的C++》一、面向
快乐的流畅
·
2023-12-25 11:44
进击的C++
c++
microsoft
开发语言
幸福里基于 Flink & Paimon 的流式
数仓
实践
幸福里业务是一种典型的交易、事务类型的业务场景,这种业务场景在实时
数仓
建模中遇到了诸多挑战。
浪尖聊大数据-浪尖
·
2023-12-25 10:45
flink
大数据
Flink实时电商
数仓
(五)
FlinkSQL的joinRegularjoin普通join,两条流的数据都时存放在内存的状态中,如果两条流数据都很大,对内存压力很大。IntervalJoin:适合两条流到达时间有先后关系的;一条流的存活时间短,一条流的存活时间长。LookupJoin:适合主流特别大,从流特别小的情况;主流数据没到达一条,就会去查询从流的每一条数据。主流数据不存储在内存中。语法:主流使用时必须有处理时间,pro
十七✧ᐦ̤
·
2023-12-25 02:27
flink
大数据
Flink电商实时
数仓
(四)
日志数据结构业务数据:数据都是MySQL中的表格数据,使用FlinkSQL处理日志数据:分为page页面日志(页面信息,曝光信息,动作信息,报错信息)和启动日志(启动信息,报错信息),使用FlinkStreamAPI处理五种日志数据:“start”;启动信息“err”;错误信息“display”;曝光信息“action”;动作信息“page”;页面信息"actions":[{"action_id"
十七✧ᐦ̤
·
2023-12-25 02:57
flink
vscode
大数据
【黑马甄选离线
数仓
day10_会员主题域开发_DWS和ADS层】
day10_会员主题域开发会员主题_DWS和ADS层DWS层开发门店会员分类天表:维度指标:指标:新增注册会员数、累计注册会员数、新增消费会员数、累计消费会员数、新增复购会员数、累计复购会员数、活跃会员数、沉睡会员数、会员消费金额维度:时间维度(天、周、月)涉及表:门店会员分类天表表字段的组成:维度字段+指标结果字段建表语句:CREATETABLEIFNOTEXISTSdws.dws_mem_
LKL1026
·
2023-12-25 01:58
黑马甄选离线数仓项目
大数据
数据库
sql
数据仓库
2019-05-23
其他时间都在编写法院
数仓
重构项目建设方案。下午王伟离职,涉及到薪资结算不合理问题,他很生气,我建议他不要纠结这些小事,他貌似也没听进去。下午听了一个讲健康安全的课程,感觉很实用。晚11点半就寝。
bigtian
·
2023-12-24 15:11
电商
数仓
项目----笔记六(
数仓
ODS层)
ODS层的设计要点如下:(1)ODS层的表结构设计依托于从业务系统同步过来的数据结构。(2)ODS层要保存全部历史数据,故其压缩格式应选择压缩比较高的,此处选择gzip。(3)ODS层表名的命名规范为:ods_表名_单分区增量全量标识(inc/full)。同样的,需要将用户行为数据表和业务数据表放到ODS层。日志表DROPTABLEIFEXISTSods_log_inc;CREATEEXTERNA
zmx_messi
·
2023-12-24 12:38
笔记
电商
数仓
项目----笔记五(
数仓
架构和建模)
ODS:数据源DWD:加工数据DWS:统计数据ADS:分析数据DIM:维度层(大家都有可能用得上的部分)ER模型数据仓库之父BillInmon提出的建模方法是从全企业的高度,用实体关系(EntityRelationship,ER)模型来描述企业业务,并用规范化的方式表示出来,在范式理论上符合3NF。1)实体关系模型实体关系模型将复杂的数据抽象为两个概念——实体和关系。实体表示一个对象,例如学生、班
zmx_messi
·
2023-12-24 11:35
笔记
基于Hue,Dolphinscheduler,HIVE分析数据仓库层级实现及项目需求案例实践分析
目录一、
数仓
各个层级及作用1,ODS层(OperationDataStore-源数据层)2,DW层(DataWarehouse-数据仓库层)(1)DWD(DataWarehouseDetail-明细数据层
Len°
·
2023-12-24 11:32
Hadoop
hadoop
big
data
hive
技本功|Hive优化之监控(三)
Hive是大数据领域常用的组件之一,主要是大数据离线
数仓
的运算,关于Hive的性能调优在日常工作和面试中是经常涉及的一个点,因此掌握一些Hive调优是必不可少的技能。
云掣YUNCHE
·
2023-12-24 03:15
技术文档
数据库
运维
hive
大数据
mysql
技本功|Hive优化之Spark执行引擎参数调优(二)
Hive是大数据领域常用的组件之一,主要是大数据离线
数仓
的运算,关于Hive的性能调优在日常工作和面试中是经常涉及的的一个点,因此掌握一些Hive调优是必不可少的一项技能。
云掣YUNCHE
·
2023-12-24 03:44
技术文档
spark
hive
【
数仓
_01】用户行为采集平台
1、
数仓
基础知识1.1描述1.2需求分析1.3选型考虑因素1.4项目流程设计1.5具体版本1.6集群规模2、用户行为数据生成2.1目标数据2.2埋点3、模拟数据3.1使用说明3.2集群日志生成脚本4、用户行为数据采集模块
温欣2030
·
2023-12-23 10:43
hadoop
读书笔记:《你要如何衡量你的人生》1.1
跟随何帆老师
学习专栏
的也是真真的感到读书的狂野,这一周我陆续买了《品格之路》——《社会动物》——《要事第一》——《你要如何衡量你的人生》——《深度工作》,一次性要读这数量不算太少的书籍,真犹如一场硬仗要打
向黎明致敬
·
2023-12-23 01:52
CloudCanal x Debezium 打造实时数据流动新范式
CloudCanal近期实现了从Kafka消费Debezium格式数据,将其同步到StarRocks、Doris、Elasticsearch、MongoDB、ClickHouse等12种数据库和
数仓
,补全其数据到达能力
ClouGence
·
2023-12-22 16:48
CloudCanal
数据库
大数据
数据仓库
etl
Hive的联级(cascade)- 修改分区表的字段类型或者增加新字段
一、问题描述踩坑:
数仓
的分区表,由于需求需要,要把int类型的字段改为bigint,我直接执行的以下语句:altertabletable_namechangecolumn字段字段bigint;出现的问题
大数据点滴
·
2023-12-22 14:34
#
Hive
hive
字段类型
大数据
数据仓库-数据治理小厂实践
一、简介数据治理贯穿
数仓
中数据的整个生命周期,从数据的产生、加载、清洗、计算,再到数据展示、应用,每个阶段都需要对数据进行治理,像有些比较大的企业都是有自己的数据治理平台或者会开发一些便捷的平台,对于没有平台的公司
大数据点滴
·
2023-12-22 14:03
#
数据仓库
数据仓库
数据治理
【Java系列】多线程案例学习——单例模式
个人主页:兜里有颗棉花糖欢迎点赞收藏✨留言✉加关注本文由兜里有颗棉花糖原创收录于专栏【Java系列专栏】【JaveEE
学习专栏
】本专栏旨在分享学习JavaEE的一点学习心得,欢迎大家在评论区交流讨论目录一
兜里有颗棉花糖
·
2023-12-22 14:54
Java系列
JavaEE学习专栏
java
单例模式
java-ee
AIGC绘画关键词 - 动物类(一)
Unity3D特效百例案例项目实战源码Android-Unity实战问题汇总游戏脚本-辅助自动化Android控件全解手册再战Android系列Scratch编程案例软考全系列Unity3D
学习专栏
蓝桥系列
芝麻粒儿
·
2023-12-22 08:20
ChatGPT和AIGC
AIGC
绘画
人工智能
chatgpt
Midjourney
一文读懂云原生一体化
数仓
简介:阿里云云原生一体化
数仓
产品技术深度解读。
阿里云云栖号
·
2023-12-22 07:19
云栖号技术分享
云原生
big
data
cloud
native
Impala 基于hive的交互式实时分析工具(二) 概念及原理介绍
impala和hive的区别概括:hive是【基于hadoop】的适合【离线批处理复杂sql分析的
数仓
工具】,impala是【基于hive】的适合【实时交互简单sql的
数仓
工具】执行计划1.hive:hive
章云邰
·
2023-12-22 01:34
蓝桥杯专题-真题版含答案-【奇数魔方阵】【4N 魔方阵】【2(2N+1) 魔方阵】【加法变乘法】
Unity3D特效百例案例项目实战源码Android-Unity实战问题汇总游戏脚本-辅助自动化Android控件全解手册再战Android系列Scratch编程案例软考全系列Unity3D
学习专栏
蓝桥系列
芝麻粒儿
·
2023-12-21 22:36
蓝桥全系列
蓝桥杯
职场和发展
算法
真题
本地
数仓
项目(三)—— 数据可视化和任务调度
1背景本文基于《本地数据仓库项目(一)——
数仓
搭建详细流程》和《本地
数仓
项目(二)——搭建系统业务
数仓
详细流程》数据为依托,实现数据可视化和任务调度2构造可视化数据在mysql中新建ads_uv_count
不以物喜2020
·
2023-12-21 21:37
大数据数仓
数据仓库
数据分析
hive
Azkaban
任务调度
【2023 英特尔On技术创新大会直播 |我与英特尔的初次相遇】—— AIPC探索下一代的物联网时代
个人主页:Aileen_0v0系列专栏:英特尔技术
学习专栏
个人格言:"没有罗马,那就自己创造罗马~"目录硅谷经济的发展与挑战Intel开发者云与AI技术的应用AI压缩技术的发展与应用英特尔与阿里巴巴在AI
Aileen_0v0
·
2023-12-21 19:47
英特尔技术学习
人工智能
开发语言
opencv
深度学习
文心一言
AIPC
AIGC
天软高频时序数据仓库
1天软高频时序
数仓
方案架构天软高频时序数据仓库是深圳天软科技开发有限公司专为金融用户提供的专业高频行情数据处理方案,集数据接入、检查、处理、存储、查询、订阅、计算于一体。
Tinysoft_SH
·
2023-12-21 18:51
数据仓库
区块链
时序数据库
数据库
数据库开发
大数据
Flink电商实时
数仓
(三)
DIM层代码流程图维度层的重点和难点在于实时电商
数仓
需要的维度信息一般是动态的变化的,并且由于实时
数仓
一般需要一直运行,无法使用常规的配置文件重启加载方式来修改需要读取的ODS层数据,因此需要通过Flink-cdc
十七✧ᐦ̤
·
2023-12-21 18:48
flink
linq
大数据
基于 Flink 的典型 ETL 场景实现方案
目录1.实时
数仓
的相关概述1.1实时
数仓
产生背景1.2实时
数仓
架构1.3传统
数仓
vs实时
数仓
2.基于Flink实现典型的ETL场景2.1维表Join■2.1.1预加载维表方案1:方案2:■2.1.2热存储关联
话数Science
·
2023-12-21 11:59
Flink
大数据
Spark
flink
etl
大数据
数据中台之旅(五)数据开发介绍
功能介绍数据开发包含:作业开发(sqoop\hive\impala\python\shell)、实时开发(flink)、调度管理(工作流\定时调度\DAG查询)、日志管理(定时调度日志\作业运行日志)建设思路作业开发:
数仓
开发使用频率最高的一个功能
belialxing
·
2023-12-21 09:59
总结
数据平台
2019-05-24
周末取消钓鱼计划,继续学习
数仓
。晚上公司团建,吃了些垃圾食品,胃不舒服。晚12点就寝。
bigtian
·
2023-12-21 08:20
Spring Boot + MinIO 实现文件切片极速上传技术
5.2MinIO配置类6.文件切片上传实现6.1控制器层6.2服务层6.3文件切片上传逻辑7.文件合并逻辑8.页面展示9.性能优化与拓展9.1性能优化9.2拓展功能10.总结欢迎来到SpringBoot框架
学习专栏
IT·陈寒
·
2023-12-21 06:44
SpringBoot框架学习
微服务架构设计
Java面试技巧
spring
boot
后端
java
【活动回顾】Databend 云
数仓
与 Databend Playground 扩展组件介绍
本次活动的核心议题为「Databend云
数仓
与DatabendPlayground扩展组件介绍」,此次分享由DatabendLabs的研发工程师尚卓燃担任主讲嘉宾,向与会者呈现了一场内容丰富的在线分享会
Databend
·
2023-12-20 13:02
数据库
云原生
Databend 开源周报第 123 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2023-12-20 13:32
数据库
开源
Databend 开源周报第 124 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2023-12-20 13:31
开源
Flink实时电商
数仓
(二)
GitLab的用户创建和推送在root用户-密码界面重新设置密码添加Leader用户和自己使用的用户使用root用户创建相应的群组使用Leader用户创建对应的项目设置分支配置为“初始推送后完全保护”设置.gitignore文件,项目配置文件等其他非通用代码无需提交安装gitlabproject2020插件点击shareprojectongitlab即可将项目上传到gitlab中Flink集群的搭
十七✧ᐦ̤
·
2023-12-20 08:50
flink
大数据
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他