E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓电商项目
【clickhouse】微信基于Clickhouse的实时
数仓
1.概述直播回放:ClickHouseOnlineSummerMeetupChina20222、背景数据分析场景2.Hadoop
数仓
下的困境视频号等推荐系统的对个性化体验强烈诉求,催生了“亚秒级”分析系统的诞生设计目标
九师兄
·
2023-04-09 16:22
clickhouse
clickhouse
大数据
数据库
pyspark null类型 在 json.dumps(null) 之后,会变为字符串‘null‘
在将hive
数仓
数据写入MySQL时候,有时我们需将数据转为json字符串,然后再存入MySQL。
小何才露尖尖角
·
2023-04-09 16:20
Hive
Spark
json
hive
大数据
null
字符串
null
大数据项目之电商数据仓库系统回顾
实训目的三、操作环境四、实训过程(实训内容及主要模块)五、实训中用到的课程知识点六、实训中遇到的问题及解决方法七、课程实训体会与心得八、程序清单一、实训课题大数据项目之电商数据仓库系统二、实训目的完成一个电商
数仓
项目
三月枫火
·
2023-04-09 11:31
大数据
项目
大数据
数据仓库
hadoop
5.2.2 电商离线
数仓
项目实战 【下】(任务调度系统Airflow)
电商离线
数仓
项目实战【下】文章目录电商离线
数仓
项目实战【下】第二部分任务调度系统Airflow第1节Airflow简介1.1、体系架构1.2、重要概念第2节Airflow安装部署2.1、安装依赖2.2、
weixin_47134119
·
2023-04-09 10:38
数据仓库
spring boot整合线程池
多线程在项目中运用的很多,比如告警消息的发送,需要将告警信息推送到运维人员的微信、邮件、短信等等,
电商项目
提交订单需要查询商品基础信息、库存、优惠信息、优惠券、用户积分、收货地址、快递信息等等;其中涉及到的流程比较长
わたしわ
·
2023-04-09 10:55
springboot
java
成功解决: 大数据验证注意规范
数仓
分ods源业务数据层、dwd、dws指标层、adm应用数据层一、发散验证(数据唯一性检查)如:按月和组织粒度(联合主键)、存在同一个月+同一个组织多条记录selectmonth_id,organ_id
iBigder
·
2023-04-09 08:26
软件测试全套常用模板
大数据
AB测试平台的那些事
最近一段时间在负责公司AB测试平台的建设过程中,调研了很多竞品的通用做法,其中涉及到的数据整体解决方案,包括AB测试数据采集与
数仓
模型、AB测试指标建设、AB测试可视化方案等,借此机会我把自己总结下来的经验分享给大家
一个数据人的自留地
·
2023-04-09 04:21
离线
数仓
和实时
数仓
架构对比
一、
数仓
的实时需求与离线需求的比较1【离线
数仓
需求】就是在计算开始前已知所有输入数据,输入数据不会产生变化,一般计算量级较大,计算时间也较长。例如今天早上一点,把昨天累积的日志,计算出所需结果。
万里长江横渡
·
2023-04-08 20:18
大数据
大数据
hadoop
分布式
电商离线
数仓
项目-用户行为
数仓
(活跃/新增/留存主题)
用户行为
数仓
指标用户活跃主题日活周活月活用户新增主题日新增用户用户留存主题电商离线
数仓
项目,分四层搭建,基本框架搭建好了之后,编写具体的需求.这些需求主要是在DWS层和ADS层两层进行搭建。
梦里Coding
·
2023-04-08 20:17
Hive
big
data
1024程序员节
大数据项目离线
数仓
(全 )二(
数仓
系统)
本文仅仅包含数据仓库系统的搭建,其他内容请关注我的博客!在专栏里!!!本篇文章参考尚硅谷大数据项目写成!目录一、数据仓库系统1.1基础概念1.1.1数据分层的好处1.1.2数据分层1.1.3数据集市和数据仓库1.1.4OLTP和OLAP1.1.5关系建模与维度建模1.1.6事实表和维度表1.1.7维度建模分类1.1.8数据仓库建模1.2软件工具的安装配置1.2.1安装datagrip1.3系统搭建
一个人的牛牛
·
2023-04-08 20:16
项目
数据仓库
离线
数仓
(二) --------- 项目需求及架构设计
目录一、项目需求分析二、项目框架1.技术选型2.系统数据流程设计3.框架版本选型4.服务器选型5.集群规模6.集群资源规划设计一、项目需求分析A、项目需求用户行为数据采集平台搭建业务数据采集平台搭建数据仓库维度建模分析,设备、会员、商品、地区、活动等电商核心主题,统计的报表指标近100个。采用即席查询工具,随时进行指标分析对集群性能进行监控,发生异常需要报警。元数据管理质量监控权限管理B、思考题项
在森林中麋了鹿
·
2023-04-08 20:12
大数据项目
大数据
数据仓库
Hadoop
离线
数仓
建设,企业大数据的业务驱动与技术实现丨03期直播回顾
原文链接:离线
数仓
建设,企业大数据的业务驱动与技术实现丨03期直播回顾视频回顾:点击这里课件获取:点击这里一、离线
数仓
建设背景离线数据是相对实时数据而言的数据产出,不同于实时数据,离线数据一般是T+1天处理
袋鼠云数栈
·
2023-04-08 20:06
数栈产品文章分享
大数据
数据仓库
离线开发
批数据
离线
数仓
数据可靠性的问题
1.如何检测?使用脚本统计日志服务器上的采集的日志文件的行数与HDFS上的目标存储目录中的文件的行数,进行对比2.如何保证数据的不丢失?日志采集网络架构设计为两层第一级采用了tailDirSource,fileChannel,avroSink的搭配,第二级采用了avroSource,fileChannel,hdfsSink的搭配tailDirSource实现了flume的事务机制,并且可以记录偏移
JinVijay
·
2023-04-08 20:05
离线数仓
大数据
离线
数仓
项目,
数仓
理论(概要, 建模方法,
数仓
分层, 模型介绍,元数据),
数仓
设计(需求分析, 数据埋点, 指标体系, 架构设计(方案选型,逻辑架构, 物理环境, 命名规范))
目录PB级企业电商离线
数仓
项目实战【上】项目背景第一部分数据仓库理论第1节数据仓库1.1什么是数据仓库1.2数据仓库四大特征1.3数据仓库作用1.4数据仓库与数据库的区别1.5数据集市第2节数据仓库建模方法
javastart
·
2023-04-08 20:03
数据仓库
数据仓库
数据库
database
数分-理论-大数据6-Hive
数分-理论-大数据6-Hive(数据仓库)(数据分析系列)文章目录数分-理论-大数据6-Hive(数据仓库)1知识点2具体内容2.1数据仓库2.1.1起源2.1.2
数仓
概念2.1.3体系结构2.1.4存在挑战
yxyibb
·
2023-04-08 19:17
数据分析
大数据
hive
big
data
数据仓库
数分准备
数据分析
从数据仓库到数据中台,终于有人说清楚了
作者简介:王春波,《高效使用Greenplum:入门、进阶和数据中台》作者,“数据中台研习社”号主,十年数据开发从业者,资深零售
数仓
项目实施专家。
weixin_44166276
·
2023-04-08 12:02
数据仓库
数仓
建设保姆级5W字教程,离线实时一网打尽(理论+实战)
文档大纲一、
数仓
基本概念1、数据仓库架构我们在谈
数仓
之前,为了让大家有直观的认识,先来谈
数仓
架构,“架构”是什么?这个问题从来就没有一个准确的答案。
浪尖聊大数据-浪尖
·
2023-04-08 12:29
数据仓库
数据库
scipy
makefile
crm
大数据项目之电商
数仓
DataX、DataX简介、DataX支持的数据源、DataX架构原理、DataX部署
文章目录1.DataX简介1.1DataX概述1.2DataX支持的数据源2.DataX架构原理2.1DataX设计理念2.2DataX框架设计2.3DataX运行流程2.4DataX调度决策思路2.5DataX与Sqoop对比3.DataX部署3.1下载DataX安装包并上传到hadoop102的/opt/software3.2解压datax.tar.gz到/opt/module3.3自检,执行
Redamancy_06
·
2023-04-08 09:14
#
电商数仓
大数据
架构
数据库
数据仓库
数据库仓工具箱及阿里大数据之路--阅读总结
5、总结在
数仓
建设中需要避免的
1静1一
·
2023-04-08 09:18
数据分析
数据库
浅谈OLAP系统各个核心技术点
0、前言OLAP系统广泛应用于BI、Reporting、Ad-hoc、ETL
数仓
分析等场景,本文主要从体系化的角度来分析OLAP系统的核心技术点,从业界已有的OLAP中萃取其共性,分为谈存储,谈计算,谈优化器
Impl_Sunny
·
2023-04-08 06:12
#
对比&选型
数据库
数仓
--DW--Hadoop
数仓
实践Case-13-周期快照事实表
周期快照概述周期快照事实表中的每行汇总了发生在某一标准周期,如一天、一周或一月的多个度量。其粒度是周期性的时间段,而不是单个事务。周期快照事实表通常包含许多数据的总计,因为任何与事实表时间范围一致的记录都会被包含在内。在这些事实表中,外键的密度是均匀的,因为即使周期内没有活动发生,通常也会在事实表中为每个维度插入包含0或空值的行。周期快照在库存管理和人力资源系统中有比较广泛的应用。商店的库存优化水
李小李的路
·
2023-04-08 05:18
数据仓库
电商项目
-整体架构
1.1技术选型数据采集:实时:flume-->kafka,DSG->kafka,离线:sqoop存储平台:底层存储HDFS,基础设施:hive(数据仓库基础设施)运算引擎:spark任务调度:azkaban/oozie、informatica元数据管理:atlas(或自研系统)OLAP引擎:即席查询kylin/impala前端界面:superset(或自研javaweb系统)产出存储(hbase,
四月天03
·
2023-04-08 05:50
数仓电商项目
big
data
大数据
电商项目
全部操作流程
1.项目初始化A.安装Vue脚手架B.通过脚手架创建项目新建文件夹(VUE1)在文件夹中打开cmd输入vueui新建vue新项目第一步第二部第三部第四部跳转可视化窗口在可视化窗口下载elementUI配置Axios(运行依赖)把项目提交到gitee上gitee官网Gitee-基于Git的代码托管和研发协作平台创建好自己的仓库在当前文件夹里打开gitee窗口添加到本地仓库提交代码先把本地库连接上远程
一个人挺好215
·
2023-04-08 02:14
vue.js
html5
javascript
电商项目
“商品分类浏览”如何测试?附详细思维导图
电商项目
无论是工作中,还是面试中,都是一个高频出现的词。面试官非常热衷提问关于
电商项目
的问题。例如商品分类怎么测试?购物车怎么测试?订单怎么测试?优惠券怎么测试?支付怎么测试?
测试萌萌
·
2023-04-08 02:12
软件测试
程序人生
python自动化测试
测试工程师
程序人生
软件测试
单元测试
python
大数据测试 -
数仓
测试
一、
数仓
分层设计标准
数仓
分为ODS,DWD,DIM,DWS,ADS等,每一层都有自己的含义:ODS:存储原始业务数据,数据原封不动同步到到ODS,不做任何修改,并且备份,备份时可以压缩;DWD:数据清洗
loveysuxin
·
2023-04-07 22:37
大数据
数据仓库
数据挖掘
数据库
数据仓库分层原理
而
数仓
就是做这些海量数据存储的地方。数据仓库简介数据仓库是一个面向主题的、集成的
Linux小百科
·
2023-04-07 22:39
数据仓库
big
data
hadoop
数据仓库原理&实战【1】
文章目录一、
数仓
的诞生背景1.1
数仓
诞生原因1.2基本概念数据仓库(DataWarehouse,DW)数据仓库特点数据仓库与数据库的区别1.3技术实现1.3.1数据仓库建设方案1.3.2传统数据仓库1.3.3
Txixi
·
2023-04-07 21:21
数据仓库
大数据技术
数仓
建设-架构&建模
数据模型三要素2.2.3数据模型分类,以旅客身份识别为例2.3维度建模工作过程2.3.1数据调研2.3.2数据域划分2.3.3构建总线矩阵2.3.4规范定义2.3.5模型设计2.3.6总结近两年有一部分工作是在
数仓
建模的工作
Walter_Silva
·
2023-04-07 21:48
数据中台
大数据
数据仓库
数据建模
数据仓库原理 - 概念、架构、建模方法
目录1、介绍1.1数据仓库诞生原因1.2数据仓库概述1.3
数仓
的技术实现1.4MPP&分布式架构MPP架构分布式架构MPP+分布式架构1.5常见产品2、架构2.1架构图ETLODSCDMADS2.2ETL
海星?海欣!
·
2023-04-07 21:45
#
大数据-数据仓库
数据仓库
架构
数据库
大数据开发零基础需要学习什么内容?(1)Java、大数据基础
所以也就出现了大数据开发工程师、
数仓
工程师、ETL工程师
程序员老金
·
2023-04-07 16:45
大数据开发
大数据学习
编程语言
大数据
大数据学习
大数据开发
大数据分析
使用maxscale及mha搭建mysql主从同步、读写分离、高可用集群
尝试使用mysql存储部分
数仓
结果,需要满足高可用、读写分离等需求,尝试过mycat、atlas、maxscale这3个代理服务,前两个不适合:mycat:新建数据库需要修改配置参数,这一点对于动态建库的场景很痛苦
吉甫作诵
·
2023-04-07 16:57
大数据
mysql
运维
负载均衡
maxscale
读写分离
数仓
--DW--Hadoop
数仓
实践Case-15-无事实的事实表
无事实的事实表概述在多维数据仓库建模中,有一种事实表叫做“无事实的事实表”。普通事实表中,通常会保存若干维度外键和多个数字型度量,度量是事实表的关键所在。然而在无事实的事实表中没有这些度量值,只有多个维度外键。表面上看,无事实的事实表是没有意义的,因为作为事实表,毕竟最重要的就是度量。但在数据仓库中,这类事实表有其特殊用途。无事实的事实表通常用来跟踪某种事件或者说明某些活动的范围。无事实的事实表可
李小李的路
·
2023-04-07 15:11
电商项目
实战-项目模板-毕业设计
下载地址:
电商项目
实战项目模板、毕业设计-Web服务器文档类资源-CSDN下载├──基于vue电商管理系统.zip└──
电商项目
实战├──10.vuex│├──code││├──vuex-demo2││
coding部落
·
2023-04-07 15:07
项目模板
应用服务
毕业设计
java
web
服务器
servlet
《数据仓库工具箱》读书笔记(一):维度建模初步
第一章数据仓库、商业智能及维度建模初步一、数据仓库与商业智能的目标1、方便地保存数据2、数据一致性3、适应变化4、及时展现数据5、信息安全6、数据权威7、支撑业务二、
数仓
管理者的职责1、理解业务理解用户
kaiker
·
2023-04-07 12:32
【电商
数仓
】
数仓
搭建之明细数据(data warehouse detail -- DWD)层(用户行为数据之曝光、错误日志表、数据加载脚本,业务数据之评价、订单事实表)
文章目录一曝光日志表1思路解析2建表语句3数据导入4查看数据二错误日志表1思路解析2建表语句3数据导入4查看数据三DWD层用户行为数据加载脚本四DWD层业务数据概述五评价事实表(事务型事实表)1分区设计2建表语句3数据导入(1)首日导入(2)每日导入六订单明细事实表(事务型事实表)1分区设计2建模语句3数据导入(1)首日装载(2)每日装载一曝光日志表**曝光日志解析思路:**曝光日志表中每行数据对
OneTenTwo76
·
2023-04-07 10:41
电商数仓
json
sql
java
hadoop
spark
离线电商
数仓
-用户行为采集平台-第3章 用户行为日志
前言本博客是学习记录,可能存在错误,仅供参考。如发现错误,欢迎在评论区指正,我会及时修改。同时也希望大家能在评论区多和我讨论,或者私信我,讨论可以让我们学习效率更高。现在的版本不是最终版本,我会在学习过程中不断地更新。第3章用户行为日志3.1用户行为日志概述埋点:是收集用户的各项行为信息以及行为所处的环境信息的手段分类如下:****代码埋点****是通过调用埋点SDK函数,在需要埋点的业务逻辑功能
书墨客
·
2023-04-07 10:38
数据仓库
数据仓库
大数据
电商项目
实战之缓存与Redis分布式锁
电商项目
实战之缓存与Redis分布式锁缓存失效缓存穿透缓存雪崩缓存击穿分布式缓存分布式锁SpringBoot整合Redisson实现分布式锁实现过程缓存和数据库一致性场景分析解决方案SpringCache
Charles Yan
·
2023-04-07 08:16
Distributed
Microservices
Work
Development
Project
Practice
redis
分布式锁
iOS Swift 秒杀倒计时(日时分秒倒计时)
秒杀倒计时是
电商项目
常用的功能,最近项目里用到,总结一下。效果图(gif播放速度有点问题,实际没这么快)这个效果核心就是Timer的使用以及通过秒数计算出时间字符串。
jzhang
·
2023-04-07 07:58
从Nginx快速认知到LVS+Nginx实现高可用集群
实现高可用集群文章目录从Nginx快速认知到LVS+Nginx实现高可用集群第1章Nginx快速认知1-1集群阶段开篇概述项目演变历程单体初期单体后续单体架构的优点单体架构面临的挑战集群概念举例集群概念举例
电商项目
中使用集群使用集群的优势使用集群注意点
柯柯不会Java
·
2023-04-07 06:01
nginx
nginx
架构的搭建(一)
一、简介从安小说网https://www.sixu.info这次项目是准备做一个
电商项目
,采用当前主流的微服务技术,技术栈是SpringCloudAlibaba,此次设计思路也很简单,当前端服务请求过来时先经过四层负载
damimi00
·
2023-04-07 04:34
数仓
实战|一文看懂数据中台接口数据采集
作者简介:王春波,《高效使用Greenplum:入门、进阶和数据中台》作者,“数据中台研习社”号主,十年数据开发从业者,资深零售
数仓
项目实施专家。
weixin_44166276
·
2023-04-07 01:35
数据仓库
数据库开发
大数据
第3.7章:StarRocks数据导入--Broker Load
一、BrokerLoad背景基于Hadoop生态的传统
数仓
目前仍拥有非常大的用户群体,为此StarRocks加入了BrokerLoad导入方式,让我们可以方便的从HDFS类的外部存储系统(ApacheHDFS
流木随风
·
2023-04-07 01:02
big
data
mysql
分布式
数据库
database
数仓
第二章作业
数仓
第二章作业文章目录
数仓
第二章作业习题习题1、设数据集A=1,1,3,3,4,5,5,5,6
-北天-
·
2023-04-07 01:00
数据仓库与数据挖掘
数据挖掘
数据仓库
数仓
第五章作业
数仓
第五章作业文章目录
数仓
第五章作业一、在OLAP的5个特征FASMI中,那两个是OLAP的关键特性?二、多维数据分析有哪几个基本分析操作?
-北天-
·
2023-04-07 01:00
数据仓库与数据挖掘
数据分析
数据挖掘
python
海睿思分享 | 浅谈
数仓
指标体系管理
//1
数仓
指标的构成❖数据域数据域是统一
数仓
层的顶层划分,是一个较高层次的数据归类标准,是对企业业务过程进行抽象、提炼、组合的集合,面向业务分析,一个数据域对应一个宏观分析领域,比如采购域、供应链域、HR
海睿思
·
2023-04-07 01:53
大数据
数据仓库
数仓指标
数仓
第七章作业
数仓
第七章作业文章目录
数仓
第七章作业一、第七章课后作业第三题第四题第五题第六题第七题二、问题一、第七章课后作业第三题设有10个二元属性,3个数据对象的数据集。
-北天-
·
2023-04-07 01:48
数据仓库与数据挖掘
线性代数
数据仓库
数仓
--Theory--
数仓
数据质量监控
暂时定义为
数仓
的质量管理,完全可以定义为数据中台的质量管理数据质量的理解数据质量的高低代表了该数据满足数据消费者期望的程度,这种程度基于他们对数据的使用预期。
李小李的路
·
2023-04-07 00:25
Flink+Clickhouse在广投集团实时
数仓
的最佳实践
Flink+Clickhouse实时
数仓
在广投集团的最佳实践一、业务背景由于历史原因,大型集团企业往往多个帐套系统共存,包括国内知名ERP厂商浪潮、用友、金蝶、速达所提供的财务系统,集团财务共享中心的财务人员在核对财务凭证数据时经常需要跨多个系统查询且每个系统使用方式不一
Wping_1c08
·
2023-04-06 23:55
Springboot +Mybatis + DynamicDataSource 根据数据库实现数据源配置和切换
DynamicDataSource动态数据源需求:
数仓
项目需要大致检验数据同步的正确性,应用数据库MySQL有多台,
数仓
数据库Postgres数据库一台。
JasonalLy6
·
2023-04-06 23:58
mybatis
数据库
mysql
spring
boot
java
数仓
设计流程规范 2020-05-29
1.系统分析,确定主题确定一下几个因素:·操作出现的频率,即业务部门每隔多长时间做一次查询分析。·在系统中需要保存多久的数据,是一年、两年还是五年、十年。·用户查询数据的主要方式,如在时间维度上是按照自然年,还是财政年。·用户所能接受的响应时间是多长、是几秒钟,还是几小时。2.选择满足数据仓库系统要求的软件平台选择合适的软件平台,包括数据库、建模工具、分析工具等。有许多因素要考虑,如系统对数据量、
迷藏_
·
2023-04-06 17:13
上一页
34
35
36
37
38
39
40
41
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他