E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓电商项目
【新年新姿势第一弹】腾讯云EMR
数仓
建设教程发布——与尚硅谷强强联手带你全方位了解大数据组件
腾讯云开发者社区带着干货来了,腾讯云×尚硅谷大数据研究院强强联手,重磅推出新年第一弹:腾讯云EMR
数仓
教程发布腾讯云开发者社区“公开课”直达:腾讯云开发者公开课-腾讯云开发者社区-腾讯云这套教程由腾讯云官方与尚硅谷大数据研究院联合推出
·
2023-01-06 16:56
大数据
出行平台如何基于 StarRocks 构建实时
数仓
?
首汽约车(以下简称“首约”)是首汽集团为响应交通运输部号召,积极拥抱互联网,推动传统出租车行业转型升级,加强建设交通强国而打造的网约车出行平台。在用车服务方面,包括了即时用车、预约用车、多日接送、包车业务、接送机、国际用车、城际拼车等用车服务场景,提供出租、畅享、舒适、商务、豪华、巴士等丰富车型。首汽约车还通过数据整合和智能科技陆续推出了学生用车、老人用车等产品来满足不同人群的出行需求。随着5G时
·
2023-01-06 16:26
数据库
火山引擎 DataLeap 数据调度实例的 DAG 优化方案
在
数仓
研发中,不同的表之间会存在依赖关系,而产生表数据的任务实例,也会因此存在依赖关系。只有在上游实例运行成功、下游实例到达设定的运行时间且资源充
·
2023-01-06 11:29
大数据数据库
数据仓库的构建
目录一.数据仓库的定义二.
数仓
构建规范2.1
数仓
设计原则2.2数据层次划分2.3
数仓
层次调用规定2.4ODS层规范2.5CDW层规范2.6ADS层规范三.数据仓库构建步骤3.1ODS层3.2CDW层3.3ADS
emPoint
·
2023-01-06 01:54
大数据
平台工具+
数仓
构建数据产品(二)
接:业务
数仓
建模,平台工具+
数仓
构建数据产品01引言滴滴橙心优选主要做社区电商,笔主主要负责电商中商城用户行为数据建设。
数据掘金者
·
2023-01-06 01:54
大数据
数据分析
数据产品
数仓
构建-架构与模型设计
数仓
分层在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(O
胜利的曙光
·
2023-01-06 01:24
数据仓库
阿里云
架构
数据仓库
big
data
离线
数仓
搭建_01_
数仓
概念与项目框架说明
P13)2.0项目需求及架构设计2.1项目需求2.2项目框架2.2.1技术选型2.2.2系统数据流程设计2.2.3框架版本选型2.2.4服务器选型2.2.5集群规模2.2.6集群资源规划设计下文访问:离线
数仓
搭建
Fang GL
·
2023-01-06 01:23
#
离线数仓搭建
数据仓库
数据挖掘
数据库
怎么从0到1构建大厂企业级
数仓
我也没闲着,假期抽空整理了企业级
数仓
建设方案。
大数据兵工厂
·
2023-01-06 01:23
大数据
数据仓库
flink
大数据
数据挖掘
实时
数仓
|基于Flink1.11的SQL构建实时
数仓
探索实践
实时
数仓
主要是为了解决传统
数仓
数据时效性低的问题,实时
数仓
通常会用在实时的OLAP分析、实时的数据看板、业务指标实时监控等场景。
javastart
·
2023-01-06 01:52
flink
数据仓库
实时
数仓
之 Kappa 架构与 Lambda 架构
大家好,我是球球。今天,我们先了解一下数据仓库架构的演变过程,本文主要从五个方面进行介绍数据仓库概念离线大数据架构Lambda架构Kappa架构Lambda架构与Kappa架构的对比1数据仓库概念数据仓库是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。数据仓
智慧化智能化数字化方案
·
2023-01-06 01:22
架构
数据仓库
数据库
简单搞定
数仓
搭建:架构与模型设计(二)
上期引用:https://mp.csdn.net/mp_blog/creation/editor/118491690数据模型目录数据引入层(ODS)数据引入层表设计建表示例数据引入层存储缓慢变化维度明细粒度事实层(DWD)明细粒度事实表设计原则明细粒度事实层(DWD)规范建表示例公共汇总粒度事实层(DWS)公共汇总事实表设计原则公共汇总事实表规范建表示例公共维度汇总层(DIM)定义维度设计维表公共
白枭
·
2023-01-06 01:22
数仓
大数据开发
spark
hive
spark
数据仓库
基于Flink构建全场景实时
数仓
目录:一.实时计算初期二.实时
数仓
建设三.Lambda架构的实时
数仓
四.Kappa架构的实时
数仓
五.流批结合的实时
数仓
实时计算初期虽然实时计算在最近几年才火起来,但是在早期也有部分公司有实时计算的需求,
普通网友
·
2023-01-06 01:22
拔l37
6l32
9O33
数仓
实践:总线矩阵架构设计
如何设计一套切实可行的数据仓库呢?我们要明白,对于数据仓库的设计是不能完全依赖于业务的需求,但往往又必须要服务于业务的价值。因此,在构建数据仓库前,我们往往会通过总线矩阵设计,来快速理解业务并规划数据仓库体系。以求从宏观的角度来描述企业的业务和数据现状,并指导后续的数据仓库建模。不妨先来看看,祖师爷Kimball在书中对总线矩阵的定义:总线矩阵:提供一种分解企业DW/BI规划任务的合理方式,行是业
云 祁
·
2023-01-06 01:51
数仓实践
数据仓库
java
人工智能
大数据
python
数仓
构建维表--行政区域维度表的构建
前言为啥子要花时间搞这个呢?就是写sql的时候,想要一个省市区维表,在网上找啊找啊找,不是要钱,就是要C币,或者就是别的,竟然没有公益的,共享一下不好吗?太抠了,今天我来分享一个,哈哈...搞个维表很简单de呦,下面说一下我做的方法:咱也用把(3W)方法来进行分析下。获取行政区域数据What?行政区域数据是什么呢?其实就是国,省(自治区),市,区县,镇/街道,街、路、巷等区域地址信息。Why?为什
MrZhangBaby
·
2023-01-06 01:51
谈笑间学会数据仓库
大数据
谈笑间学会大数据
行政区域数据
行政区域维表设计
数仓构建维表
数仓
构建准备
1、数据集市和数据仓库的区别1、数据集市通常来说,
数仓
的构建会从整个企业的业务作为出发点,自上而下的进行构建,但这种方式因为涉及到多部门业务,难度较大。
月暖.如梵音
·
2023-01-06 01:21
数仓项目
数据仓库
4种数据仓库建模方法
4种数据仓库建模方法1数据仓库的前世今生
数仓
建模的目的是什么?
JaquanC
·
2023-01-05 22:23
数仓学习专栏
数据仓库
数据库
big
data
大数据
基于Delta Lake构建数据湖仓体系
全文将围绕以下四个部分展开:DeltaLake的基本概念和发展历程,以及2.0版本的关键特性DeltaLake的内核解析以及关键技术围绕DeltaLake湖格式的生态建设DeltaLake在
数仓
领域的经典案例
·
2023-01-05 18:29
后端大数据数据结构
直播 | StarRocks 联合腾讯云分享 EMR-StarRocks 的降本增效之路
用户无需将数据导入到StarRocks中,无需构建昂贵的
数仓
,即可实现亚秒级的查询速度,统一分析离线和实时数据,全面发挥湖仓架构的潜在优势。
·
2023-01-05 18:26
数据库
火山引擎工具技术分享:用 AI 完成数据挖掘,零门槛完成 SQL 撰写
同时,对于专业
数仓
团队来说,相同主题的数据内容面临“重复建设,使用和管理时相对分散”的问题——究竟有没有办法在一个任务里同时生产,同主题不同内容的
·
2023-01-03 19:47
大数据bi
复杂查询响应速度提升10+倍,度言软件基于 Apache Doris 实时
数仓
建设实践
作者|杭州度言软件大数据团队杭州度言软件有限公司(度言软件)成立于2014年,是信贷不良资产处置技术服务供应商,以“智能科技赋能不良资产处置,推动贷后行业合规高效发展”为使命,运用云通讯、大数据、人工智能等智能科技为信贷不良资产处置业务赋能,提供贷后管理通信能力支撑,实现了催收作业的智能化管理,客户群体为银行、消费金融公司、AMC等金融机构和为这些机构提供人力资源外包服务的相关公司,目前已拥有20
·
2023-01-03 19:47
536. 迎风飞扬,回顾2022,展望2023
首先一定要说的就是云技术,一个是openstack、另一个是kubernetes,公司云
数仓
产品
七镜
·
2023-01-02 06:57
SS00021.PBpositions——|Hadoop&PB级离线
数仓
.v03|——|Atlas.v03|Atlas与电商业务集成|血缘关系|
一、与电商业务集成###---电商业务集成环境准备~~~开发(建库、建表)=>导入数据=>执行Hive脚本~~~导入Hive的血缘关系二、电商业务建表###---电商业务建表语句(可省略):~~~#创建DataBases;CREATEDATABASEODS;CREATEDATABASEDIM;CREATEDATABASEDWD;CREATEDATABASEDWS;CREATEDATABASEADS
yanqi_vip
·
2022-12-31 16:39
大数据
hadoop
hive
mysql
python
离线
数仓
17—— Superset可视化
第1章Superset入门1.1Superset概述ApacheSuperset是一个现代的数据探索和可视化平台。它功能强大且十分易用,可对接各种数据源,包括很多现代的大数据分析引擎,拥有丰富的图表展示形式,并且支持自定义仪表盘。1.2环境说明本课程使用的服务器操作系统为CentOS7,Superset对接的数据源为MySQL数据库。第2章Superset安装Superset官网地址:http:/
就是这个范~
·
2022-12-31 16:09
离线数仓
python
linux
开发语言
CC00031.bdpositions——|Hadoop&实时
数仓
.V11|——|项目.v11|DWD层处理|数据仓库层数据处理.V1|
一、DW层处理###---DW层处理~~~DW(DataWarehouse数据仓库层)。~~~包含DWD、DWS、DIM层,由ODS层数据加工而成。主要完成数据加工与整合,~~~建立一致性的维度,~~~构建可复用的面向分析和统计的明细事实表,~~~以及汇总公共粒度的指标。~~~DWD(DataWarehouseDetail细节数据层),是业务层与数据仓库的隔离层。~~~以业务过程作为建模驱动,基于
yanqi_vip
·
2022-12-31 16:09
数据仓库
impala
aof
数学建模
数据建模
离线
数仓
07—— 数据仓库设计
章数据仓库设计5.1数据仓库分层规划5.2数据仓库构建流程5.2.1数据调研5.2.2明确数据域5.2.3构建业务总线矩阵5.2.4明确统计指标5.2.5维度模型设计5.2.6汇总模型设计上一篇:离线
数仓
就是这个范~
·
2022-12-31 16:38
离线数仓
数据仓库
离线
数仓
总结
离线
数仓
总结一、1、背景介绍(某APP上线后,由于业务模式新颖,市场需求量大,经过一段时间的精心运营后,逐渐积累起了上千万会员,以及三四百万的日活量,app的业务功能和产品种类、数量也急速膨胀;主要问题有
wywwyx090104
·
2022-12-31 16:38
总结
笔记
案例
大数据
kafka
hadoop
spark
hive
离线
数仓
01——概念与设计思路
文章目录第1章数据仓库概念第2章项目需求及架构设计2.1项目需求分析2.2项目框架2.2.1技术选型2.2.2系统数据流程设计2.2.3框架版本选型2.2.4服务器选型2.2.5集群资源规划设计下一篇:离线
数仓
就是这个范~
·
2022-12-31 16:08
离线数仓
数据仓库
数据库
离线
数仓
10——
数仓
开发之ODS层
文章目录第7章
数仓
开发之ODS层7.1日志表7.2业务表7.2.1活动信息表(全量表)7.2.2活动规则表(全量表)7.2.3一级品类表(全量表)7.2.4二级品类表(全量表)7.2.5三级品类表(全量表
就是这个范~
·
2022-12-31 16:08
离线数仓
hadoop
hive
大数据
离线
数仓
12——
数仓
开发之DWD层
文章目录第9章
数仓
开发之DWD层9.1交易域加购事务事实表9.2交易域下单事务事实表9.3交易域取消订单事务事实表9.4交易域支付成功事务事实表9.5交易域退单事务事实表9.6交易域退款成功事务事实表9.7
就是这个范~
·
2022-12-31 16:08
离线数仓
hive
大数据
数据库
浅谈
数仓
模型(维度建模)
数仓
架构的原则:1、底层业务的数据驱动为导向同时结合业务需求驱动2、便于数据分析屏蔽底层复杂业务简单、完整、集成的将数据暴露给分析层3、底层业务变动与上层需求变动对模型冲击最小化业务系统变化影响削弱在基础数据层
公众号:肉眼品世界
·
2022-12-31 16:37
大数据
编程语言
数据库
人工智能
数据分析
数据查询和业务流分开_滴滴实时
数仓
逐层剖解:实时与离线数据误差<0.5%
原标题:滴滴实时
数仓
逐层剖解:实时与离线数据误差<作者介绍潘澄,资深软件开发工程师。负责实时数据仓库建设,多年数据相关工作经验,专注数据建模、数据仓库、实时数据技术等领域。朱峰,高级软件开发工程师。
weixin_39733812
·
2022-12-31 16:07
数据查询和业务流分开
离线
安装
xfonts-utils
阿里云DataWorks学习——
数仓
架构设计
(一)技术架构选型在数据模型设计之前,您需要首先完成技术架构的选型。本教程中使用阿里云大数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。MaxCompute作为整个大数据开发过程中的离线计算引擎。DataWorks则包括数据开发、数据质量、数据安全、数据管理等在内的一系
zhisheng_blog
·
2022-12-31 16:36
数据仓库
大数据
dbcp
数据分析
odbc
离线
数仓
搭建_07_
数仓
建模理论
点击右下方:专栏目录查看全文文章目录第三部分:数据仓库系统8.0
数仓
分层1.1为什么要分层1.2数据集市与数据仓库概念1.3
数仓
命名规范1.3.1表命名1.3.2脚本命名1.3.3表字段类型9.0
数仓
理论
Fang GL
·
2022-12-31 16:35
#
离线数仓搭建
数据仓库
hive
hadoop
离线电商
数仓
建模学习笔记
1.数据仓库概述1.1数据仓库概念数据仓库是一个为数据分析而设计的企业级数据管理系统。数据仓库可集中、整合多个信息源的大量数据,借助数据仓库的分析能力,企业可从数据中获得宝贵的信息进而改进决策。同时,随着时间的推移,数据仓库中积累的大量历史数据对于数据科学家和业务分析师也是十分宝贵的。1.2数据仓库核心架构2.数据仓库建模概述2.1数据仓库建模的意义如果把数据看作图书馆里的书,我们希望看到它们在书
阳宝宝的向日葵
·
2022-12-31 16:05
大数据
学习
数据仓库
数据挖掘
离线
数仓
搭建_11_DWD层用户行为日志创建
文章目录13.0
数仓
搭建-DWD层13.1DWD层(用户行为日志)13.1.1日志解析思路13.1.2get_json_object函数使用13.1.3启动日志表13.1.4页面日志表13.1.5动作日志表
Fang GL
·
2022-12-31 16:05
#
离线数仓搭建
大数据
数据仓库
SQL
离线数据仓库
离线
数仓
(九) ---------
数仓
理论
目录一、范式理论1.范式概念2.函数依赖3.三范式区分二、关系建模与维度建模1.关系建模2.维度建模三、维度表和事实表(重点)1.维度表2.事实表四、维度模型分类1.星型模型2.雪花模型3.星座模型4.模型的选择五、数据仓库建模1.ODS层2.DIM层和DWD层3.DWS层与DWT层4.ADS层一、范式理论1.范式概念定义数据建模必须遵循一定的规则,在关系建模中,这种规则就是范式。目的采用范式,可
在森林中麋了鹿
·
2022-12-31 16:34
大数据项目
1024程序员节
hadoop
数据仓库
离线
数仓
11——
数仓
开发之DIM层
文章目录第8章
数仓
开发之DIM层8.1商品维度表8.2优惠券维度表8.3活动维度表8.4地区维度表8.5日期维度表8.6用户维度表8.7数据装载脚本8.7.1首日装载脚本8.7.2每日装载脚本上一篇:离线
数仓
就是这个范~
·
2022-12-31 16:01
离线数仓
数据库
大数据
python
ETL过程中数据清洗(脏数据处理)小结
但凡你真正的做过
数仓
,我认为这些都是轻车熟路的,因为这是数据研发的必经之路我在对候选人进行考察的时候,也经常会问到这个问题,主要是看一下候选人有没有真实工作经验,然后在开发过程中有没
派可数据BI可视化
·
2022-12-31 10:26
数据库
big
data
电商离线
数仓
项目-DWD层ETL数据清洗,最大亮点之自定义UDF函数
ODS层所得到的数据,是最原始的数据,保持原貌,不做任何的改变,例如id:1name:zhangsan类型字段加上字段值。在导入DWD层的时候,我们要对这个数据做处理,只取到value值,去除字段的名称。这里面用到UDF(一进一出)和UDTF(一进多出)。展示一条最初始的数据:这条数据,红色框起来的部分是基本字段对应一对一出。而蓝色框起来的部分是一进多出。所要的格式如下:要对获取到的日志数据进行处
梦里Coding
·
2022-12-31 10:55
Hive
hive
maven
big
data
FFA 2022 主会场 Keynote:Flink Towards Streaming Data Warehouse
本篇内容主要分为四个部分:实时流计算全球范围事实标准2022数据实时化技术创新不止StreamingDataWarehouse流式
数仓
DemoTips:点击「阅读原文」查看原文视频&演讲ppt01实时流计算全球范围事实标准
Apache Flink
·
2022-12-30 22:52
flink
大数据
人工智能
智能湖仓架构实践:利用 Amazon Redshift 的流式摄取构建实时
数仓
AmazonRedshift是一种快速、可扩展、安全且完全托管的云数据仓库,可以帮助用户通过标准SQL语言简单、经济地分析各类数据。相比其他任何云数据仓库,AmazonRedshift可实现高达三倍的性能价格比。数万家客户正在借助AmazonRedshift每天处理EB级别的数据,借此为高性能商业智能(BI)报表、仪表板应用、数据探索和实时分析等分析工作负载提供强大动力。我们很激动地为Amazon
亚马逊云开发者
·
2022-12-30 17:59
架构
数据仓库
数据库
亚马逊云科技智能湖仓架构实践:利用Amazon Redshift的流式摄取构建实时
数仓
AmazonRedshift是一种快速、可扩展、安全且完全托管的云数据仓库,可以帮助用户通过标准SQL语言简单、经济地分析各类数据。相比其他任何云数据仓库,AmazonRedshift可实现高达三倍的性能价格比。数万家客户正在借助AmazonRedshift每天处理EB级别的数据,借此为高性能商业智能(BI)报表、仪表板应用、数据探索和实时分析等分析工作负载提供强大动力。我们很激动地为Amazon
m0_72973530
·
2022-12-30 17:28
其他
数据仓库理论知识
数据仓库1.1
数仓
基础知识1.1.1.为什么要有数据仓库通常数据仓库的数据来自各个业务应用系统。
南潇如梦
·
2022-12-30 16:25
大数据那些事
大数据
数据库开发
数据库
数据仓库
关于电商商品的SPU-SKU模型
文章目录一.问题背景二.SPU和SKU三.SPU与SKU的区别一.问题背景公司做
电商项目
,数据库表设计采用分库,关于商品的表涉及到了spu、sku的概念。
Android_la
·
2022-12-30 11:43
解决方案
电商
SPU
SKU
青软集团产业项目集:基于Flink+Kylin+Druid的商业智能实时
数仓
决策平台项目
随着大数据、人工智能、工业互联网等新兴技术的发展,传统产业数字化转型的不断深化,相关企业更加迫切地需要理解产业、具备技术和工程实践等能力的高素质数字化人才。基于真实产业需求,青软面向商业BI、航空、智能交通、社会舆情、能源、医药服务等领域,引入适用于高校人才培养的项目资源,构建于U+新工科智慧云平台上,助力高校培育复合型应用人才。本期,我们将介绍企业级真实案例——《基于Flink+Kylin+Dr
QST青软集团
·
2022-12-30 11:38
数据挖掘
数据仓库
大数据
B站基于Iceberg+Alluxio助力湖仓一体项目落地实践
当前B站急需一套技术架构,在拥有数据湖灵活性的同时又具备
数仓
的高效性,在这样的背景之下开始探索
Alluxio
·
2022-12-30 09:57
Alluxio技术与实践
大数据
hadoop
hive
分布式
数据仓库
SpringCloud Alibaba 实战,来自尚硅谷
电商项目
理解
电商项目
常见解决技术搭配方案:SpringCloudAlibaba--nacos:注册中心SpringCloudAlibaba--nacos:配置中心SpringCloud--Ribbon:负载均衡SpringCloud
明明在学JAVA
·
2022-12-30 05:18
Java相关学习
SpringCloud学习
日常学习笔记
java
spring
boot
springcloud
nacos
实时写入场景的用户痛点
实时写入场景的用户痛点SQL开发工作量大对于一些还没有完成
数仓
建设的新业务,或是刚刚开始依托StarRocks进行OLAP平台建设的用户而言,在StarRocks中建表以承载Mysql同步过来的数据是第一步
feidodo网络
·
2022-12-30 05:13
mysql
数据库
数据导入实践和调优
初期数据源主要来自Hive
数仓
,因此大部分数据导入以BrokerLoad方式为主。
feidodo网络
·
2022-12-30 05:43
大数据
hive
hadoop
2022博客之星年度总评选开始了
、CSDN内容合伙人、Java领域优质作者、Java领域新星作者、51CTO专家、华为云专家、阿里云专家等陶然同学由陶然同学原创,首发于CSDNJava试题专栏推荐:面试宝典专栏有每个阶段Java专栏
电商项目
项目
陶然同学
·
2022-12-30 03:14
其他
java
前端
javascript
博客之星
上一页
46
47
48
49
50
51
52
53
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他