E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓电商项目
数仓
建模分层理论
数仓
的建模或者分层,其实都是为了更好的去组织、管理、维护数据,所以当你站在更高的维度去看的话,所有的划分都是为了更好的管理。小到JVM内存区域的划分,JVM中堆空间的
陈二狗想吃肉
·
2023-10-18 13:49
精彩回顾 | Apache Flink Meetup · 北京站(附PPT下载)
9月21日下午,2019年度最后一场Meetup在帝都圆满落幕,来自阿里巴巴、小米、贝壳找房的资深专家们现场分享了小米的Flink应用实践、贝壳找房的实时
数仓
建设、Flink资源管理机制以及FlinkPythonAPI
Apache Flink
·
2023-10-18 11:46
数仓
建设(三)
4)累积快照事实表多个业务过程联合分析而构建的事实表,如采购单的流转环节。用于分析事件时间和时间之间的间隔周期。少量的且当前事务型不支持的,如关闭、发货等相关的统计。4.DWS公共汇总层设计规范数据仓库的性能是数据仓库建设是否成功的重要标准之一。聚集主要是通过汇总明细粒度数据来获得改进查询性能的效果。通过访问聚集数据,可以减少数据库在响应查询时必须执行的工作量,能够快速响应用户的查询,同时有利于减
未来在这儿
·
2023-10-18 06:10
数仓
大数据
数据库
数据仓库
数仓
建设(一)
想了想,我们的
数仓
的建设是基于大数据平台进行的,中间也经历了比较曲折的过程。每个行业都有自身的业务区别,不过很多还是比较相通的。
未来在这儿
·
2023-10-18 06:39
数仓
BigData
SQL
java
大数据
开发语言
数据仓库
数仓
建设(二)
1)指标梳理指标口径的不一致使得数据使用的成本极高,经常出现口径打架、反复核对数据的问题。在数据治理中,我们将需求梳理到的所有指标进行进一步梳理,明确其口径,如果存在两个指标名称相同,但口径不一致,先判断是否是进行合并,如需要同时存在,那么在命名上必须能够区分开。2)指标管理指标管理分为原子指标维护和派生指标维护。原子指标:选择原子指标的归属产线、业务板块、数据域、业务过程选择原子指标的统计数据来
未来在这儿
·
2023-10-18 06:32
数仓
java
前端
数据库
BI工具-DataEase(2) 基础使用
先讲下工具栏,分别是仪表盘,数据集,数据源,模板市场等等.和大多数的BI工具一样,首先配置的就是数据源1.数据源:支持OLTP,OLAP,
数仓
/数据湖,我们这边还是使用的mysql新建mysql数据源,
大曲·蜗牛
·
2023-10-17 18:53
大数据
基于大模型的数据血缘异常归因分析
本期黑客松共吸引了近50位选手参赛,有的在实时
数仓
领域显神通,有的则再次请出了大模型。这些小组都有个共同点——基于数据云平台DataSimba的元数据域“搞事情”。
奇点云
·
2023-10-17 13:49
奇点云
元数据
黑客马拉松
Flume 整合 Kafka
以实时流处理项目为例,由于采集的数据量可能存在峰值和峰谷,假设是一个
电商项目
,那么峰值通常出现在秒杀时,这时如果直接将Flume聚合后的数据输入到Storm等分布式计算框架中,可能就会超过集群的处理能力
shangjg3
·
2023-10-17 10:29
大数据ETL实战
flume
kafka
大数据
2023年-
数仓
-【时间维度表】-年、周、节假日
建表语句,如下:DROPTABLEIFEXISTSdim_date_info;CREATEEXTERNALTABLEdim_date_info(`date_id`STRINGCOMMENT'日',`week_id`STRINGCOMMENT'周ID',`week_day`STRINGCOMMENT'周几',`day`STRINGCOMMENT'每月的第几天',`month`STRINGCOMMEN
IT小强哥
·
2023-10-17 05:25
数据库
大数据
mysql
hive
scala项目创建
答:实时
数仓
却不了spark,spark离不开scala、也就是你也是不学习spark也就不用学习scala,因为有其他编程语言可以代替它。2、特点答:1)是一门多范式语言,支持面向对象和函数式编程。
鱼得三金
·
2023-10-16 20:02
程序猿
scala
big
data
数仓
建设规范说明书
通过
数仓
架构设计、
数仓
模型设计、
数仓
开发规范、数据质量规范这四个⽅⾯对整体
数仓
建设做好规范化的指导。⾯向数据开发团队、数据产品团队、前后端团队等与
数仓
数据有关⼈员。
贾斯汀玛尔斯
·
2023-10-16 18:39
hadoop
数据湖
大数据
分布式
hadoop
「
数仓
建设」主题域划分
大家好,本篇聊一下
数仓
建设,讲一下面试常遇到的主题域与主题划分,更多精彩文章优先从微信公众号《大数据阶梯之路》首发,欢迎关注,公众号回复:大数据
数仓
资料,可以获取大数据
数仓
相关学习资料。
大数据阶梯之路
·
2023-10-16 12:38
java spark 消费kafka_spark streaming消费kafka数据写入hdfs避免文件覆盖方案(java版)
1.写在前面在sparkstreaming+kafka对流式数据处理过程中,往往是sparkstreaming消费kafka的数据写入hdfs中,再进行hive映射形成
数仓
,当然也可以利用sparkSQL
吴羽舒
·
2023-10-16 11:40
java
spark
消费kafka
使用Python创建faker实例生成csv大数据测试文件并导入Hive
数仓
文章目录一、Python生成数据1.1代码说明1.2代码参考二、数据迁移2.1从本机上传至服务器2.2检查源数据格式2.3检查大小并上传至HDFS三、beeline建表3.1创建测试表并导入测试数据3.2建表显示内容四、csv文件首行列名的处理4.1创建新的表4.2将旧表过滤首行插入新表一、Python生成数据1.1代码说明这段Python代码用于生成模拟的个人信息数据,并将数据保存为CSV文件。
程序终结者
·
2023-10-16 06:56
Hadoop生态
python
hive
大数据
数据仓库
notepad++正则匹配使用笔记
主要是在对Mysql的ddl语句进行建立
数仓
表的时候,一些正则替换操作的记录;1、正则匹配既有数字,又有字母:结果:如果要对括号进行匹配,就需要一个反斜杠进行转译;2、对非逗号的字符进行替换(目的是不要
靓仔写sql
·
2023-10-15 22:29
正则表达式
【大数据】Apache Hive
数仓
(学习笔记)
一、数据仓库基础概念1、
数仓
概述数据仓库(
数仓
、DW):一个用于存储、分析、报告的数据系统。OLAP(联机分析处理)系统:面向分析、支持分析的系统。
rexhao_wmh
·
2023-10-15 15:36
大数据
apache
hive
新建微服务模块Maven子工程
下面以常用的
电商项目
举例新建Maven子工程,
电商项目
一般包含商品微服务,订单微服务,支付微服务,账户微服务等,我们的整体规划是将
电商项目
作为一个整体的微服务Maven父工程,商品微服务,订单微服务,支付微服务
全栈程序猿
·
2023-10-15 12:37
Linux环境
maven
java
intellij-idea
新一代大数据技术:构建PB级云端
数仓
实践
在数据大爆炸时代,随着企业的业务数据体量的不断发展,半结构化以及无结构化数据越来越多,传统的数据仓库面临重大挑战。通过以Hadoop,Spark为代表的大数据技术来构建新型数据仓库,已经成为越来越多的企业应对数据挑战的方式。本期极客说邀请了来自腾讯云大数据基础团队负责人,大数据技术专家堵俊平来为我们分享介绍大数据领域最近的技术趋势,包含介绍Hadoop与Spark技术的最新进展。通过一些实际的应用
腾讯云开发者
·
2023-10-14 23:07
Flink1.11.0 SQL与hive整合
一、前言此次flinksql整合hive主要是能在flinksql中读写hive数据,为flink实时写数据进入hive构建实时
数仓
做准备工作。
天涯到处跑
·
2023-10-14 17:58
数仓
开发:相似表结构通用更新函数
数仓
一、需求描述二、Oracle代码实现三、Mysql代码实现一、需求描述在
数仓
开发中,可能会遇到这样的需求:
数仓
多层之前要进行merge操作,有多少张表进行多少次merge,针对这种通用的merge操作
我爱夜来香A
·
2023-10-14 15:14
数据库开发
java
数据库
开发语言
数据仓库DW-理论知识储备
数仓
分层数据仓库中的数据一般经过一下几层处理:参考来自1.ODSODS主要完成:(1)保持数据原貌不做任何修
躺着听Jay
·
2023-10-14 09:37
大数据
大数据
数仓
面试题(1)
1.数据库的三范式是什么?答:第一范式(1NF)强调的是列的原子性,即列不能够再分成其他几列。第二范式(2NF)第二范式在第一范式的基础之上更进一层。第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中。第三范式(3NF)第三范式需要确保数据表中的每一列数据都
Young_IT
·
2023-10-13 14:16
大数据开发
数据仓库
大数据
nginx(OpenResty)+lua+redis实现缓存预热或二级缓存查询
nginx(OpenResty)+lua+redis实现缓存预热或二级缓存查询在
电商项目
中可以用来处理广告的缓存编写lua脚本实现缓存预热(将mysql里的数据查询出来存入redis)图解:编写lua脚本实现二级缓存读取图解
codingTop
·
2023-10-13 14:22
SpringCloud
SoringBoot
java
nginx
lua
redis
OLAP
数仓
入门:进阶篇
文章作者:温正湖网易易数内容来源:数据库内核@知乎专栏导读:前一篇文章从OLTP出发,通过对比引出OLAP,进一步介绍了
数仓
的基本概念,包括多维数据模型、数据立方体及其典型操作等。
浪尖聊大数据-浪尖
·
2023-10-13 06:34
数据仓库
hadoop
数据库
大数据
编程语言
hadoop
人工智能
利用Flink(1.17)滚动窗口实时统计Apache Doris审计日志
背景及需求:目前生产环境开放给其他业务组后,需要实时统计各业务组访问
数仓
(ApacheDoris)频次,分析异常请求用户,做到实时监控及提前预警,同时针对慢查询日志,要留存分析原因,降低慢查询带来的负影响
码猿小站
·
2023-10-12 19:03
flink
Doris
java
apache
flink
大数据
big
data
flink-2
实时
数仓
项目第1章分层设计在之前介绍实时
数仓
概念时讨论过,建设实时
数仓
的目的。主要是增加数据计算的复用性。每次新增加统计需求时,不至于从原始数据进行计算,而是从半成品继续加工而成。
不爱吃鱼的馋猫
·
2023-10-12 19:02
flink
Hudi 系列-基础概念-索引机制
FlinkSpark总结前言Hudi系列文章在这个这里查看https://github.com/leosanqing/big-data-study索引(Index)是Hudi最重要的特性之一,也是区别于之前传统
数仓
别惹猪儿虫
·
2023-10-12 18:38
Hudi
大数据
大数据
hudi
Java
01*环境搭建*【Vue+DjangoRestFramework框架】生鲜
电商项目
1.安装虚拟环境pip3installvirtualenv2.创建文件夹virtualenvtestvir3.进入虚拟环境cdtestvir4.创建虚拟环境makevirtualenv-ppython3.6.exe路径VueShop5.需要安装的包有许多,先把前期一部分需要安装的包安装。pipinstalldiangorestframework(安装diangorestframework)pipi
可爱多小姐
·
2023-10-12 13:43
实战:微信小程序
电商项目
介绍学习视频来源SpringBoot微信小程序电商实战项目课程Vue3.2ElementPlus后台管理(火爆连载更新中…)_哔哩哔哩_bilibili技术栈介绍本套课程采用主流技术栈实现,Mysql数据库,SpringBoot2+MybatisPlus后端,微信小程序原生实现,Vue3.2+ElementPlus实现后台管理。基于JWT技术实现前后端分离。微信小程序端涵盖了axios异步请求,P
Zaughter
·
2023-10-12 13:03
微信小程序
notepad++
小程序
Flink CDC 系列 - 实现 MySQL 数据实时写入 Apache Doris
▼关注「ApacheFlink」视频号,遇见更多大咖▼摘要:本文通过实例来演示怎么通过FlinkCDC结合Doris的FlinkConnector实现从Mysql数据库中监听数据并实时入库到Doris
数仓
对应的表中
Apache Flink
·
2023-10-12 10:28
大数据
数据库
mysql
java
hadoop
博文推荐|Flink CDC 结合 Doris Flink Connector 实现MySQL数据实时入Apache Doris
本文通过实例来演示怎么通过FlinkCDC结合Doris的FlinkConnector实现从MySQL数据库中监听数据并实时入库到Doris
数仓
对应的表中。
ApacheDoris
·
2023-10-12 10:54
数据库
大数据
hadoop
mysql
java
【Doris】Flink CDC 结合 Doris Flink Connector 实现MySQL数据实时入Apache Doris
本文通过实例来演示怎么通过FlinkCDC结合Doris的FlinkConnector实现从MySQL数据库中监听数据并实时入库到Doris
数仓
对应的表中。
九层之台起于累土
·
2023-10-12 10:48
【Doris】
【BigData】
flink
mysql
apache
数据仓库
大数据
基于Vue+Vuex+Vue-Router+axios+mint-ui的移动端
电商项目
第一步:安装Node1、打开NodeJS的官网,下载和自己系统相配的NodeJS的安装程序,包括32位还是64位一定要选择好,否则会出现安装问题。下载地址:https://nodejs.org/en/download/我选择的是Window版本64位的安装程序,也有MAC平台的安装程序。下载完成,如图:2、接下来就是安装了,安装很简单,直接下一步下一步就可以,但是我也把流程记录下来,给第一次看本教
weixin_30808575
·
2023-10-12 09:40
ui
webpack
json
ViewUI
6个步骤实现-
数仓
数据只加工一次・《数据中台》课程总结
备注:文章内容借鉴了郭忆老师《数据中台》课程,想了解更多可以看这个课程哈、目录:一、元数据1、数据字典2、数据血缘3、数据特征二、指标管理1、如何规范化定义指标三、数据模型1、我建模的方法2、理想的
数仓
模型设计应该具备的因素
夜希辰
·
2023-10-12 01:20
余老师带你学习大数据框架全栈第十三章Hudi第一节核心技术
1.前言1.1为什么产生数据湖数据量比较大,越来越不满足处理结构化的数据,比如说
数仓
,
数仓
就是处理结构化数据。
weixin_45810046
·
2023-10-11 20:55
hudi
数据湖
数据湖系列(1) - Hudi 核心功能原理剖析
随着互联网业务的逐步成熟,
数仓
和模型训练的基本盘逐步稳固,越来越多的工程师从业务开发需求转移到了工程的架构升级,而常用的Hudi和Iceberg往往会成为替代Hive/Hdfs等架构升级的选型。
小晨说数据
·
2023-10-11 20:49
大数据
数据库
python
java
spark
实施运维面试题
为什么要用
数仓
数据仓库是一种分析数据库,用于存储和处理数据,以便对数据进行分析。数据仓库有两个主要功能:存储分析数据和处理分析数据。
Geneartion_Z
·
2023-10-11 18:44
linux
数据库
运维
hadoop
大数据
Mall脚手架总结(四) —— SpringBoot整合RabbitMQ实现超时订单处理
前言在
电商项目
中,订单因为某种特殊情况被取消或者超时未支付都是比较常规的用户行为,而实现该功能我们就要借助消息中间件来为我们维护这么一个消息队列。
荔枝当大佬
·
2023-10-11 18:52
项目学习
#
RabbitMQ
rabbitmq
分布式
死信队列
spring
boot
java-rabbitmq
高频时序数据仓库
针对市场上高频行情数据处理业务的相关痛点,直观的在线演示如何通过天软高频
数仓
及高性能计算能力,将其逐个击破,期待各位老师的参会。
Tinysoft_SH
·
2023-10-11 16:24
大数据
数据库
数据库开发
数据库架构
数据仓库
为何需要重新编译过的hive
3.安装好后可按如下命令查看hive兼容的spark总结前言大数据生态各个组件之间存在兼容性问题,假如您想从事大数据开发相关工作,那么后续很有可能会做离线
数仓
的项目,而在搭建
数仓
环境时会用到spark,
博嘁东
·
2023-10-11 14:18
hive
spark
big
data
前端-Vue-element-开发指南
电商管理系统框架Vue-element电商管理系统电商管理系统框架1介绍了解项目实战的学习目标2
电商项目
基本业务概述3后台管理系统功能划分4项目开发模式技术选型5项目初始化可视化面板配置6配置码云SSH7
amingMM
·
2023-10-11 08:24
vue.js
前端
javascript
基于ClickHouse的用户行为(路径)分析实践
在我们的体系中,ClickHouse定位点击流
数仓
,所以下面举几个用它来做用户行为(路径)分析的实战例子,包括:路径匹配智能路径检测有序漏斗转化用户留存Session
LittleMagic
·
2023-10-11 01:06
该如何设计
数仓
的汇总层(DWS)
数据建模,毫无疑问是
数仓
建设的重中之重,然后,在实际的开发过程中,会把大量的时间都投入到了需求开发,往往会忽略数据建模(尤其是DWS层的建模),长此以往,数据模型变的越来越杂乱,指标口径无法统一,造成的结果就是
大数据技术与数仓
·
2023-10-10 23:28
数据仓库,Hive中使用 != 或 <>符号进行条件过滤时的坑
事情经过是这样的,我在把业务系统数据同步到
数仓
(数据存储在Hive)中时,在数据汇总层(DWS),对数据进行汇总处理时,发现有数据丢失的问题,经过排查,发现是在使用致命陷阱业务场景:把业务数据抽到ODS
雾岛与鲸
·
2023-10-10 19:51
hive
数据仓库
hive
hadoop
MPP和hadoop
特别是在企业数据仓库建设中,MPP架构与Hadoop架构代表两类典型的技术路线选型,事实上,在2015年左右甚至有人认为基于Hadoop体系的
数仓
将彻底取代基于MPP数据库的
数仓
。
方璧
·
2023-10-10 18:03
hadoop
大数据
分布式
什么是URL采集工具?URL采集工具(MsrayPlus)可以做什么?
数据采集的概念数据采集就是从海量的数据中,将数据采集到自己的
数仓
进行二次处理大数据时代,我们需要灵活迅速地抓取网页上散乱分布的数据信息,
Delusion
·
2023-10-10 16:07
msray
大数据
数据挖掘
数据库
日常学习记录随笔-大数据之日志(hadoop)收集实战
数据收集(nginx)--->数据分析--->数据清洗--->数据聚合计算---数据展示可能涉及到zabix做任务调度我们的项目电商日志分析比如说我们现在有一个系统,我们的
数仓
建立也要有一个主题我这个项目是什么我要干什么定义方向对用户进行分析
一个诺诺前行的后端程序员
·
2023-10-10 13:23
大数据
学习
hadoop
通过
电商项目
,详解抓包到接口测试,附图片验证码 +cookie 问题处理!
一、背景通常来说,进行接口测试,开发会提供对应的接口文档给到测试,但也有例外。开发无接口文档,但领导又需要你对刚开发的软件,进行接口测试、接口自动化测试、甚至是性能测试。这个时候作为专业测试应该怎么办?通过抓包工具获取接口信息,利用工具调通接口,接口信息不明确跟开发沟通,再进行接口测试,完美解决!二、抓包获取接口信息主流的抓包工具有Fiddler、Charles,如果是网站项目可用浏览器F12开发
测试涛叔
·
2023-10-09 18:09
软件测试
技术分享
selenium
测试工具
软件测试
Flink+Doris 实时
数仓
Flink+Doris实时
数仓
Doris基本原理Doris基本架构非常简单,只有FE(Frontend)、BE(Backend)两种角色,不依赖任何外部组件,对部署和运维非常友好。
不二人生
·
2023-10-09 04:42
#
Doris
flink
大数据
数据仓库——分层原理
目录一、什么是数据仓库二、
数仓
建模的意义,为什么要对数据仓库分层?
纠结安然猿
·
2023-10-08 23:05
数据仓库
数据库
大数据
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他