E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓模型设计
DDD之实体与值对象
与传统数据
模型设计
优先不同,
风神.NET
·
2023-10-13 05:32
架构
领域驱动设计
DDD
领域驱动设计
利用Flink(1.17)滚动窗口实时统计Apache Doris审计日志
背景及需求:目前生产环境开放给其他业务组后,需要实时统计各业务组访问
数仓
(ApacheDoris)频次,分析异常请求用户,做到实时监控及提前预警,同时针对慢查询日志,要留存分析原因,降低慢查询带来的负影响
码猿小站
·
2023-10-12 19:03
flink
Doris
java
apache
flink
大数据
big
data
flink-2
实时
数仓
项目第1章分层设计在之前介绍实时
数仓
概念时讨论过,建设实时
数仓
的目的。主要是增加数据计算的复用性。每次新增加统计需求时,不至于从原始数据进行计算,而是从半成品继续加工而成。
不爱吃鱼的馋猫
·
2023-10-12 19:02
flink
Hudi 系列-基础概念-索引机制
FlinkSpark总结前言Hudi系列文章在这个这里查看https://github.com/leosanqing/big-data-study索引(Index)是Hudi最重要的特性之一,也是区别于之前传统
数仓
别惹猪儿虫
·
2023-10-12 18:38
Hudi
大数据
大数据
hudi
Java
Flink CDC 系列 - 实现 MySQL 数据实时写入 Apache Doris
▼关注「ApacheFlink」视频号,遇见更多大咖▼摘要:本文通过实例来演示怎么通过FlinkCDC结合Doris的FlinkConnector实现从Mysql数据库中监听数据并实时入库到Doris
数仓
对应的表中
Apache Flink
·
2023-10-12 10:28
大数据
数据库
mysql
java
hadoop
博文推荐|Flink CDC 结合 Doris Flink Connector 实现MySQL数据实时入Apache Doris
本文通过实例来演示怎么通过FlinkCDC结合Doris的FlinkConnector实现从MySQL数据库中监听数据并实时入库到Doris
数仓
对应的表中。
ApacheDoris
·
2023-10-12 10:54
数据库
大数据
hadoop
mysql
java
【Doris】Flink CDC 结合 Doris Flink Connector 实现MySQL数据实时入Apache Doris
本文通过实例来演示怎么通过FlinkCDC结合Doris的FlinkConnector实现从MySQL数据库中监听数据并实时入库到Doris
数仓
对应的表中。
九层之台起于累土
·
2023-10-12 10:48
【Doris】
【BigData】
flink
mysql
apache
数据仓库
大数据
Django实现登录注册
Django实现登录注册功能(学习笔记)创建Django项目分配路由(二级路由)用户表设计(
模型设计
)前端模板修改视图文件测试创建Django项目很好报错了,这个错误看球不懂,提示让我们在终端执行"pipinstalldjango
weixin_45372783
·
2023-10-12 07:08
django
python
深度学习之 9 前馈神经网络2:实现前馈神经网络,模型调优
前馈神经网络基本概念_水w的博客-CSDN博客目录手动实现前馈神经网络(1)数据集介绍➢Fashion-MNIST数据集下载➢批量读取数据,采用torch.utils.data.DataLoader读取小批量数据(2)
模型设计
水w
·
2023-10-12 03:41
#
深度学习
深度学习
神经网络
人工智能
python
6个步骤实现-
数仓
数据只加工一次・《数据中台》课程总结
备注:文章内容借鉴了郭忆老师《数据中台》课程,想了解更多可以看这个课程哈、目录:一、元数据1、数据字典2、数据血缘3、数据特征二、指标管理1、如何规范化定义指标三、数据模型1、我建模的方法2、理想的
数仓
模型设计
应该具备的因素
夜希辰
·
2023-10-12 01:20
余老师带你学习大数据框架全栈第十三章Hudi第一节核心技术
1.前言1.1为什么产生数据湖数据量比较大,越来越不满足处理结构化的数据,比如说
数仓
,
数仓
就是处理结构化数据。
weixin_45810046
·
2023-10-11 20:55
hudi
数据湖
数据湖系列(1) - Hudi 核心功能原理剖析
随着互联网业务的逐步成熟,
数仓
和模型训练的基本盘逐步稳固,越来越多的工程师从业务开发需求转移到了工程的架构升级,而常用的Hudi和Iceberg往往会成为替代Hive/Hdfs等架构升级的选型。
小晨说数据
·
2023-10-11 20:49
大数据
数据库
python
java
spark
实施运维面试题
为什么要用
数仓
数据仓库是一种分析数据库,用于存储和处理数据,以便对数据进行分析。数据仓库有两个主要功能:存储分析数据和处理分析数据。
Geneartion_Z
·
2023-10-11 18:44
linux
数据库
运维
hadoop
大数据
高频时序数据仓库
针对市场上高频行情数据处理业务的相关痛点,直观的在线演示如何通过天软高频
数仓
及高性能计算能力,将其逐个击破,期待各位老师的参会。
Tinysoft_SH
·
2023-10-11 16:24
大数据
数据库
数据库开发
数据库架构
数据仓库
为何需要重新编译过的hive
3.安装好后可按如下命令查看hive兼容的spark总结前言大数据生态各个组件之间存在兼容性问题,假如您想从事大数据开发相关工作,那么后续很有可能会做离线
数仓
的项目,而在搭建
数仓
环境时会用到spark,
博嘁东
·
2023-10-11 14:18
hive
spark
big
data
基于ClickHouse的用户行为(路径)分析实践
在我们的体系中,ClickHouse定位点击流
数仓
,所以下面举几个用它来做用户行为(路径)分析的实战例子,包括:路径匹配智能路径检测有序漏斗转化用户留存Session
LittleMagic
·
2023-10-11 01:06
该如何设计
数仓
的汇总层(DWS)
数据建模,毫无疑问是
数仓
建设的重中之重,然后,在实际的开发过程中,会把大量的时间都投入到了需求开发,往往会忽略数据建模(尤其是DWS层的建模),长此以往,数据模型变的越来越杂乱,指标口径无法统一,造成的结果就是
大数据技术与数仓
·
2023-10-10 23:28
PowerDesigner 把Comment复制到name中和把name复制到Comment
在使用PowerDesigner对数据库进行概念模型和物理
模型设计
时,一般在NAME或Comment中写中文,在Code中写英文。
冰夜翎
·
2023-10-10 22:21
数据库
oracle
windows
数据仓库,Hive中使用 != 或 <>符号进行条件过滤时的坑
事情经过是这样的,我在把业务系统数据同步到
数仓
(数据存储在Hive)中时,在数据汇总层(DWS),对数据进行汇总处理时,发现有数据丢失的问题,经过排查,发现是在使用致命陷阱业务场景:把业务数据抽到ODS
雾岛与鲸
·
2023-10-10 19:51
hive
数据仓库
hive
hadoop
MPP和hadoop
特别是在企业数据仓库建设中,MPP架构与Hadoop架构代表两类典型的技术路线选型,事实上,在2015年左右甚至有人认为基于Hadoop体系的
数仓
将彻底取代基于MPP数据库的
数仓
。
方璧
·
2023-10-10 18:03
hadoop
大数据
分布式
什么是URL采集工具?URL采集工具(MsrayPlus)可以做什么?
数据采集的概念数据采集就是从海量的数据中,将数据采集到自己的
数仓
进行二次处理大数据时代,我们需要灵活迅速地抓取网页上散乱分布的数据信息,
Delusion
·
2023-10-10 16:07
msray
大数据
数据挖掘
数据库
日常学习记录随笔-大数据之日志(hadoop)收集实战
数据收集(nginx)--->数据分析--->数据清洗--->数据聚合计算---数据展示可能涉及到zabix做任务调度我们的项目电商日志分析比如说我们现在有一个系统,我们的
数仓
建立也要有一个主题我这个项目是什么我要干什么定义方向对用户进行分析
一个诺诺前行的后端程序员
·
2023-10-10 13:23
大数据
学习
hadoop
随笔记4
django中
模型设计
ORM框架:o全拼object:也就是类对象的意思(单词记忆)r全拼relation:关系,就是关系数据库中数据表的意思(单词记忆)m全拼mapping:映射,在orm框架中,它可以帮我们把类和数据表进行一个映射
牧野流星小星星
·
2023-10-10 08:25
哈工大刘挺:自然语言处理中的可解释性问题
最后,刘挺教授提出了可解释性的白盒
模型设计
以及可
智源社区
·
2023-10-10 01:40
人工智能
神经网络
大数据
自然语言处理
算法
Flink+Doris 实时
数仓
Flink+Doris实时
数仓
Doris基本原理Doris基本架构非常简单,只有FE(Frontend)、BE(Backend)两种角色,不依赖任何外部组件,对部署和运维非常友好。
不二人生
·
2023-10-09 04:42
#
Doris
flink
大数据
数据仓库——分层原理
目录一、什么是数据仓库二、
数仓
建模的意义,为什么要对数据仓库分层?
纠结安然猿
·
2023-10-08 23:05
数据仓库
数据库
大数据
大数据必备shell工具
awksedsortcut2)易出错的地方''单引号不解析里面变量的值""双引号解析里面变量的值嵌套:看谁在最外面3)经常使用的场景a.分发脚本(搭建集群)b.启停脚本(启动集群)c.与mysql的导入导出(数据同步)d.
数仓
层级内部
jiedaodezhuti
·
2023-10-08 15:46
大数据技术
hadoop
基于IDS
模型设计
的ICS
基于IDS
模型设计
的ICS摘要工业系统存在与其网络漏洞相关的安全风险。这些系统遍布世界各地,成为攻击者的目标。
jiangdie666
·
2023-10-08 14:18
论文
网络
2020-05-13关于数据需求的分类
从应用场景划分:监控场景报表场景分析场景决策场景从产出时效划分:实时准实时离线从研发角度划分:数据接入需求:业务接入、日志接入、埋点接入数据开发需求:
数仓
建模、统计开发、算法开发数据输出需求:离线报表、
Simple701
·
2023-10-08 09:37
浅谈如何建设指标监控体系
对于数据人尤其是数据产品和分析师,最难排查(头疼)的问题就是指标为什么升/降/没数,一旦业务方提出这种问题就意味着有大半天的时间要花在确认指标口径+计算逻辑+埋点采集上,而且要同时跟业务方、分析师、数据产品、
数仓
甚至是负责埋点的开发沟通
一个数据人的自留地
·
2023-10-07 21:44
领域建模之数据
模型设计
方法论
本文通过实际业务需求场景建模案例,为读者提供一种业务模型向数据
模型设计
的方法论,用于指导实际开发中如何进行业务模型向数据模型转化抽象,并对设计的数据模型可用性、扩展性提供了建议性思考。
2301_78385600
·
2023-10-07 17:12
java
数据库
大数据
接了几十个来销售的陌生电话,让我有点感慨......
但理论性的东西我们今天不讲,比如:从心理学上分析客户在接到陌生电话后的变化;怎么应用AIDA爱达
模型设计
话术等,我直接拿今天的亲身体验来现身说法吧,希望对你有所帮助。最近公
中层管理精进
·
2023-10-07 14:48
数仓
的DW、ODS、DM概念及其区别
ODS层ODS(OperationalDataStore)操作性数据,是作为数据库到数据仓库的一种过渡,ODS的数据结构一般与数据来源保持一致,便于减少ETL的工作复杂性,而且ODS的数据周期一般比较短。ODS的数据最终流入DW(就是接收到的最原始的数据)DWD层+DW(DataWarehouse)数据仓库,是数据的归宿,这里保持这所有的从ODS到来的数据,并长期报错,而且这些数据不会被修改。(将
焱行软件科技计算机毕设
·
2023-10-07 13:14
数据仓库
大数据
数据库
基于Impala的高性能
数仓
实践之执行引擎模块
导读:本系列文章将结合实际开发和使用经验,聊聊可以从哪些方面对
数仓
查询引擎进行优化。Impala是Cloudera开发和开源的
数仓
查询引擎,以性能优秀著称。
浪尖聊大数据-浪尖
·
2023-10-07 11:10
大数据
分布式
数据库
mysql
java
Python数据攻略-Mongodb
数仓
无法写入方法汇总
Mongodb作为一个非结构化的NoSQL数据库,能存储各种复杂和多变的数据格式,如JSON。这使得Mongodb在实时数据分析和高性能查询中具有优势。在使用Mongodb的过程中,可能会遇到写入失败的问题。常见的几种情况包括无法建立连接、认证失败和存储限制。文章目录诊断问题日志分析错误码解析常见写入失败原因及解决方案连接问题认证问题存储限制预防措施合理设计Schema数据备份实践案例:《三国志》
Mr数据杨
·
2023-10-07 05:36
Python
数据攻略
python
mongodb
开发语言
数据中台实战(05)-如何统一管理纷繁杂乱的数据指标?
元数据在指标管理、
模型设计
、数据质量和成本治理四个领域都发挥作用,这些领域构成数据中台OneData数据体系。
JavaEdge.
·
2023-10-07 04:31
数据中台
大数据
人工智能
数据库
数据中台实战(06)-数据模型无法复用,归根结底还是设计问题
由于他们非技术出身,SQL较差,多层嵌套,不择手段,资源消耗大,造成队列阻塞,影响其他
数仓
任务,引起数据开发不满。数据开发要求收回分析师的原始数据读取权限
JavaEdge.
·
2023-10-06 20:19
数据中台
数据库
基于 Kafka 的实时
数仓
在搜索的实践应用
一、概述ApacheKafka发展至今,已经是一个很成熟的消息队列组件了,也是大数据生态圈中不可或缺的一员。ApacheKafka社区非常的活跃,通过社区成员不断的贡献代码和迭代项目,使得ApacheKafka功能越发丰富、性能越发稳定,成为企业大数据技术架构解决方案中重要的一环。ApacheKafka作为一个热门消息队列中间件,具备高效可靠的消息处理能力,且拥有非常广泛的应用领域。那么,今天就来
谁叫我土豆了
·
2023-10-06 14:30
目标检测算法改进系列之Backbone替换为NextViT
NextViT介绍由于复杂的注意力机制和
模型设计
,大多数现有的视觉Transformer(ViTs)在现实的工业部署场景中不能像卷积神经网络(CNNs)那样高效地执行,例如TensorRT和CoreML
我悟了-
·
2023-10-06 02:25
目标检测算法改进系列
目标检测
算法
人工智能
深度学习
计算机视觉
pytorch
python
大数据项目之电商
数仓
(3电商数据仓库系统)V6.1.3
第1章
数仓
分层1.1为什么要分层1.2数据集市与数据仓库概念1.3
数仓
命名规范1.3.1表命名ODS层命名为ods_表名DWD层命名为dwd_dim/fact_表名DWS层命名为dws_表名DWT
okbin1991
·
2023-10-06 00:19
大数据
数据仓库
数据库
网络编程实战24 C10K问题:高并发
模型设计
C10K问题C10K:如何在一台物理机上同时服务10000个用户?这里C表示并发,10K等于10000。得益于操作系统、编程语言的发展,在现在的条件下,普通用户使用JavaNetty、Libevent等框架或库就可以轻轻松松写出支持并发超过10000的服务器端程序,甚至于经过优化之后可以达到十万,乃至百万的并发,但在二十年前,突破C10K问题可费了不少的心思,是一个了不起的突破。操作系统层面支持1
ziggy7
·
2023-10-05 19:16
网络编程实战
单机高并发
模型设计
这篇文章通过结构客户端与服务端的建立连接和数据传输过程,阐述下如何进行单机高并发
模型设计
。
知食份子.
·
2023-10-05 19:15
java
后端
高并发
C10K问题:高并发
模型设计
一、循环服务器模型#include#include#include#include#include#include#include#include//*******//#include//*******//#include//*******//intsockfd;voidmy_exit(intsig){shutdown(sockfd,SHUT_RDWR);close(sockfd);printf(
考勤卡啦啦
·
2023-10-05 19:14
开发语言
c语言
linux
网络
数据湖|Flink + Iceberg 全场景实时
数仓
的建设实践
整理|路培杰(Flink社区志愿者)摘要:ApacheFlink是目前大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构,以Iceberg、Hudi、Delta为代表的解决方案应运而生,Iceberg目前支持Flink通过DataStreamAPI/TableAPI将数据写入Iceberg的表,并提供对ApacheFlink1.11.x的集成支持。本文由腾讯数据平台部
大数据技术架构
·
2023-10-05 13:31
运维
大数据
分布式
编程语言
hadoop
数据仓库规范全解
3、
数仓
规范有哪些?4、设计规范5、流程规范6、质量管控规范推荐读一读。正文开始这是数据仓库系列的第三个话题,排序在架构之后、建模之前。为什么会提的这么靠前呢?
程序员的隐秘角落
·
2023-10-05 09:13
数据仓库建模理论——总结
四种模型:ER模型维度模型DataVault模型Anthor模型以上四种模型,当前最流行建模方法为:ER模型、维度模型ER模型ER模型常用于OLTP数据库建模,应用到构建
数仓
时更偏重数据整合,站在企业整体考虑
尼小摩
·
2023-10-05 08:50
第一章 概论
运算算法及描述算法分析时间复杂度空间复杂度牛刀小试引言数据结构是指一组相互之间存在一种或多种特定关系的数据的组织方式和它们在计算机内的存储方式,以及定义在该组数据上的一组操作计算机解决具体问题的步骤如下:从具体问题中抽象出一个适当的数学
模型设计
一个求解该数学模型的算法用某种计算机语言编写实现该算法的程序
赟文武
·
2023-10-04 04:42
自考数据结构导论
数据结构导论
大数据-玩转数据-Flink+Hologres构建实时
数仓
企业最常见的做法就是通过构建实时
数仓
来满足对数据的快速探索。
人猿宇宙
·
2023-10-03 21:18
大数据-玩转数据-阿里系
大数据
flink
运维
【
数仓
建设系列之六】
数仓
管理利器-数据中台
【
数仓
建设系列之六】
数仓
管理利器-数据中台介绍相信看过前面几篇
数仓
建设系列文章的同学已经对什么是
数仓
以及如何建设
数仓
有了充分的认知和了解了,那么问题很多的小明就要问了,既然
数仓
已经建设起来了,那企业如何管理运营
数仓
呢
码猿小站
·
2023-10-02 23:43
数据仓库
数仓建设
数据中台
大数据
数据仓库
深入解析数据仓库中的缓慢变化维
前言最近公司在招聘
数仓
开发,笔者负责技术方面的一些问题,缓慢变化维自然是是不可缺少的环节。
秋夜雨凉
·
2023-10-02 23:01
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他