E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓分层架构
【活动回顾】Serverless
数仓
技术与挑战(内含 PPT 下载)
下午,DatabendLabs联合创始人张雁飞作为「Serverless
数仓
技术与挑战」专题的演讲嘉宾进行了分享。
Databend
·
2023-09-23 03:56
serverless
云原生
Docker安装与镜像的使用
大数据技术AIFlink/Spark/Hadoop/
数仓
,数据分析、面试,源码解读等干货学习资料102篇原创内容公众号1、docker简介=============1.1什么是dockerdocker官网地址
hyunbar
·
2023-09-22 22:08
大数据
docker
容器
运维
2.0 图像处理综述
在整个视觉(DV)的体系中,是
分层架构
的。笼统的分为高中低三层。A.低层包括但不限于:0成像系统(彩色成像)1(彩色)图像处理(输入输出都是图像):图像增强(主观以人为目的),图像复原(客观回复图
enthwxq
·
2023-09-22 17:56
DIP
DIP
同一份数据全域共享,HashData UnionStore实时性背后的故事
时至今日,数据已经被越来越多的企业视为发展的战略资源,而云
数仓
则是数据发挥重要价值的关键媒介。
·
2023-09-22 16:27
数据库postgresql
ByConity 技术详解之 ELT
传统的数据转换过程一般采用Extract-Transform-Load(ETL)来将业务数据转换为适合
数仓
的数据模型,然而,这依赖于独立于
数仓
外的ETL系统,因而维护成本较高。ByConity作为云原
·
2023-09-22 16:27
实时
数仓
混沌演练实践
一、背景介绍目前实时
数仓
提供的投放实时指标优先级别越来越重要,不再是单独的报表展示等功能,特别是提供给下游规则引擎的相关数据,直接对投放运营的广告投放产生直接影响,数据延迟或者异常均可能产生直接或者间接的资产损失
·
2023-09-22 16:55
运维后端
spring家族
spring家族项目image基本模块Spring框架是一个
分层架构
,由7个定义良好的模块组成。
味道_3a01
·
2023-09-22 16:31
架构之魂:分离业务逻辑和技术细节
3.架构师的职责软件架构软件架构分类典型应用架构1.
分层架构
2.CQRS3.六边形架构4.洋葱圈架构COLA应用架构1.分层设计2.扩展设计3.规范设计4.COLA架构总览应用架构的核心二、架构的常识1
梅西爱骑车
·
2023-09-22 15:59
Flink Batch SQL Improvements on Lakehouse
内容主要分为三个部分:FlinkBatchonPaimon挑战FlinkBatch核心优化后续规划点击查看原文视频&演讲PPT一、FlinkBatchonPaimon挑战众所周知,Paimon在创立之初就是为了解决流式
数仓
场景的问题
·
2023-09-22 12:29
后端flink大数据
Apache Druid 数据结构及架构原理介绍
由于Druid能够同时提供离线和实时数据的查询,因此Druid最常用作为GUI分析、业务监控、实时
数仓
的数据存储系统。
zxf126126
·
2023-09-21 18:04
druid
apache
Tapdata Connector 实用指南:云原生
数仓
场景之数据实时同步到 Databend
【前言】作为中国的“Fivetran/Airbyte”,Tapdata是一个以低延迟数据移动为核心优势构建的现代数据平台,内置60+数据连接器,拥有稳定的实时采集和传输能力、秒级响应的数据实时计算能力、稳定易用的数据实时服务能力,以及低代码可视化操作等。典型用例包括数据库到数据库的复制、将数据引入数据仓库或数据湖,以及通用ETL处理等。引用随着TapdataConnector的不断增长,我们最新推
·
2023-09-21 14:28
数据库mysql
ELT in ByteHouse 实践与展望
传统的数据转换过程一般采用Extract-Transform-Load(ETL)来将业务数据转换为适合
数仓
的数据模型
·
2023-09-21 12:18
大数据数据库云原生
ELT in ByteHouse 实践与展望
传统的数据转换过程一般采用Extract-Transform-Load(ETL)来将业务数据转换为适合
数仓
的数据模型
·
2023-09-21 12:46
大数据数据库云原生
电商
数仓
学习笔记(一)
第一章数据仓库概念第二章项目需求及架构设计项目需求项目框架第三章数据生成模块目标数据数据埋点服务器和jdk准备编写集群分发脚本xsync模拟数据集群日志生成脚本第四章数据采集模块集群所有进程查看脚本Hadoop安装LZO压缩配置LZO创建索引Hadoop参数调优Zookeeper安装ZK集群启停脚本Kafka安装Kafka集群安装安装部署Kafka集群启动停止脚本Kafka常用命令Kafka机器数
芝士雪豹.
·
2023-09-21 06:01
大数据
hadoop
数仓
主题域和数据域、雪花模型,星型模型和星座模型
数仓
模型和领域划分一、主题域和数据域的差别二、雪花模型,星座模型和星型模型一、主题域和数据域的差别明确数据域作为
数仓
搭建的重要一环,能够让
数仓
的数据便于管理和应用。
Aimyon_36
·
2023-09-20 23:23
数据仓库
spark
大数据
分布式
Hologres揭秘:优化COPY,批量导入性能提升5倍+
Hologres(中文名交互式分析)是阿里云自研的一站式实时
数仓
,这个云原生系统融合了实时服务和分析大数据的场景,全面兼容PostgreSQL协议并与大数据生态无缝打通,能用同一套数据架构同时支持实时写入实时查询以及实时离线联邦分析
阿里云Hologres
·
2023-09-20 20:38
asp.net core系列 63 领域模型架构 eShopOnWeb项目分析 上
一.DDD
分层架构
介绍本篇继续探讨web应用架构,讲基于DDD风格下最初的领域模型架构,不同于DDD风格下CQRS架构,二者架构主要区别是领域层的变化。
懒懒的程序员一枚
·
2023-09-20 18:33
第三章 数据同步
但是当数据量较大时,此方法抽取数据较慢,不适合用于从数据库同步到
数仓
。2.数据文件同步源数据库以约定的格式,编码,大小等信息生成对应的文件,再通过
发呆的熊猫
·
2023-09-20 18:46
如何快速从 ETL 到 ELT?火山引擎 ByteHouse 做了这三件事
在
数仓
及分析领域,海量数据则主要采按列的方式储存。因此,将数据从行级转换成列级存储是建立企业
数仓
的基础能力。传统方式是采用Extract-Transform-Load
字节数据平台
·
2023-09-20 18:41
etl
火山引擎
数据仓库
【大数据】Doris 构建实时
数仓
落地方案详解(三):Doris 实时
数仓
设计
本系列包含:Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读Doris构建实时
数仓
落地方案详解(三):Doris实时
数仓
设计Doris
G皮T
·
2023-09-20 08:10
大数据
大数据
数据仓库
Doris
流批一体
Lambda
Kappa
实时数仓
【大数据】Doris 构建实时
数仓
落地方案详解(一):实时数据仓库概述
本系列包含:Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读Doris构建实时
数仓
落地方案详解(三):Doris实时
数仓
设计Doris
G皮T
·
2023-09-20 08:40
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
【大数据】Doris 构建实时
数仓
落地方案详解(二):Doris 核心功能解读
本系列包含:Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读Doris构建实时
数仓
落地方案详解(三):Doris实时
数仓
设计Doris
G皮T
·
2023-09-20 08:40
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
【大数据】Doris 构建实时
数仓
落地方案详解(三):Doris 实时
数仓
设计
本系列包含:Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读Doris构建实时
数仓
落地方案详解(三):Doris实时
数仓
设计Doris
G皮T
·
2023-09-20 08:38
大数据
大数据
数据仓库
Doris
流批一体
Lambda
Kappa
实时数仓
探讨基于IEC61499 的分布式 ISA Batch 控制系统
配方的
分层架构
配方在化学工程师眼中是一些化学过程和术语,对于控制系统而言,控制工程师关心的可能是阀门,泵,加热
姚家湾
·
2023-09-20 06:07
batch
开发语言
MatrixDB数据库学习——筑梦之路
为万物互联的智能时代提供坚实、简洁的智能数据核心基础设施,为物联网应用、工业互联网、智能运维、智慧城市、实时
数仓
、智能家居、车
筑梦之路
·
2023-09-20 05:55
数据库技术
数据库
big
data
数据仓库
数仓
规范随记
数仓
分层以《大数据之路:阿里巴巴大数据实践》中五层(ods/dwd/dws/dim/ads)分类为基础划分,有序列表记录是分层大类,分层大类下的无需列表是分层小类或者说真正落地的:ods:近源层/贴源层
mizuhokaga
·
2023-09-20 00:56
总结
大数据
深度解读 Flink 1.11:流批一体 Hive
数仓
2020-06-02
Flink1.11中流计算结合Hive批处理
数仓
,给离线
数仓
带来Flink流处理实时且Exactly-once的能力。
会飞的鱼go
·
2023-09-19 14:06
Flink 离线批处理 Mysql to Hive 离线
数仓
flinkmysqltohive我本地用的版本是flink1.13.2scala2.11,hive3.1.2环境配置1,source端读取mysql导入FLINK_HOME/lib,flink-connector-jdbc.jar2.sink端写入Hive,导入FLINK_HOME/lib,flink-sql-connector-hive注意如果没有找到自己对应版本的flinkhive包的话就导入
aaaak_
·
2023-09-19 11:56
大数据
hive
flink
mysql
Databend 开源周报第 111 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2023-09-19 09:51
开源
数据库
支持多数据源联合查询的本地运行SQL执行引擎syncnany-SQL安装和配置
在微服务和云原生愈发流行的今天,数据的分布也愈发脱离单库单机而更加复杂,使用的数据库类型也会更多,但业务的复杂依然会带来了大量的数据查询和导出需求,而很多时候我们很难为数据量的大部分系统创建完整的BI
数仓
系统
·
2023-09-19 09:22
支持多数据源联合查询的SQL运行引擎sycnany-SQL添加使用自定义函数
在微服务和云原生愈发流行的今天,数据的分布也愈发脱离单库单机而更加复杂,使用的数据库类型也会更多,但业务的复杂依然会带来了大量的数据查询和导出需求,而很多时候我们很难为数据量的大部分系统创建完整的BI
数仓
系统
·
2023-09-19 09:22
幸福里基于 Flink & Paimon 的流式
数仓
实践
幸福里业务是一种典型的交易、事务类型的业务场景,这种业务场景在实时
数仓
建模中遇到了诸多挑战。
Apache Flink
·
2023-09-19 07:26
Flink
大数据
实时计算
flink
大数据
Flink相关
知乎实时
数仓
架构演进_天池技术圈-阿里云天池关于flink实时
数仓
的实际问题_flinkdatastream按天,小时写入hdfs_一个写湿的程序猿的博客-CSDN博客基于Flink+Hudi的实时
数仓
在
丢雷劳谋
·
2023-09-19 07:24
大数据
flink
大数据
【直播预约中】 腾讯大数据 x StarRocks|构建新一代实时湖仓
随着信息时代的兴起,数据已成为推动业务决策和创新的核心要素;结构化、半结构化等多种类型的数据呈现爆炸式增长,如何高效处理和分析海量数据已经成为关键挑战,结合传统
数仓
与数据湖优势的湖仓一体(Lakehouse
StarRocks_labs
·
2023-09-19 04:34
后端
【大数据】Doris 构建实时
数仓
落地方案详解(一):实时数据仓库概述
Doris构建实时
数仓
落地方案详解(一):实时数据仓库概述1.数据仓库的发展历程2.数据仓库技术的发展3.
数仓
的相关技术栈4.OLAP查询5.MPP架构6.实时
数仓
定义7.实时
数仓
的难点数据仓库的概念可以追溯到
G皮T
·
2023-09-19 04:45
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
【大数据】Doris 构建实时
数仓
落地方案详解(二):Doris 核心功能解读
Doris构建实时
数仓
落地方案详解(二):Doris核心功能解读1.Doris发展历程2.Doris三大模型3.Doris数据导入4.Doris多表关联5.Doris核心设计6.Doris查询优化7.Doris
G皮T
·
2023-09-19 04:14
大数据
大数据
数据仓库
Doris
实时数仓
MPP架构
Hadoop
HDFS
数据湖调研
数据湖调研1什么是数据湖2数据湖能解决什么问题3数据湖与
数仓
的区别4数据湖生态5当前常见的数据湖实现方案5.1基于Hudi5.2基于Iceberg5.2.1Iceberg应用场景:5.3数据湖基本实现:
Direction_Wind
·
2023-09-19 00:30
技术调研
big
data
知识图谱
nosql
【直播预约中】 腾讯大数据 x StarRocks|构建新一代实时湖仓
随着信息时代的兴起,数据已成为推动业务决策和创新的核心要素;结构化、半结构化等多种类型的数据呈现爆炸式增长,如何高效处理和分析海量数据已经成为关键挑战,结合传统
数仓
与数据湖优势的湖仓一体(Lakehouse
·
2023-09-18 21:54
后端
如何快速从 ETL 到 ELT?火山引擎 ByteHouse 做了这三件事
在
数仓
及分析领域,海量数据则主要采按列的方式储存。因此,将数据从行级转换成列级存储是建立企业
数仓
的基础能力。传统方式是采用Extract-Transform-Load
·
2023-09-18 18:39
大数据云原生数据仓库数据库
幸福里基于 Flink & Paimon 的流式
数仓
实践
幸福里业务是一种典型的交易、事务类型的业务场景,这种业务场景在实时
数仓
建模中遇到了诸多挑战。
·
2023-09-18 17:57
后端flink大数据
HashData 云
数仓
上线华为蓝鲸应⽤商城
近⽇,经过华为对企业技术、产品和服务能⼒的综合评估,酷克数据企业级云原⽣数据仓库HashData通过与华为OceanStorPacific分布式存储的适配与优化,形成⼀体化解决⽅案,成功上线华为蓝鲸应⽤商城。图1:华为蓝鲸商城HashData产品⻚⾯华为蓝鲸应⽤商城是华为数据存储产品线与合作伙伴联合打造的⼀站式IT应⽤解决⽅案集成平台,通过对企业应⽤与IT基础设施的深度融合,构建了应⽤快速上线、应
·
2023-09-18 16:34
数据库运维
【遇见Doris】Doris在作业帮实时
数仓
中的应用&实践
9月20日的ApacheDoris线上Meetup——壹佰案例峰会预热沙龙圆满成功,现在为大家带来这次Meetup的内容回顾。本次Meetup请到了来自作业帮和百度画像团队的技术大牛带来ApacheDoris应用与实践上的经验分享,了解更多详情请关注Doris官方公众号。嘉宾分享回顾会陆续放出,公众号后台回复“0920”立即get回放录像。糜利敏作业帮大数据查询引擎负责人伴随着业务的快速发展,由于
ApacheDoris
·
2023-09-18 08:07
大数据
分布式
编程语言
hadoop
数据库
Day69 Kafka 设计原理详解
Storm/Spark流式处理引擎web/nginx,访问日志消息服务开放统一接口给consumerhadoop,hbase等.装载到hadoop,
数仓
etl做离线分析和数据挖掘.ScreenShot2022
小周爱吃瓜
·
2023-09-17 12:39
企业级数据仓库-
数仓
实战
数仓
实战安装包大小安装清单环境搭建一、环境搭建01(机器准备)准备好三台虚拟机,并进行修改hostname、在hosts文件增加ip地址和主机名映射。
beyond_champion
·
2023-09-17 03:06
数据仓库
数据仓库
数据库
hadoop
big
data
数据仓库模型设计V2.0
一、
数仓
建模的意义数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。只有将数据有序的组织和存储起来之后,数据才能得到高性能、低成本、高效率、高质量的使用。
000X000
·
2023-09-16 21:46
数据仓库
数据建模
实战
数据仓库
spark
大数据
数据仓库模型设计V2.0
Hive参数与性能调优-V2.0
但是如果我们只局限于会使用Hive,而不考虑性能问题,就难搭建出一个完美的
数仓
,所以Hive性能调优是我们大数据从业者必须掌握的技能。本文将给大家讲解Hive性能调优的一些方法及技巧。
000X000
·
2023-09-16 21:54
数据仓库
HIVE
大数据
hive
数据仓库
Hive参数与性能调优
实时
数仓
方案如何选型和构建(建议收藏)
一、为何需要实时
数仓
架构最初企业存储数据都在
数仓
中存储,但是随着数据量的增大,传统数据的方案在时效性上和数据维护上变得越来越困难。实时
数仓
架构应运而生。
also&lucky
·
2023-09-16 11:30
大数据
数据仓库
ETL之拉链表算法探索
历史数据存储方式
数仓
中历史数据存储的2种方式:快照存储快照式存储拉链存储拉链表存储可以很明显的看出:在
数仓
中,相比于快照存储,拉链表,既能满足反应数据的历史状态,又可以最大程度的节省存储。
Daniel_张
·
2023-09-16 10:39
离线
数仓
和实时
数仓
割裂的痛点,数据湖方案
离线
数仓
和实时
数仓
割裂的痛点:1)离线加工数据产出时效性不足2)实时加工可观测性,可运维性较弱3)批流双链路,双份资源开销4)全天计算资源高峰集中在凌晨数据湖方案:数据入湖增量计算,提升时效流表二像性,
秉寒-CHO
·
2023-09-16 08:53
大数据
数仓
的主数据出数据指标是否有意义 ,单调递增的数据指标作为虚荣指标是否对公司的业务发展有实际的指导意义
数仓
的主数据出数据指标如果能够指导公司的业务发展,那么这些指标是有意义的。然而,如果这些指标只是单调递增的虚荣指标,那么它们并不能对公司的业务发展提供实际的指导意义。
秉寒-CHO
·
2023-09-16 08:53
数据仓库
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他