E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
实时数仓
[特殊字符] 实时数据洪流突围战:Flink+Paimon实现毫秒级分析的架构革命(附压测报告)——日均百亿级数据处理成本降低60%的工业级方案
某电商平台借助Flink+Paimon重构
实时数仓
后,端到端延迟从分钟级压缩至800ms,计算资源节省5.6万核/月。
Lucas55555555
·
2025-07-12 17:24
flink
大数据
阿里云SelectDB:开启
实时数仓
新时代
一、引言在当今大数据时代,数据如同企业的“石油”,蕴含着巨大的价值。随着数据量呈指数级增长,企业对于实时数据分析的需求愈发迫切。实时数据分析能够帮助企业及时捕捉市场动态,快速做出决策,从而在激烈的市场竞争中占据优势。无论是电商企业需要实时分析用户购买行为以进行精准营销,还是金融机构需要实时监测风险以保障资金安全,实时数据分析都发挥着关键作用。阿里云SelectDB作为一款专为实时数据分析打造的云原
云资源服务商
·
2025-07-04 10:09
阿里云
云计算
数据库
云原生
储能业 | 低成本部署!DolphinDB 打造抽水蓄能一体化解决方案
导语在电力行业抽水蓄电场景中,电力集团可以基于DolphinDB搭建轻量化
实时数仓
,有效破解高频数据写入、万亿级数据存储和秒级实时计算等核心难题。
DolphinDB智臾科技
·
2025-06-29 03:55
物联网
数据库
大数据
DolphinDB
实时计算
抽水蓄能
电力
实时数仓
工具-SelectDB
一、SelectDB简介官网:https://www.selectdb.com/1、ApacheDorisApacheDoris是一款采用MPP架构的实时分布式OLAP数据仓库,专注于高效的实时数据分析。Doris项目于2013年内部开发,2017年正式开源,目前在GitHub上获得了接近13,000星,全球已有超过5,000家企业采用,社区活跃度极高,累计贡献者超过650人,且曾连续数月在大数据
清平乐的技术博客
·
2025-06-27 04:25
实时数仓
数据仓库
湖仓一体实时数据采集与存储实践
文章目录湖仓一体实时数据采集与存储实践1.
实时数仓
演进:从传统数仓到湖仓一体1.1传统数仓的局限性:批处理延迟与数据孤岛1.2湖仓一体(Lakehouse)的核心价值1.3典型行业场景解析案例1:金融实时风控案例
danny-IT技术博客
·
2025-06-25 08:17
企业级SQL
Server深度实践
spring
boot
spark
CDC
DATALAKE
maxcomputer 和 hologres中的EXTERNAL TABLE 和 FOREIGN TABLE
在阿里云的大数据和
实时数仓
产品中,MaxCompute和Hologres都支持类似于EXTERNALTABLE和FOREIGNTABLE的机制,但它们的实现和语义有所不同。
静听山水
·
2025-06-23 06:37
#
Hologres
大数据
Flink进阶之路:解锁大数据处理新境界
基础回顾二、Flink进阶知识深入2.1数据类型与序列化2.2双流Join操作2.3复杂事件处理(CEP)2.4状态管理与优化三、Flink在实际场景中的应用3.1实时智能推荐3.2实时欺诈检测3.3
实时数仓
与
£菜鸟也有梦
·
2025-06-05 04:33
大数据基础
flink
大数据
hadoop
spark
开源免费数据同步工具全景解析与实战指南
数据同步工具生态全景图1.1工具分类矩阵类型代表工具核心能力适用场景开源协议ETL工具DataX、SeaTunnel异构数据源批量同步数据仓库构建Apache2.0CDC工具FlinkCDC、Canal实时数据变更捕获
实时数仓
社恐码农
·
2025-06-04 13:39
Hive
mysql
postgres
开源
数据同步工具
最全Doris实战——结合Flink构建极速易用的
实时数仓
_flink doris
3.6.4执行层查询加速四、行业最佳实践4.1跨境电商4.2运营服务商4.3供应链企业原文大佬的这篇Doris+Flink构建
实时数仓
的实战文章整体写的很深入,这里直接摘抄下来用作学习和知识沉淀。
2301_82241942
·
2025-06-01 06:36
程序员
flink
linq
大数据
实时数仓
flick+clickhouse启动命令
FlinkCDC环境部署启动flink-yarn模式1、启动zookeeperzk.shstart2、启动DFS,Hadoop集群start-dfs.sh3、启动yarnstart-yarn.sh4、启动kafka(如果需要在启用)启动Kafka集群bin/kafka-server-start.sh-daemonconfig/server.properties查看Kafkatopic列表bin/k
遥遥领先zzl
·
2025-06-01 06:06
服务器
数据库
运维
实时数据仓库存储引擎革新:从Lambda到Kappa++架构的底层技术演进
引言:
实时数仓
的存储革命迫在眉睫在数字化转型浪潮中,企业对数据时效性的需求正从T+1小时向秒级演进。据Gartner最新报告显示,到2025年将有75%的企业将实时数据分析能力作为核心竞争力指标。
尘烬海
·
2025-06-01 04:20
数据仓库
架构
service_mesh
网络协议
深度学习
平面
分布式
实时数仓
和离线数仓的区别是什么?企业如何选择合适的数仓架构?
实时数仓
和离线数仓的区别是什么?企业如何选择合适的数仓架构?时数仓和离线数仓都是数据仓库的不同类型,用于存储和管理企业的数据,但它们在数据处理和使用的时间、速度以及用途方面有明显的区别。
数字天下
·
2025-05-29 05:17
架构
数据库
大数据
《Spark/Flink/Doris离线&
实时数仓
开发》目录
欢迎加入《Spark/Flink/Doris离线&
实时数仓
开发》付费专栏!
大模型大数据攻城狮
·
2025-05-25 12:32
spark
flink
大数据
数据面试
离线数仓
实时数仓
调度器
【数据仓库面试题合集③】
实时数仓
建模思路与实践详解
一、建模原则与数仓分层认知1.
实时数仓
与离线数仓建模有什么区别?答:维度离线建模实时建模数据来源批量导入,数据快照流式数据,如Kafka数据一致性可批量补数,强一致性补数困难,更强调最终一致
晴天彩虹雨
·
2025-05-20 17:24
数据仓库面试解析集锦
数据仓库
在 Flink + Kafka
实时数仓
中,如何确保端到端的 Exactly-Once
在Flink+Kafka构建
实时数仓
时,确保端到端的Exactly-Once(精确一次)需要从数据消费(Source)、处理(Processing)、写入(Sink)三个阶段协同设计,结合Flink的检查点机制
静听山水
·
2025-05-11 12:58
大数据
大数据
基于Flink+Hologres搭建
实时数仓
ApachePaimon是一种流批统一的数据湖存储格式,结合Flink及Spark构建流批处理的实时湖仓一体架构。Paimon创新地将湖格式与LSM技术结合起来,给数据湖带来了实时流更新以及完整的流处理能力。借助实时计算Flink版与ApachePaimon,可以快速地在云端OSS上构建数据湖存储服务。ApachePaimon提供以下核心能力:实时入湖能力增强:实时计算Flink版提供了丰富的入湖
soso1968
·
2025-05-09 08:39
flink
大数据
Flink + Kafka 数据血缘追踪与审计机制实战
二、
实时数仓
中常见的数据血缘诉求场景血缘粒度举例数据来源标识数据级别明确某条
晴天彩虹雨
·
2025-05-09 05:18
Flink
+
Kafka
实时数仓实战
flink
kafka
linq
数据仓库
大数据
StarRocks实战——vivo基于 StarRocks 构建实时大数据平台
难以满足业务复杂查询需求1.4.运维挑战,用户查询体验需优化二、OLAP选型与实践三、应用实践3.1数据链路优化3.2列更新3.3集群监控告警3.4集群弹性部署四、结语原文大佬写的这篇StarRocks
实时数仓
建设案例有借鉴意义
吵吵叭火
·
2025-05-05 20:55
#
StarRocks
大数据
数据仓库
大数据
Doris索引机制全解析,如何用高效索引加速数据分析
ApacheDoris作为新一代MPP分析型数据库,凭借其独特的索引机制,在京东、美团等企业的
实时数仓
场景中展现出卓越性能。本文将深入解析Doris索引设计的精妙之处。
数据最前线
·
2025-05-02 06:25
Doris数据库专栏
数据分析
数据挖掘
Flink Checkpoint 与实时任务高可用保障机制实战
在
实时数仓
体系中,数据一致性和任务稳定性是核心保障。本文围绕FlinkCheckpoint机制,深入讲解高可用保障的最佳实践和工程实现。
晴天彩虹雨
·
2025-04-30 10:16
Flink
+
Kafka
实时数仓实战
flink
npm
前端
数据仓库
Flink 数据清洗与字段标准化最佳实践
——构建可配置、可扩展的实时标准化清洗链路本文是「Flink+Kafka构建
实时数仓
实战」专栏的第4篇,将围绕字段标准化这一核心问题,从业务痛点、技术架构、配置设计到完整代码工程,系统讲透标准化实践。
晴天彩虹雨
·
2025-04-29 11:18
Flink
+
Kafka
实时数仓实战
flink
大数据
数据仓库
Flink+Hologres搭建
实时数仓
参考资料文档文档链接阿里云实时计算flink文档https://help.aliyun.com/zh/flink/product-overview/what-is-alibaba-cloud-realtime-compute-for-apache-flink?spm=a2c4g.11186623.help-menu-45029.d_0_0_0.1bbc67b8VuD3Anhologres数据库说明
闭嘴!我不是SQL boy
·
2025-04-29 11:16
FLINK
flink
大数据
Kafka 主题设计与数据接入机制
一、前言:万物皆流,Kafka是入口在构建
实时数仓
时,Kafka既是数据流动的起点,也是后续流处理系统(如Flink)赖以为生的数据源。
晴天彩虹雨
·
2025-04-27 13:21
Flink
+
Kafka
实时数仓实战
kafka
linq
分布式
数据仓库
Doris实战——结合Flink构建极速易用的
实时数仓
_flink doris
原文大佬的这篇Doris+Flink构建
实时数仓
的实战文章整体写的很深入,这里直接摘抄下来用作学习和知识沉淀。
2301_82243558
·
2025-04-17 10:41
程序员
flink
大数据
Doris实战——结合Flink构建极速易用的
实时数仓
_flink doris(1)
综上可知,利用FlinkCDC结合Doris两阶段事务提交保证了数据写入一致性。需要注意的是,在该过程中可能遇到一个问题:如果事务预提交成功、但FlinkCheckpoint失败了该怎么办?针对该问题,Doris内部支持对写⼊数据进⾏回滚(Rollback),从⽽保证数据最终的⼀致性。3.1.3DDL和DML同步随着业务的发展,部分用户可能存在RDSSchema的变更需求。当RDS表结构发生变更时
2301_79988566
·
2025-04-17 10:11
程序员
flink
大数据
实时数仓
Kappa架构:从入门到实战
实时数仓
(Real-TimeDataWarehouse,RTDW)应运而生,其中Kappa架构作为一种简化的数据处理架构,通过统一的流处理框架,解决了传统Lambda架构中批处理和实时处理的复杂性。
喜欢猪猪
·
2025-04-03 20:10
架构
flink重温笔记(一):Flink 基础入门
Flink重温笔记(一)前言:最近发现Flink技术在
实时数仓
开发上占比越来越明显,希望通过抓紧复习,加强对Flink的理解和应用,提升自己
实时数仓
的开发能力,以下是今日整理的学习笔记,各种图像均按照自己理解重画
卡林神不是猫
·
2025-03-30 10:54
Flink重温笔记
flink
笔记
大数据
学习方法
数据仓库
经验分享
SelectDB 实时分析性能突出,宝舵成本锐减与性能显著提升的双赢之旅
BOCDOP宝舵早期基于TiDB构建
实时数仓
,随着数据量增长,在数据处理效率、OLAP能力扩展、功能支持、成本与资源方面存在一定优化空间。
SelectDB技术团队
·
2025-03-20 00:11
大数据
物联网
doris
selectdb
人工智能
电商场景
数据分析
数据湖架构与
实时数仓
实践:Hudi、Iceberg、Kafka + Flink + Spark
1.引言:数据湖与数据仓库的融合趋势在大数据时代,传统的数据仓库(DataWarehouse,DW)因其强一致性和高效查询能力,一直是企业数据分析的核心。然而,随着数据量和数据类型的爆炸式增长,传统数据仓库的存储成本和数据管理难度逐渐增加。为了解决这些问题,数据湖(DataLake)概念应运而生。数据湖能够存储原始数据,支持半结构化和非结构化数据,提供更灵活的计算框架,但其缺乏事务管理和数据一致性
晴天彩虹雨
·
2025-03-10 03:22
架构
kafka
flink
数据仓库
小白进阶高手:使用Flink开发
实时数仓
的经验与技巧(理论结合超多实例)
Flink作为一种流处理框架,在
实时数仓
的开发中发挥着关键作用。它能够处理大量实时数据流,支持复杂的事件处理、实时计算和监控,具有高吞吐、低延迟的优势。
大模型大数据攻城狮
·
2025-03-05 11:43
flink
大数据
flink开发
CEP
flink反压
flink多流
flink容错
阿里云 MaxCompute MaxQA 开启公测,解锁近实时高效查询体验
(原MCQA2.0)查询加速功能,在独享的查询加速资源池的基础上,对管控链路、查询优化器、执行引擎、存储引擎以及缓存机制等多个环节进行全面优化,显著减少了查询响应时间,适用于BI场景、交互式分析以及近
实时数仓
等对
阿里云大数据AI技术
·
2025-02-20 00:23
阿里云
云原生
MaxCompute
大数据
实时数仓
大数据-267
实时数仓
- ODS Lambda架构 Kappa架构 核心思想
点一下关注吧!!!非常感谢!!持续更新!!!Java篇开始了!MyBatis更新完毕目前开始更新Spring,一起深入浅出!目前已经更新到了:Hadoop(已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)Spark(已更完)Flink(已更完)Cl
m0_74823336
·
2025-02-07 16:57
面试
学习路线
阿里巴巴
大数据
架构
2天的Flink Forward Asia 有什么值得关注的点
流式湖仓和
实时数仓
是两回事啊。新鲜度上有很大的差别,前者
·
2025-02-06 13:05
Java 大视界 -- Java 大数据
实时数仓
的构建与运维实践(55)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。一、欢迎加入【福利社群
青云交
·
2025-02-02 05:40
大数据新视界
Java
大视界
大数据
实时数仓
Flume
Flink
HBase
ClickHouse
Lambda架构
服务行业的数据管理实践:TapData Cloud 如何助力连锁酒店物业的全球化运营优化
维护数据管道的诸多烦扰,轻量替代OGG,Kettle等同步工具,以及基于Kafka的ETL解决方案,「CDC+流处理+数据集成」组合拳,加速仓内数据流转,帮助企业将真正具有业务价值的数据作用到实处,将“
实时数仓
·
2025-01-25 10:01
数据库
【Flink 实战系列】Flink CDC 实时同步 Mysql 全量加增量数据到 Hudi
开发的变化数据获取组件(Changedatacapture),简单的说就是来捕获变更的数据,ApacheHudi是一个数据湖平台,又支持对数据做增删改查操作,所以FlinkCDC可以很好的和Hudi结合起来,打造
实时数仓
JasonLee实时计算
·
2025-01-24 09:31
Flink
实战系列
hbase
spark
大数据
新一代实时神器-Fluss初识及部署
在作者看来,其实Fluss目前的主要替换者是Kafka,它的出现也是为了替换kafka在
实时数仓
链路中
本旺
·
2025-01-20 06:01
大数据
Flink
Fluss
flink
大数据
数据结构
etl
关于大规模
实时数仓
搭建,我有几条心得...
现状闲鱼作为一款闲置交易APP,在二手交易市场中是当之无愧的佼佼者。闲鱼从2014年诞生到现在七整年间持续增长,在这高速增长的背后带来的是每天近百亿的曝光点击浏览等数据,在这些数据规模如此庞大的背后也会带来诸多关于实时性的问题:•用户反馈商品曝光异常,如何快速定位?•产品同学圈了一批商品,如何查看该样本的实时报表?•发现问题总是晚一步,如何在第一时间获取自定义的预警信息?•......为了解决上述
闲鱼技术
·
2025-01-19 06:28
大数据
数据分析
java
编程语言
人工智能
数仓分层ODS、DWD、DWM、DWS、DIM、DM、ADS
往期推荐数仓入门:数据分析模型、数仓建模、离线
实时数仓
、Lambda、Kappa、湖仓一体-CSDN博客数仓常见名词解析和名词之间的关系-CSDN博客数据仓库及数仓架构概述-CSDN博客大数据HBase
青秋.
·
2025-01-17 15:17
数据仓库
大数据
数据仓库
实时数仓
方实际落地如何选型和构建
实时数仓
方实际落地如何选型和构建一、为何需要
实时数仓
架构随着数字化进程的推进,企业产生的数据越来越多,与此同时企业对数据的需求也变得越来越复杂多样。
活在风浪里~
·
2025-01-17 04:15
大数据架构
大数据体系
数据治理
数据仓库
大数据
数据挖掘
YashanDB完成中国信通院关系型数据库安全能力专项测试
崖山数据库YashanDB产品简介崖山数据库系统是深圳计算科学研究院(简称“深算院”)和深圳崖山科技有限公司(简称“崖山科技”)自主研发设计的新型数据库管理系统,提供包括单机主备、共享集群、空间数据库、分布式
实时数仓
等系列数据库产品及配套开发
·
2025-01-16 18:20
数据库sql
离线数仓VS
实时数仓
离线数据仓库(OfflineDataWarehouse)和实时数据仓库(Real-timeDataWarehouse)的实施有一些相似之处,但也存在显著的差异。以下是两者在几个关键方面的对比:相同点:数据集成:都需要从多个数据源提取、转换和加载数据(ETL/ELT)。都需要处理数据清洗、去重和规范化,以保证数据的一致性和准确性。数据建模:都需要进行数据建模,设计数据仓库的星型或雪花模型,定义事实表
james二次元
·
2024-09-13 03:14
数据仓库
数据仓库
大数据
实时数仓
之
实时数仓
架构(Hudi)(1)
目前比较流行的
实时数仓
架构有两类,其中一类是以Flink+Doris为核心的
实时数仓
架构方案;另一类是以湖仓一体架构为核心的
实时数仓
架构方案。
2401_84164527
·
2024-09-09 19:34
程序员
架构
2024年大数据最新
实时数仓
之
实时数仓
架构(Hudi)
技术框架Kafka:用于接入数据源;FlinkCDC:如果直接接入业务数据源可以考虑CDC方式,如果通过Kafka缓冲接入业务数据可以忽略;Flink:用于数据ETL,包括接入数据、处理数据及输出数据全链路数据计算任务;Spark:用于数据ETL,包括处理数据及输出数据全链路数据计算任务;Hudi:湖仓一体数据管理框架,用来管理模型数据,包括ODS/DWD/DWS/DIM/ADS等;Doris:O
2401_84185556
·
2024-09-09 19:34
程序员
大数据
架构
实时数仓
之
实时数仓
架构(Hudi)(1),2024年最新熬夜整理华为最新大数据开发笔试题
+Hudi:湖仓一体数据管理框架,用来管理模型数据,包括ODS/DWD/DWS/DIM/ADS等;+Doris:OLAP引擎,同步数仓结果模型,对外提供数据服务支持;+Hbase:用来存储维表信息,维表数据来源一部分有Flink加工实时写入,另一部分是从Spark任务生产,其主要作用用来支持FlinkETL处理过程中的LookupJoin功能。这里选用Hbase原因主要因为Table的HbaseC
2401_84181221
·
2024-09-09 19:04
程序员
架构
大数据
常见的
实时数仓
方案
常见的
实时数仓
架构有三种。第一种是Lambda架构,是目前主流的一套
实时数仓
架构,存在离线和实时两条链路。
北极冰雨
·
2024-08-30 05:27
大数据
大数据
EMR StarRocks实战——Mysql数据实时同步到SR
下文主要介绍如何使用Flink平台和E-MapReduceStarRocks,通过CTAS&CDAS功能实现
实时数仓
中TP(TransactionProcessi
爱吃辣条byte
·
2024-02-28 09:49
#
StarRocks
数仓建设
大数据
数据仓库
透彻理解
实时数仓
的支撑技术:Upsert Kafka 和 Flink 动态表(Dynamic Table)
博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,京东购书链接:https://item.jd.com/12677623.html,扫描左侧二维码进入京东手机购书页面。动态表本质上是一条流(stream),upsert-kafka映射的数据表底层存储的
Laurence
·
2024-02-20 10:23
大数据专题
upsert-kafka
flink
动态表
原理
解释
更新
实时计算框架 Flink 在教育行业的应用实践
若想实现大规模数据的“即席查询”,就须用实时计算框架构建
实时数仓
来实现。本文通过一个教育行业的应用案例,剖析业务系统对实时计
Java架构师CAT
·
2024-02-10 09:20
揭秘阿里云Flink智能诊断利器——Fllink Job Advisor
丰富而复杂的上下游系统让它能够支撑
实时数仓
、实时风控、实时机器学习等多样化的应用场景。
阿里云大数据AI技术
·
2024-02-06 16:49
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他