E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Flink数据湖
StreamPark发布:
Flink
迎来首个Apache版本
这一版本的发布标志着StreamPark与Apache
Flink
的融合迈出了重要的一步,为用户提供了更好的流处理体验。
MfvShell
·
2025-03-02 04:49
flink
apache
大数据
Flink
Flink
CDC
数据库中读取配置数据,我以前没接触这个技术之前是定时从数据库中获取数据,但是将数据间隔设置太小就会出现问题,所以达不到纯实时的效果.下面开始介绍一下准备工作:支持的数据库(下面是官方的建议:MySQL|Apache
Flink
CDC
LonelyProgramme
·
2025-03-02 04:49
flink
数据库
大数据
Doris、ClickHouse 和
Flink
这三个技术典型的应用场景
Doris、ClickHouse和
Flink
这三个技术在不同业务场景下有各自的成功落地方案,主要用于数据分析、实时计算和高性能查询。
每天瞎忙的农民工
·
2025-03-02 04:19
大数据
clickhouse
flink
大数据
doris
使用
Flink
CDC 实现 MySQL 数据,表结构实时入 Apache Doris
背景现有数据库:mysql数据:库表较多,每个企业用户一个分库,每个企业下的表均不同,无法做到聚合,且表可以被用户随意改动,增删改列等,增加表分析:用户自定义分析,通过拖拽定义图卡,要求实时,点击确认即出现相应结果,其中有无法预判的过滤问题:随业务增长,企业用户越来越多,mysql压力越来越大,已经出现一些图卡加载过慢[mysqlsql]同步流程脚本读取mysql中需要同步的企业,在获取需要同步的
一天两晒网
·
2025-03-01 18:42
doris
mysql
flink
doris
flink
cdc
Streaming ELT 同步 MySQL 到 StarRocks
StreamingELT同步MySQL到StarRocks这篇教程将展示如何基于
Flink
CDC快速构建MySQL到StarRocks的StreamingELT作业,包含整库同步、表结构变更同步和分库分表同步的功能
慧一居士
·
2025-03-01 17:39
大数据
mysql
数据库
数据整合平台Airbyte中的Shopify连接器使用指南
技术背景介绍Airbyte是一种专门用于ELT数据集成的平台,支持从API、数据库和文件到数据仓库和
数据湖
的管道搭建。其拥有最大规模的ELT连接器目录,支持众多的数据仓库和数据库。
bavDHAUO
·
2025-03-01 03:49
python
kafka stream对比
flink
KafkaStreams和Apache
Flink
虽然都支持实时计算,但它们的定位、架构和适用场景存在显著差异。选择哪一个取决于具体的需求、场景和技术栈。
后季暖
·
2025-02-28 14:23
kafka
flink
分布式
四、
数据湖
应用平台架构
数据湖
应用平台是一个用于存储、处理和分析大容量、用途数据的平台。它旨在以隐蔽、高效率的方式,为企业提供全面的数据管理和应用能力。
moton2017
·
2025-02-28 03:51
大数据治理
大数据
数据湖
数据管理
数据架构
数据安全
大数据管理
数据仓库
数据湖
构建
阿里云的
数据湖
构建(DataLake)是一种用于存储和处理大量不同类型数据的解决方案,通常用于大数据分析和机器学习等应用场景。
HaoHao_010
·
2025-02-28 00:25
服务器
云服务器
云计算
阿里云
国产唯一开源湖仓框架LakeSoul 2.0 重磅升级:支持快照回滚、
Flink
和Hive对接
首先,附上Github链接LakeSoul:https://github.com/meta-soul/LakeSoul,可搜索公众号元灵数智,在底部菜单了解我们-用户交流获取官方技术交流群二维码,进群与业内大佬进行技术交流。DMetaSoul团队于7月初发布了LakeSoul2.0版本,对1.0版本进行了多方面升级优化,提高了自身架构设计的灵活性,也更好地适应客户未来业务高速发展的需要。2.0版本
元灵数智
·
2025-02-28 00:52
大数据
数据库
spark
【数据分析】4 商业数据分析技能模型总结
优秀的商业分析师需要具备的能力数据分析能力逻辑思维能力赢得结果能力一、数据分析能力扩展:工具链生态与进阶场景1.数据获取技术升级企业级数据源管理:
数据湖
架构(AWSS3/阿里云OSS)与数据仓库(Snowflake
loyd3
·
2025-02-27 19:44
数据分析
数据分析
数据挖掘
Flink
连接kerberos认证的hive 并使用table API
有个问题
flink
的kerveros通过配置设置。但是HiveCatalog还需要再次使用UserGroupInformation再次认证。
lisacumt
·
2025-02-27 05:27
flink
hive
大数据
Flink
事件时间案例:电商订单实时分析的奇妙之旅[特殊字符]
Flink
事件时间案例:电商订单实时分析的奇妙之旅嘿,小伙伴们!
狮歌~资深攻城狮
·
2025-02-26 22:27
linq
c#
使用 Airbyte 数据集成平台加载 Shopify 数据
技术背景介绍Airbyte是一个用于API、数据库及文件到仓库和
数据湖
的ELT管道的数据集成平台。它拥有最全的ELT连接器目录,为各种数据源提供强大支持。
fgayif
·
2025-02-26 19:33
python
深入理解
Flink
中的 .name() 和 .uid() 方法
在Apache
Flink
中,.name()和.uid()是两个常用的配置方法。
Ray.1998
·
2025-02-26 15:06
大数据
flink
kafka
spark
hive
hadoop
Flink
Checkpoint机制详解
Apache
Flink
作为流处理的领先框架,提供了一种强大的机制来确保系统的容错性与数据的一致性,这就是
Flink
的Checkpoint机制。
Ray.1998
·
2025-02-26 15:05
大数据
flink
大数据
开发语言
spark
zookeeper
kafka
hive
Spring Boot中整合
Flink
CDC 数据库变更监听器来实现对MySQL数据库
Flink
CDC(ChangeDataCapture)是
Flink
的一种数据实时获取的扩展,用于捕获数据库中的数据变化,并且通过实时流式处理机制来操作这些变化的数据,在
Flink
CDC中通过Debezium
坚定信念,勇往无前
·
2025-02-26 14:01
java
数据库
spring
boot
flink
华为云FusionInsight MRS
Flink
SQL 复杂嵌套Json解析最佳实践
Flink
作为流批一体的计算引擎,致力于提供一套SQL支持全部应用场景,
Flink
SQL的实现也完全遵循AN
华为云技术精粹
·
2025-02-26 14:59
云计算
华为云
图数据库的易用性—GES与
Flink
的对接
数字化时代,业务的实时处理需求越来越迫切,实时预警、实时风控、实时推荐等,
Flink
作为新一代流批统一的计算引擎,具有独特的天然流式计算特性和更为先进的架构设计的特点,它可以从不同的第三方存储引擎中读取数据
华为云技术精粹
·
2025-02-26 14:59
云计算
华为云
消息中间件 --- Apache Pulsar
OpenMessaging协议实现(透明层协议)场景3:流式队列:自定义Kafka0.8-Source(Source开发)场景4:流式队列:Function消息过滤(消息过滤)场景5:流式队列:Pulsar
Flink
Connector
johnrui
·
2025-02-26 11:11
云计算
Flink
-02-
flink
技术架构及工作原理
Flink
组件栈自下而上,分别针对每一层进行解释说明:Deployment该层主要涉及了
Flink
的部署模式,
Flink
支持多种部署模式:本地、集群(Standalone/YARN)、云(GCE/EC2
TRX1024
·
2025-02-26 10:35
Flink
Flink
集群架构
在上一章节我们对
flink
有了一个基本的了解。从它的应用的场景以及它的一些基本的一些核心的一些概念。
流量留
·
2025-02-26 06:32
Apache
Flink
FLINK
java
运维
数据库
maven引包爆红 failed to transfer from http://maven.aliyun.com/nexus/content/groups/public during a previ
之前一致可以正常使用,然后突然无法引入新的包无法引包org.apache.
flink
:
flink
-streaming-java_2.12:pom:1.13.1failedtotransferfromhttp
sui5yue6_
·
2025-02-25 15:21
maven
java
《聊聊
Flink
:大数据世界的神秘“小能手”》
《聊聊
Flink
:大数据世界的神秘“小能手”》宝子们,咱今天来唠唠一个有点神秘的东西——
Flink
。你要是刚听到这个名字,可能会觉得像什么魔法咒语似的。其实啊,它可没那么玄乎,但确实挺厉害的。
狮歌~资深攻城狮
·
2025-02-25 15:18
大数据技术
大数据
如何通过高效的缓存策略无缝加速湖仓查询
随着
数据湖
仓和查询引擎架构的发展,开放文件格式和表格格式为数据分析带来了更好的生态兼容性和灵活性。然而,在实际应用中,特别是面向用户的实时查询场景下,数
·
2025-02-24 14:57
开源数据分析
构建多维度用户特征矩阵,开发基于
Flink
CEP的高风险用户识别模型
基于
Flink
SQLCEP构建多维度用户特征矩阵与高风险用户识别模型,需结合实时特征计算、动态规则管理和复杂事件检测能力。
千叶真尹
·
2025-02-23 08:12
linq
c#
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)Spark(已更完)
Flink
m0_74823705
·
2025-02-22 21:50
面试
学习路线
阿里巴巴
大数据
架构
优化
Flink
消费 Kafka 数据的速度:实战指南
在使用
Flink
消费Kafka数据时,你可能会遇到消费速率较慢的问题。
Ray.1998
·
2025-02-22 11:01
大数据
flink
kafka
大数据
【
Flink
实战】
Flink
网络内存和托管内存
网络内存配置项2.托管内存二、网络内存与托管内存的关系1、互相依赖,优化执行性能2、基于任务特性设置内存分配3、内存竞争与背压机制网络内存主要负责Taskmanager之间的网络数据传输的内存,托管内存主要负责
Flink
roman_日积跬步-终至千里
·
2025-02-22 09:46
#
flink
实战
flink
网络
服务器
【
Flink
实战】
Flink
中 Akka 通信与内存占用分析
Akka是
Flink
中一个分布式通信框架,负责处理集群内各个组件之间的消息传递、任务调度、状态更新以及故障恢复等操作。
roman_日积跬步-终至千里
·
2025-02-22 09:45
#
flink
实战
flink
大数据
鹰角基于
Flink
+ Paimon + Trino 构建湖仓一体化平台实践项目
摘要:本文整理自鹰角大数据开发工程师,ApacheHudiContributor朱正军老师在
Flink
ForwardAsia2024生产实践(二)专场中的分享。
·
2025-02-21 19:13
flink大数据实时计算
【AI大数据】数据中台的数据分析与挖掘:从数据到业务的决策
文章目录1.前言2.基本概念术语说明2.1数据模型及其实体关系实体(Entity)属性(Attribute)实体关系(EntityRelationships)2.2数据仓库2.3分析引擎2.4噪声数据2.5
数据湖
AI天才研究院
·
2025-02-21 08:34
DeepSeek
R1
&
大数据AI人工智能大模型
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
mysql实时同步到es
测试了多个方案同步,最终选择oceanu产品,底层基于
Flink
cdc1、实时性能够保证,binlog量很大时也不产生延迟2、配置SQL即可完成,操作上简单下面示例mysql的100张分表实时同步到es
·
2025-02-20 17:22
数据库
Flink
CDC报错ArrayIndexOutOfBoundsException解决思路
Flink
CDC用两个并行度会报错。一个并行度就不会报错。不知道是什么原因?同步java.lang.ArrayIndexOutOfBoundsException?
学亮编程手记
·
2025-02-20 08:53
大数据
flink
doris
数据统一高效管理 HashData支撑“数智石油”高质量发展
酷克数据(HashData)作为赋能石油石化企业数字化转型的先进代表,受邀参加此次行业盛会,展示了与昆仑数智携手打造的油气行业
数据湖
联合解决方案和创新成果。
·
2025-02-19 15:02
数据库
Flink
源码笔记03—StreamGraph到JobGraph
文章目录简介入口函数traverseStreamGraphAndGenerateHashesgenerateDeterministicHashgenerateUserSpecifiedHashsetChainingisChainable简介JobGraph可以认为是StreamGraph的优化图,它将一些符合特定条件的operators合并成一个operatorchain,以减少数据在节点之间序列
董嘻嘻
·
2025-02-19 07:29
Flink源码笔记
flink
java
big
data
flink
核心特性
Apache
Flink
核心特性详解一、流处理与批处理的统一
Flink
的核心设计理念之一是将流处理和批处理统一在一个框架中。这种统一性使得
Flink
在处理实时数据和批量数据时具有高度的灵活性和一致性。
24k小善
·
2025-02-19 06:55
flink
大数据
java
架构
flink
反压详解
Flink
背压/反压(Backpressure)详解在Apache
Flink
中,背压(Backpressure)是一个常见的性能问题,通常表现为数据流在某些节点处积压,导致整体处理速度下降甚至停滞。
24k小善
·
2025-02-19 06:55
flink
架构
大数据
AI编程
十四、
Flink
源码阅读--JobGraph生成过程
publicJobSubmissionResultrun(
Flink
Plancompil
灰二和杉菜
·
2025-02-19 06:54
Apache
Flink
Flink
JobGraph生成源码分析
最新Apache Hudi 1.0.1源码编译详细教程以及常见问题处理
1.最新ApacheHudi1.0.1源码编译2.
Flink
、Spark、Hive集成Hudi1.0.13.
flink
streaming写入hudi目录1.版本介绍2.安装maven2.1.下载maven2.2
Toroidals
·
2025-02-19 06:51
大数据组件安装部署教程
hudi1.0.1
源码编译
教程
最新
DeepSeek的训练与优化流程
DeepSeek的训练与优化流程一、数据工程体系1.多模态数据融合处理动态
数据湖
架构:实时摄入互联网文本、科学论文、专利文献、传感器数据等20+数据源日均处理原始数据量达1.2PB,支持200+文件格式自动解析智能清洗流水线
程序猿000001号
·
2025-02-18 17:01
DeepSeek
训练
优化
数据仓库和
数据湖
数据仓库和数据库
数据仓库和
数据湖
是两种不同的数据存储解决方案,它们在设计、用途和数据管理方式上有着显著的区别。
qq_25467441
·
2025-02-18 12:11
数据仓库
数据库
数据仓库、
数据湖
和
数据湖
仓
数据仓库、
数据湖
和
数据湖
仓是三种常见的数据存储和管理技术,各自有不同的特点和适用场景。
阿湯哥
·
2025-02-18 11:58
数据仓库
spark
大数据
Flink
提交py
flink
任务
1.官方文档:
flink
1.14:https://nightlies.apache.org/
flink
/
flink
-docs-release-1.14/docs/deployment/cli/#submitting-py
flink
-jobs
flink
1.18
Leo_Hu666
·
2025-02-17 18:59
flink
大数据
python
pyflink
Flink
在指定时间窗口内统计均值,超过阈值后报警
2、思路使用
flink
的双流join,配置数据使用广播流,设备数据使用普通流。3、实现代码packagecu.
小的~~
·
2025-02-17 17:49
flink
均值算法
大数据
数据仓库与
数据湖
的协同工作:智慧数据管理的双引擎
数据仓库与
数据湖
的协同工作:智慧数据管理的双引擎引言在数据驱动的今天,企业和组织收集和存储的数据量正以惊人的速度增长。如何高效管理和利用这些数据,成为了决策者和技术专家的共同难题。
Echo_Wish
·
2025-02-17 07:58
实战高阶大数据
人工智能
科技
大数据
Flink
SQL 优化实战 - 维表 JOIN 优化
作者:龙逸尘,腾讯CSIG高级工程师背景介绍维表(DimensionTable)是来自数仓建模的概念。在数仓模型中,事实表(FactTable)是指存储有事实记录的表,如系统日志、销售记录等,而维表是与事实表相对应的一种表,它保存了事实表中指定属性的相关详细信息,可以跟事实表做关联;相当于将事实表上经常重复出现的属性抽取、规范出来用一张表进行管理。在实际生产中,我们经常会有这样的需求,以原始数据流
腾讯云大数据
·
2025-02-17 04:01
大数据
数据库
flink
sql
阿里云RDS到亚马逊云RDS的实时数据同步方案详解
KDA基于Apache
Flink
,支持使用SQL或J
ivwdcwso
·
2025-02-17 00:33
运维
阿里云
云计算
aws
kda
数据同步
Flink
安装阿里云docker compose部署及相关组件
Flink
安装脚本文件version:"2.2"services:jobmanager:image:
flink
:1.15.2-java11expose:-"6123"ports:-"8081:8081"
vellerzheng
·
2025-02-16 21:08
部署运维
flink
docker
大数据
使用Docker搭建
Flink
集群
目录使用Docker搭建
Flink
集群docker-compose一键搭建步骤附录参考资料使用Docker搭建
Flink
集群在学习大数据框架的时候,需要一个真实的环境。
O_1CxH
·
2025-02-16 20:34
Flink大数据
Kafka大数据
docker
flink
容器
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他