E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Flink个人学习笔记
FFA 2024 「流批一体」专场:探索在不同场景的流批一体
Flink
ForwardAsia2024即将盛大开幕!作为Apache
Flink
社区备受期待的年度盛会之一,本届大会将于11月29至30日在上海隆重举行。
Apache Flink
·
2025-01-20 06:03
Scaleph:基于Kubernetes的开放式数据平台
Scaleph:基于Kubernetes的开放式数据平台scalephOpendataplatformbasedon
Flink
andKubernetes,supportsweb-uiclick-and-dropdataintegrationwithSeaTunnelbackendedby
Flink
engine
尤淞渊
·
2025-01-19 19:19
深入
Flink
: 源码解读数据倾斜代码落地
上篇文章,我们详细说了通过使得
Flink
每个并行子任务上面都有对应的key来解决数据倾斜。但是我们只说了这个方案的思想和设计理解,还没有把这种方案真正应用到我们的
Flink
任务当中。
·
2025-01-19 19:52
java
Flink
(十):DataStream API (七) 状态
1.状态的定义在Apache
Flink
中,状态(State)是指在数据流处理过程中需要持久化和追踪的中间数据,它允许
Flink
在处理事件时保持上下文信息,从而支持复杂的流式计算任务,如聚合、窗口计算、联接等
Leven199527
·
2025-01-19 11:41
Flink
flink
大数据
Apache
Flink
"Apache
Flink
istheopensourcestreamprocessingframeworkfordistributed,high-performance,ready-to-use,andaccuratestreamprocessingapplications
morcake
·
2025-01-19 08:41
flink
大数据
一文帮你搞懂
flink
中窗口的分类(一)
Window可以分成两类:CountWindow:按照指定的数据条数生成一个Window,与时间无关。滚动计数窗口,每隔N条数据,统计前N条数据滑动计数窗口,每隔N条数据,统计前M条数据TimeWindow:按照时间生成Window。(重点)滚动时间窗口,每隔N时间,统计前N时间范围内的数据,窗口长度N,滑动距离N滑动时间窗口,每隔N时间,统计前M时间范围内的数据,窗口长度M,滑动距离N还有一种特
知否&知否
·
2025-01-19 07:36
flink中窗口及其函数分类
flink
大数据
Java 大视界 -- Java 驱动大数据流处理:Storm 与
Flink
入门(六)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:大数
青云交
·
2025-01-19 05:50
大数据新视界
Java
大视界
Flink
Storm
大数据流处理
实时数据处理
架构
实时监控
数据分析
java
【大数据】
Flink
CDC 实时同步mysql数据
目录一、前言二、
Flink
CDC介绍2.1什么是
Flink
CDC2.2
Flink
CDC特点2.3
Flink
CDC核心工作原理2.4
Flink
CDC使用场景三、常用的数据同步方案对比3.1数据同步概述3.1.1
小码农叔叔
·
2025-01-19 02:16
springboot
入门到精通
大数据
Flink
CDC
Flink
CDC同步数据
Flink
CDC数据同步
Flink
使用 Kafka 作为数据源时遇到了偏移量提交失败的问题
具体的错误日志21:43:57.069[KafkaFetcherforSource:CustomSource->Map->Filter(1/1)#2]ERRORorg.apache.kafka.clients.consumer.internals.ConsumerCoordinator-[ConsumerclientId=consumer-my-group-6,groupId=my-group]O
java我跟你拼了
·
2025-01-18 23:19
异常笔记
flink
kafka
大数据
2、
Flink
在 DataStream 和 Table 之间进行转换
1.概述TableAPI和DataStreamAPI都可以处理有界流和无界流。DataStreamAPI提供了流处理的基础(时间、状态和数据流管理);TableAPI抽象了许多内部内容,并提供了一个结构化和声明性的API;在处理历史数据时,需要管理有边界的流;无边界流出现在实时处理场景中,这些场景可能需要先使用历史数据进行初始化。为了高效执行,这两个API都以优化的批处理执行模式处理有界流。由于批
猫猫爱吃小鱼粮
·
2025-01-18 22:10
Flink
SQL
flink
大数据
Flink
常见面试题
1、
Flink
的四大特征(基石)checkpoint:基于Chandy-Lamport算法,实现了分布式一致性快照,提供了一致性的语义。State:丰富的StateAPI。
知否&知否
·
2025-01-18 16:14
flink
大数据
kafka
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)Spark(已更完)
Flink
武子康
·
2025-01-18 10:29
大数据
离线数仓
大数据
数据仓库
java
后端
hadoop
hive
Apache
Flink
2.0-preview released
Apache
Flink
社区正在积极准备
Flink
2.0,这是自
Flink
1.0发布8年以来的首次大版本发布。
·
2025-01-18 00:58
flink大数据
2024年最新Python:Page Object设计模式_python page object,BTAJ大厂最新面试题汇集
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、
Flink
)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
m0_60707708
·
2025-01-17 20:36
程序员
python
设计模式
开发语言
2024年总结:大转向
职业转向今年我在职业上尝试做了一个转向,具体的结果可能需要比较长的时间来检验我选择是否正确,所以转向的细节我就不全部展开了,可以确定是我依然会专注在Infra和BigData,比如今年我发布了SparkSQL和
Flink
SQL
·
2025-01-17 20:11
年度总结
Flink
批作业如何在 Master 节点出错重启后恢复执行进度?
摘要:本文撰写自阿里云研发工程师李俊睿(昕程),主要介绍
Flink
1.20版本中引入了批作业在JMfailover后的进度恢复功能。
·
2025-01-17 19:30
flink大数据
读
Flink
源码谈设计:Metric
版本日期备注1.02021.10.8文章首发1.12022.3.9fixtypo1.22022.7.3fixtypo0.前言前阵子笔者涉及了些许监控相关的开发工作,在开发过程中也碰到过些许问题,便翻读了
Flink
·
2025-01-17 19:28
javaflink
Flink
CDC 在阿里云实时计算
Flink
版的云上实践
摘要:本文整理自阿里云高级开发工程师,Apache
Flink
Committer阮航老师在
Flink
ForwardAsia2024生产实践(三)专场中的分享,主要分为以下四个方面:一、
Flink
CDC&实时计算
·
2025-01-17 15:17
flink大数据实时计算
Apache PAIMON 学习
新一代实时数据湖技术,ApachePAIMON兼容Apache
Flink
、Spark等主流计算引擎,并支持流批一体化处理、快速查询和性能优化,成为加速AI转型的重要工具。
潇锐killer
·
2025-01-16 22:54
学习
nosql数据库技术与应用知识点
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、
Flink
皆过客,揽星河
·
2024-09-16 08:42
NoSQL
nosql
数据库
大数据
数据分析
数据结构
非关系型数据库
个人学习笔记
7-6:动手学深度学习pytorch版-李沐
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络(fullyconvolutionalnetwork,FCN)采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积(transposedconvolution)实现的,输出的类别预测与输入图像在像素级别上具有一一对应关系:通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
浪子L
·
2024-09-16 00:45
深度学习
深度学习
笔记
计算机视觉
python
人工智能
神经网络
pytorch
全面指南:用户行为从前端数据采集到实时处理的最佳实践
本文将详细介绍如何通过前端JavaScript代码采集用户行为数据、利用API和Kafka进行数据传输、通过
Flink
实时处理数据的完整流程。
数字沉思
·
2024-09-15 11:28
营销
流量运营
系统架构
前端
内容运营
大数据
详解
Flink
的常见部署方式
一、常见部署模式分类1.按是否依赖外部资源调度1.1Standalone模式独立模式(Standalone)是独立运行的,不依赖任何外部的资源管理平台,只需要运行所有
Flink
组件服务1.2Yarn模式
文刀小桂
·
2024-09-15 07:31
Flink
flink
大数据
大数据之
flink
与hive
其实吧我不太想写
flink
,因为线上经验确实不多,这也是我需要补的地方,没有条件创造条件,先来一篇吧
flink
:高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理,高效离线分析和数据挖掘数据仓库的引擎丰富数据源
星辰_mya
·
2024-09-14 21:17
大数据
flink
hive
Java中的大数据处理框架对比分析
本文将重点介绍ApacheHadoop、ApacheSpark、Apache
Flink
和ApacheStorm这四种流行的
省赚客app开发者
·
2024-09-14 20:41
java
开发语言
一文搞懂
Flink
Task 数据交互之数据写源码
一文搞懂
Flink
Task数据交互之数据写源码1.RecordWriterOutput2.RecordWriter3.数据分区器ChannelSelector4.数据输出模型ResultPartition5
mn_kw
·
2024-09-14 15:39
flink
交互
java
概率图模型(PGM)综述
Re
fLink
:http://www.sigvc.org/bbs/thread-728-1-1.htmlGraphicalModel的基本类型基本的GraphicalModel可以大致分为两个类别:贝叶斯网络
医学影像处理
·
2024-09-14 08:21
概率图模型
概率图模型
综述
Python基础知识进阶之正则表达式_头歌python正则表达式进阶
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、
Flink
)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
前端陈萨龙
·
2024-09-13 13:50
程序员
python
学习
面试
大数据新视界 --大数据大厂之
Flink
强势崛起:大数据新视界的璀璨明珠
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:Ja
青云交
·
2024-09-13 08:50
大数据新视界
Flink
大数据
数据类型
实时处理
流处理
框架对比
应用场景
数据处理
大数据新视界
数据库
flink
增量检查点降低状态依赖实现的详细步骤
使用外部状态存储服务,减少
Flink
状态后端的负担。拆分状态和将状态外部化到其他服务可以帮助减少作业的状态依赖,从而降低恢复时间和复杂度。以下是详
goTsHgo
·
2024-09-12 13:15
Flink
大数据
分布式
flink
大数据
flink
table factory基础知识
一、概述在
flink
中很多组件都是TableFactory的子类。
loukey_j
·
2024-09-12 07:01
2024年最全使用Python求解方程_python解方程(1),字节面试官迟到
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、
Flink
)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
2401_84569545
·
2024-09-12 02:33
程序员
python
学习
面试
01-
Flink
安装部署及入门案例(仅供学习),音视频时代你还不会NDK开发
先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵
小猪佩琪962
·
2024-09-11 07:18
2024年程序员学习
flink
学习
大数据
比较Spark与
Flink
ApacheSpark和Apache
Flink
都是目前非常流行的大数据处理引擎,但它们在架构、处理模式、应用场景等方面有一些显著的区别。
傲雪凌霜,松柏长青
·
2024-09-11 04:29
大数据
后端
spark
flink
大数据
Apache
Flink
:实时流处理与批处理的统一框架
Apache
Flink
是一个开源的流处理框架,它打破了这种界限,提供了一个统一的平台来处理实时流数据和批处理数据。
小码快撩
·
2024-09-11 04:28
flink
大数据
flink
独立集群部署
#
flink
独立集群部署说明安装环境三台服务器47.106.23.1(master)47.112.173.2(worker1)47.115.162.3(worker1)提前装好jdk和ssh,以下操作最好不要用
嘎子吱吱吱吱
·
2024-09-10 16:28
flink
hadoop
linux
Flink
的时间与watermarks详解
当我们在使用
Flink
的时候,避免不了要和时间(time)、水位线(watermarks)打交道,理解这些概念是开发分布式流处理应用的基础。那么
Flink
支持哪些时间语义?
大数据技术与数仓
·
2024-09-09 21:44
实时数仓之实时数仓架构(Hudi)(1)
目前比较流行的实时数仓架构有两类,其中一类是以
Flink
+Doris为核心的实时数仓架构方案;另一类是以湖仓一体架构为核心的实时数仓架构方案。
2401_84164527
·
2024-09-09 19:34
程序员
架构
2024年大数据最新实时数仓之实时数仓架构(Hudi)
技术框架Kafka:用于接入数据源;
Flink
CDC:如果直接接入业务数据源可以考虑CDC方式,如果通过Kafka缓冲接入业务数据可以忽略;
Flink
:用于数据ETL,包括接入数据、处理数据及输出数据全链路数据计算任务
2401_84185556
·
2024-09-09 19:34
程序员
大数据
架构
实时数仓之实时数仓架构(Hudi)(1),2024年最新熬夜整理华为最新大数据开发笔试题
湖仓一体数据管理框架,用来管理模型数据,包括ODS/DWD/DWS/DIM/ADS等;+Doris:OLAP引擎,同步数仓结果模型,对外提供数据服务支持;+Hbase:用来存储维表信息,维表数据来源一部分有
Flink
2401_84181221
·
2024-09-09 19:04
程序员
架构
大数据
Flink
- CEP
Hadoop3.2集群新版本的搭建详细讲解过程,从下面第一张官方的图来看,最新版是3.2,所以大猪将使用3.2的版本来演示,过程中遇到的坑留给自己,把路留给你们,IT之路还有大猪。大猪为了把文章压缩极简方便小伙伴阅读,将使用root帐号进行所有操作。准备两台主机10.211.55.11、10.211.55.12对应的hostname为m1.example.com、m2.example.com具体命
kikiki1
·
2024-09-08 21:46
chapter01 Java语言概述 知识点Note
JavaSEJavaEEJavaME大数据Java基础常用技术栈mysqlJDBCSSMspring+springmvc+mybatisLinuxnacosHadoop
Flink
JAVAEE消息队列rabbitMQdocker
月下绯烟
·
2024-09-08 18:42
Java
java
开发语言
【无标题】大数据之批处理,流处理,批流一体概念
Spark和
Flink
都支持批处理,其中Spark使用的是批处理模型,即将一批数据一次性读入内存,然后对其进行处理,处理完成后再将结果写入磁盘。
数字天下
·
2024-09-08 09:43
大数据
python
flink
_《
Flink
官方文档》Python 编程指南测试版
原文链接译者:hjjxd校对:清英
Flink
中的分析程序实现了对数据集的某些操作(例如,数据过滤,映射,合并,分组)。这些数据最初来源于特定的数据源(例如来自于读文件或数据集合)。
weixin_39846361
·
2024-09-08 08:04
python
flink
flink
---window
Window介绍DataStream:https://nightlies.apache.org/
flink
/
flink
-docs-release-1.17/zh/docs/dev/datastream/
搞数据的小杰
·
2024-09-08 00:38
flink
大数据
Flink
(1.13) 的window机制(一)
窗口概述在流处理应用中,数据是连续不断的,因此我们不可能等到所有数据都到了才开始处理。当然我们可以每来一个消息就处理一次,但是有时我们需要做一些聚合类的处理,例如:在过去的1分钟内有多少用户点击了我们的网页。在这种情况下,我们必须定义一个窗口,用来收集最近一分钟内的数据,并对这个窗口内的数据进行计算。流式计算是一种被设计用于处理无限数据集的数据处理引擎,而无限数据集是指一种不断增长的本质上无限的数
万事万物
·
2024-09-07 22:31
py
flink
自定义函数
frompy
flink
.datastreamimportStreamExecutionEnvironmentfrompy
flink
.common.typeinfoimportTypesfrompy
flink
.datastreamimportStreamExecutionEnvironmentfrompy
flink
.tableimportStreamTableEnvironmentfrompyfli
scan724
·
2024-09-07 15:05
Flink实时计算
python
开发语言
flink
问题记录
文章目录1.Causedby:java.lang.UnsatisfiedLinkError:org.apache.hadoop.util.NativeCrc32.nativeComputeChunkedSums(IILjava/nio/ByteBuffer;ILjava/nio/ByteBuffer;IILjava/lang/String;JZ)V原因java.util.concurrent.Ex
Jhon_yh
·
2024-09-07 15:34
flink
flink
hadoop
大数据
Py
flink
教程(三):自定义函数
该文章例子py
flink
环境是apache-
flink
==1.13.6Python自定义函数是Py
Flink
TableAPI中最重要的功能之一,其允许用户在Py
Flink
TableAPI中使用Python
yuxj记录学习
·
2024-09-07 15:33
学习笔记
学习
pyflink
py
flink
滚动窗口实例
写在前头:更多大数据相关精彩内容请进我的知识星球,每周定期更新正篇技术路线:模拟kafka生产者发送数据——>
flink
对kafka数据实时计算处理——>处理后的数据发送到kafka1、模拟客流数据的生产者
菜鸟社长
·
2024-09-07 15:31
菜鸟的大数据进阶之路
大数据进阶之路
kafka
big
data
python
flink
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他