E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据计算-Flink
Flink
API开发之状态管理
案例用到的测试数据请参考文章:
Flink
自定义Source模拟数据流原文链接:https://blog.csdn.net/m0_52606060/article/details/135436048
Flink
Appreciate(欣赏)
·
2024-01-19 08:18
Flink
java
java
flink
大数据
Flink
API(二)
一、Transformation操作1,map、flapmap、filterpublicclasstransTest1_Base{publicstaticvoidmain(String[]args)throwsException{StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment();en
forerunner123
·
2024-01-19 08:17
Flink
Flink
1.17 基础知识
Flink
1.17基础知识来源:B站尚硅谷目录
Flink
1.17基础知识
Flink
概述
Flink
是什么
Flink
特点
Flink
vsSparkStreaming
Flink
的应用场景
Flink
分层API
Flink
魅美
·
2024-01-19 08:16
大数据基础
大数据
flink
【大数据】
Flink
测试利器:DataGen
Flink
测试利器:DataGen1.什么是
Flink
SQL?2.什么是Connector?
G皮T
·
2024-01-19 08:45
#
Flink
大数据
flink
测试
DataGen
测试数据
Connector
FlinkSQL
Flink
的KeyedProcessFunction基于Event Time和Process Time的定时器用法实例分析
FLink
处理函数简介在
Flink
底层,我们可以不定义任何具体的算子(比如map,filter,或者window),而只是提炼出一个统一的【处理】(process)操作——它是所有转换算子的一个概括性的表达
PONY LEE
·
2024-01-19 08:14
flink
flink
大数据
Flink
API开发之容错机制
概述在
Flink
中,有一套完整的容错机制来保证故障后的恢复,其中最重要的就是检查点。
Appreciate(欣赏)
·
2024-01-19 08:12
Flink
java
java
flink
大数据
一站式大数据平台XSailboat简介--Hadoop、Hive、
Flink
、DataStudio、数据服务、API网关、认证中心、数据可视化、离线分析、实时计算、应用引擎等
1.引言从2021年年底开始,笔者带领一个微型团队开始开发我们的大数据平台XSailboat,目前已经初步具备实用化条件,产品将持续性地开发、完善、迭代升级。在接下来的一段时间,笔者将陆续编写一些关于大数据平台实现相关的技术文档,有兴趣的从事大数据相关的同学,可以关注收藏一下,交流一下开发技术。如果对我们的大数据平台XSailboat感兴趣的同学比较多,希望将其应用于学习或商业项目中,我们可以在条
OkGogooXSailboat
·
2024-01-19 06:26
大数据平台开发技术
大数据
【
Flink
】
Flink
SQL读取Mysql表中时间字段相差13个小时
问题:
Flink
版本1.13,在我们使用
Flink
SQL读取Mysql中数据的时候,发现读取出来的时间字段中的数据和Mysql表中的数据相差13个小时,Mysql建表语句及插入的数据如下;CREATETABLE
一杯咖啡半杯糖
·
2024-01-19 06:17
Flink实战
flink
mysql
大数据
Flink
简介与应用场景
Flink
是一个开源的分布式,高性能,高可用,准确的流处理框架。主要由Java代码实现,支持实时流处理和批处理,批数据只是流数据的一个极限案例。支持了迭代计算,内存管理和程序优化。
Real_man
·
2024-01-19 03:42
FineBI实战项目一(25):实战项目一总结
没有集群,hdfs、hive、spark、kafka、
flink
等等都没有2解决方案mysql数据同步尽量和业务系统保持一致,以便后期出现问题排查。mysql同步到数仓,数仓
不死鸟.亚历山大.狼崽子
·
2024-01-19 02:39
FineBI
finebi
Flink
基础系列26-
Flink
状态管理
一.状态概述:
Flink
中的状态:算子状态(OperatorState)键控状态(KeyedState)状态后端(StateBackends)image.png由一个任务维护,并且用来计算某个结果的所有数据
只是甲
·
2024-01-19 01:56
【性能调优】local模式下
flink
处理离线任务能力分析
文章目录一.
flink
的内存管理1.Jobmanager的内存模型2.TaskManager的内存模型2.1.模型说明2.2.通讯、数据传输方面2.3.框架、任务堆外内存2.4.托管内存3.任务分析二.
roman_日积跬步-终至千里
·
2024-01-18 23:18
#
flink性能调优
#
flink
实战
flink
大数据
Flink
学习
批处理和流处理的区别批处理和流处理是数据处理的两种主要方式,它们在处理时间、数据量和处理方式上有一些不同。处理时间:批处理是在一段时间内收集的数据,然后进行处理,一般情况下,这些数据是静态的,处理完成后再进行下一次处理。流处理则是实时(或者接近实时)处理数据,数据一进入系统就被处理,不需要等待整批数据都收集完毕再进行处理。数据量:批处理通常处理的数据量非常大,因为它需要等待一段时间内的数据收集完毕
~kiss~
·
2024-01-18 21:31
flink
flink
学习
大数据
Flink
Sql bug :OVER windows‘ ordering in stream mode must be defined on a time attribute.
flink
sql报错org.apache.
flink
.table.api.TableException:OVERwindows’orderinginstreammodemustbedefinedonatimeattribute.org.apache.
flink
.table.api.TableException
Direction_Wind
·
2024-01-18 21:58
报错调试记录
bug
flink
sql bug:In ‘hash‘ distribution mode with equality fields set, partition field ‘1000: ymd_bucket
partitionfield‘1000:ymd_bucket:bucket32’shouldbeincludedinequalityfields:‘[distinct_id,tip_page_id,rwk]’场景
flink
sql
Direction_Wind
·
2024-01-18 21:58
报错调试记录
哈希算法
flink
大数据
Hologres +
Flink
流式湖仓建设
Hologres+
Flink
流式湖仓建设1
Flink
+Hologres特性1.2实时维表Lookup1.3高性能实时写入与更新1.4多流合并1.5Hologres作为
Flink
的数据源1.6元数据自动发现与更新
Direction_Wind
·
2024-01-18 21:56
hologres
技术调研
flink
大数据
PiflowX组件 - Elasticsearch7Write
计算引擎
flink
组件分组ElasticSearch端口Inport:默认端口outport:默认端口组件属性名称展示名称默认值允许值是否必填描述例子hostshosts“”无是要连接到的一台或多台Elasticsearch
PiflowX
·
2024-01-18 17:08
大数据
spark
big
data
flink
hadoop
Dinky为大数据框架
Flink
提供交互式平台,让你学习
Flink
SQL 更加轻松,并且掌握
Flink
技能!
它是一个基于Apache
Flink
的一站式实时计算平台,致力于流批一体和湖仓一体的探索与实践。作为一个开箱即用、易扩展的平台,Dinky可以方便地连接OLAP、数据湖等众多框架。
知识分享小能手
·
2024-01-18 17:59
大数据
学习心得体会
大数据
flink
学习
5 一文看完
flink
的内存管理
其中对齐填充是没用的,纯粹是为了让对象的大小到达8的倍数2)FullGC非常影响性能,对大数据量的计算来说,fullGC可能会持续很久(秒级甚至分钟级)3)OOM导致JVM崩溃,因为是
大数据计算
,很有可能会分配出大的对象
LQC_gogogo
·
2024-01-18 15:11
flink
1.13 event时间不触发窗口问题记录
flink
初学者,有问题欢迎讨论一、问题记录1.出错代码代码如下(示例):valenv=StreamExecutionEnvironment
x_iaoa_o
·
2024-01-18 13:47
flink
大数据
big
data
Flink
应如何处理窗口中迟到的数据?
一、如何处理迟到的数据三个步骤:.1设置水位线延迟时间因为水位线的延迟主要是用来对付分布式网络传输导致的数据乱序,而网络传输的乱序程度一般并不会很大,大多集中在几毫秒至几百毫秒。所以实际应用中,我们往往会给水位线设置一个“能够处理大多数乱序数据的小延迟”。一般情况就不应该把它的延迟设置得太大,否则流处理的实时性就会大大降低2.允许窗口处理迟到数据由于大部分乱序数据已经被水位线的延迟等到了,所以往往
轩裳已逝铭崖
·
2024-01-18 13:17
flink
java
大数据
Flink
-时间和窗口(水位线、窗口、迟到数据的处理等)
文章目录时间和窗口时间水位线(Watermark)时间和窗口水位线有序和无序流的插入水位线生成策略(WatermarkStrategies)水位线的传递窗口(Window)窗口窗口的分类窗口API概述窗口分配器(WindowAssigners)时间窗口计数窗口窗口函数(WindowFunctions)增量聚合函数(incrementalaggregationfunctions)全窗口函数(full
迷雾总会解
·
2024-01-18 13:17
大数据
flink
大数据
flink
时间窗口无新的数据进来最后一个窗口不关闭
测试反馈,配置的
flink
任务提交上去后,输入数据源符合条件,到时间窗口的size。
奔跑的窝窝牛
·
2024-01-18 13:45
flink
flink
大数据
1024程序员节
flink
最后一个窗口一直没有新数据,窗口不关闭问题
flink
最后一个窗口一直没有新数据,窗口不关闭问题自定义实现WatermarkStrategy接口自定义实现WatermarkStrategy接口代码:publicstaticclassWatermarkDemoFunctionimplementsWatermarkStrategy
cg6
·
2024-01-18 13:44
flink
大数据
2024年腾讯云轻量服务器和CVM云服务器性能如何?
轻量应用服务器适合中小企业或个人开发者搭建企业官网、博客论坛、微信小程序或开发测试环境,云服务器CVM适合更复杂如高并发网站、
大数据计算
、机器学习等复杂应用场景。
暴富程序员
·
2024-01-18 13:11
腾讯云服务器
腾讯云
服务器
云计算
字节跳动大数据架构面经(超详细答案总结)
我对
Flink
组件有着浓厚的兴趣,工作之余经常钻研技术、例如:
Flink
四大
Python栈机
·
2024-01-18 12:39
面试
职场和发展
python
开发语言
程序人生
技术选型|开源大数据OLAP引擎最佳实践
来源:阿里巴巴
大数据计算
全文共3547个字,建议10分钟阅读本篇内容将通过六个部分来介绍开源大数据OLAP引擎最佳实践。
浪尖聊大数据-浪尖
·
2024-01-18 08:14
运维
大数据
分布式
数据库
人工智能
Apache Doris (六十四):
Flink
Doris Connector - (1)-源码编译
个人主页:IT贫道-CSDN博客私聊博主:私聊博主加WX好友,获取更多资料哦~博主个人B栈地址:豹哥教你学编程的个人空间-豹哥教你学编程个人主页-哔哩哔哩视频目录1.
Flink
与Doris版本兼容
IT贫道
·
2024-01-18 08:46
大数据OLAP体系技术栈
Apache
Doris
doris
Dinky注册
flink
集群执行
flink
作业报错-ERROR:java.lang.NoClassDefFoundError
1、单机部署dinkyv0.7.5+
flink
1.17.2,已将
flink
lib依赖包全部复制到dinkyplugins下面并在dinky中注册了
flink
实例(状态正常),执行一个简单示例,报以下错误
斯同
·
2024-01-18 07:35
flink
大数据
详解TableEnvironment里的executeInternal执行过程(Dinky
Flink
)
详解TableEnvironment里的executeInternal执行过程(Dinky
Flink
)1.insertinto执行过程详解待执行SQL:insertintosinkselectemp_no
武舞悟
·
2024-01-18 07:34
Flink
flink
java
反射执行
Flink
Sql代码时找不到UDF的class报ClassNotFound
通过组件的方式配置
flink
Sql的流程,其中有测试环节,就是将生成的源代码通过反射执行一遍。其余组件都正常,就是使用UDF的时候报错ClassNotFound。
原来你是小幸运
·
2024-01-18 07:33
scala
big
data
开发语言
Mysql CDC 多 Source 复用
原文:https://cloud.tencent.com/document/product/849/76650本页目录:功能介绍如何开启CDCSource复用功能使用提醒目前使用
Flink
CDCConnector
javastart
·
2024-01-18 07:30
数据库
flink
大数据
mysql
Dinky集成
Flink
碰到的问题
1.yarn-application模式无法创建my_catalog(mysqlcatalog)不久前,在集群上安装了dinky以解决
flink
cdc同步占用大量数据库连接以及集群资源的问题,dinky
拉格朗日徒弟柯西
·
2024-01-18 07:58
flink
大数据
Dinky创建
Flink
实例报错
Dinky版本:0.7.3
Flink
版本:1.13.0问题描述问题1:已有实例不显示在Dinky的【注册中心】—【
Flink
实例管理】中:hadoop集群以及zookeeper重启后,之前创建的一个yarn-session
THE WHY
·
2024-01-18 07:48
大数据相关问题汇总
Dinky
Flink
flink
大数据
数据库
基于华为MRS实时消费Kafka通过
Flink
落盘至HDFS的Hive外部表的调度方案
文章目录1Kafka1.1Kerberos安全模式的认证与环境准备1.2创建一个测试主题1.3消费主题的接收测试2
Flink
1.1Kerberos安全模式的认证与环境准备1.2
Flink
任务的开发3HDFS
大数据程序终结者
·
2024-01-18 06:25
Hadoop生态
Flink
华为
kafka
flink
fusioninsight
hdfs
hive
SeaTunnel 、DataX 、Sqoop、Flume、
Flink
CDC 对比
对比对比项ApacheSeaTunnelDataXApacheSqoopApacheFlume
Flink
CDC部署难度容易容易中等,依赖于Hadoop生态系统容易中等,依赖于Hadoop生态系统运行模式分布式
贾斯汀玛尔斯
·
2024-01-18 06:01
数据湖
大数据生态
sqoop
flume
flink
小红书推荐大数据在阿里云上的实践
第二部分讲一下小红书是怎么使用
Flink
的一些新的功能。第三部分主要是讲一些OLAP的实时分析的场景,以及和阿里云MC-Hologres的合作。
aliyunhologres
·
2024-01-18 05:55
经典用户案例
flink
kafka
hdfs
大数据
数据库
最新版
Flink
CDC MySQL同步MySQL(一)
1.概述
Flink
CDC是Apache
Flink
®的一组源连接器,使用变更数据捕获(CDC)从不同数据库中获取变更。
Hello.Reader
·
2024-01-17 18:39
flink
flink
mysql
大数据
Flink
CDC 系列 - 同步 MySQL 分库分表,构建 Iceberg 实时数据湖
▼关注「Apache
Flink
」,获取更多技术干货▼摘要:本篇教程将展示如何使用
Flink
CDC构建实时数据湖,并处理分库分表合并同步的场景。
Apache Flink
·
2024-01-17 18:39
数据库
mysql
java
大数据
python
【
FLINK
】Kafka数据源通过
Flink
-cdc进行实时数据同步
何为
FLINK
-CDC?
木棉庭
·
2024-01-17 18:09
技术分享
KAFKA
FLINK
kafka
flink
数据库
Java 实现mysql 同步
flink
cdc 做数据收集 demo
**准备环境**java8mysql
flink
1.3.5
flink
cdc2.2.1数据库创建2张测试表格student、和student1CREATETABLE`student`(`id`int(11)
你是小可爱吗
·
2024-01-17 18:08
大数据
java
mysql
flink
Flink
的ListState在小规模场景下的缓存提速和接口优化丰富的实践
实时计算功能,底层是基于
Flink
,我们在此基础上开发辅助插件和可视化开发运维套件,我们将其称之为Sail
Flink
。
OkGogooXSailboat
·
2024-01-17 18:36
大数据平台开发技术
flink
缓存
spring
Aviator表达式扩展--数组、列表负向序号索引以及自己的JSON库支持方括号([])赋值
1.背景笔者开发的大数据大数据平台XSailboat中的DataStudio模块包含基于DAG图的实时计算可视化开发功能,实现了
Flink
计算任务的可视化开发(想要了解更多,可以查看《
Flink
的DAG
OkGogooXSailboat
·
2024-01-17 18:36
大数据平台开发技术
json
java
关于
Flink
在一条计算管道中配置流和数据流通过广播方式合流的情形下,无保存点和检查点重跑时,让配置流先行,数据流等延迟几秒再进入合流节点的思考
1.背景笔者带领的团队在自研的大数据平台XSailboat上进行专家策略规则的计算管道开发时,遇到这样一种情形:计算管道中存在一条配置流和数据流通过广播方式合流的情形。配置流和数据流的输入源都是Kafka主题,但是是两个不同的Kafka主题。配置流的Kafka主题中存储的是规则配置,数据流中存储的是要分析的数据。在开发调试的时候,这两个主题中已有数据,一调试运行,数据流先到达被处理,配置流晚到,造
OkGogooXSailboat
·
2024-01-17 18:36
flink
linq
大数据
增加Java对象序列化和反序列化灵活性、适应性的方法
1.背景笔者在进行Sail
Flink
框架开发的时候,涉及大量需要序列化和反序列的类,尤其是各种算子的Function方法。
OkGogooXSailboat
·
2024-01-17 18:06
java
开发语言
本地运行
Flink
退出时java.nio.file.DirectoryNotEmptyException、目录没有正常删除解决方法
1.背景在开发大数据平台XSailboat中的查看
Flink
任务的状态数据工具时,用StateProcessAPI解析保存点数据,将其从HDFS上读取出来再将其解析过后下沉到HDFS以CSV格式保存,然后由其它接口提供对这个文件的分页加载功能
OkGogooXSailboat
·
2024-01-17 18:05
大数据平台开发问题解决笔记
flink
java
nio
Flink
的Reduce算子,Name-Position形式的Row数据在使用保存点/检查点重新启动的时候,变成了Position-Based形式的Row解决
1.背景大数据平台XSailboat提供了基于Apache
Flink
的实时计算管道开发功能。DataStudio的实时计算管道开发功能中提供了分区规约节点(keyBy+reduce)。
OkGogooXSailboat
·
2024-01-17 18:05
flink
python
大数据
基于大数据平台(XSailboat)的计算管道实现MySQL数据源的CDC同步--
flink
CDC
1.背景笔者在先前的一篇文档《数据标签设计–大数据平台(XSailboat)的数据标签模块》提到了关于数据标签的模块,现已实现并应用于项目中。在项目中遇到这样一种情形:在业务系统中,对某类对象打了标签,现在需要对这类对象进行过滤并分页查询,支持使用这类对象的属性和所打标签进行过滤。这就出现了一个问题:标签和打标信息是存储在大数据平台的数据库中的,而业务数据是存储在业务系统数据库中的,这是两个数据库
OkGogooXSailboat
·
2024-01-17 18:05
大数据平台开发技术
大数据
mysql
flink
flink
1.15消费kafka之checkpoint 二
前言上一篇讲解了checkpoint恢复的流程,以及checkpoint恢复时如何从状态中获取topic、partition,开始offset值,本篇主要如何取到offset值进行消费的。流程Task运行时,首先调用doRun方法:publicvoidrun(){try{doRun();}finally{terminationFuture.complete(executionState);}}pr
zhiyi329
·
2024-01-17 16:29
flink
kafka
kafka
java
分布式
2024.1.16 用户画像day01 - 项目介绍
elasticSearch-业务数据源导入-离线指标开发-Flume实时采集-Nginx日志埋点数据-结构化流实时指标-制作报表数仓开发用户画像实时开发hive-spark数据挖掘结构化流-Flume-Kafka-
Flink
白白的wj
·
2024-01-17 15:40
spark
大数据
分布式
python
kafka
zookeeper
hive
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他