flink 第11页

Flink 1.18.1的基本使用

系统示例应用/usr/local/flink-1.18.1/bin/flinkrun/usr/local/flies/streaming/SocketWindowWordCount.jar--port9010nc-l9010asdasdsdfsfsdfsdfsdagdsdf

You Only Live Once_2·2024-02-02 17:14

实时数据湖：Flink CDC流式写入Hudi

点击上方蓝色字体，选择“设为星标”回复"面试"获取更多惊喜1.环境准备•Flink1.12.2_2.11•Hudi0.9.0-SNAPSHOT(master分支)•Spark2.4.5、Hadoop3.1.3

王知无(import_bigdata)·2024-02-02 12:01

Flink CDC 详述实时数据湖

在构建实时数仓的过程中，如何快速、正确的同步业务数据是最先面临的问题，本文主要讨论一下如何使用实时处理引擎Flink和数据湖ApacheIceberg两种技术，来解决业务数据实时入湖相关的问题。

000X000·2024-02-02 12:01

使用 Flink Hudi 构建流式数据湖

摘要：本文介绍了FlinkHudi通过流计算对原有基于mini-batch的增量计算模型不断优化演进。

浪尖聊大数据-浪尖·2024-02-02 12:30

Flink 流式读取 Debezium CDC 数据写入 Hudi 表无法处理 -D / Delete 消息

问题场景是：使用KafkaConnect的DebeziumMySQLSourceConnector将MySQL的CDC数据（Avro格式）接入到Kafka之后，通过Flink读取并解析这些CDC数据，然后以流式方式写入到

　Laurence·2024-02-02 12:56

Flink SQL Query 语法（四）- Rattern Recognition

主要引用官方文档https://ci.apache.org/projects/flink/flink-docs-release-1.13/docs/dev/table/sql/queries/match_recognize

Alex90·2024-02-02 11:07

Flink实现高斯朴素贝叶斯

Flink实现高斯朴素贝叶斯在之前的文章中提到了多项式的朴素贝叶斯，在spark的ML里也实现了多项式的朴素贝叶斯和伯努利朴素贝叶斯，在实际情况当中我们处理的变量除了离散型，还有连续型。

k_wzzc·2024-02-02 08:49

如何通过CVE漏洞编码找到对应的CVE漏洞详情及源码修改地址

背景：最近正在使用docker进行一些cve漏洞的复现，有时候就要通过CVE的漏洞编码，找到对应的漏洞详情，以及漏洞的源码修改以我上一篇文章的CVE-2020-17518编码为例ApacheFlink文件上

Smileassissan·2024-02-02 08:37

2019-08-21 gffread----gff、gtf格式转换

三代数据分析，用Minimap2分析出结果，生成了gff文件，想继续用为了想用到MatchAnno去，但是MatchAnno需求是gtf文件，所以想找大家都推荐的cufflinks中的脚本gffread

老_Z·2024-02-02 07:59

Flink 实时写入数据到 ElasticSearch 性能调优

背景说明线上业务反应使用Flink消费上游kafkatopic里的轨迹数据出现backpressure，数据积压严重。单次bulk的写入量为：3000/50mb/30s，并行度为48。

zhisheng_blog·2024-02-02 06:45

gffread使用小妙招

大家好，今天给大家分享一个软件(cufflinks)中的一个命令gffread，前一段时间需要提取生菜所有基因的CDS序列，本来一开始准备自己写脚本，后来发现gffread就可以实现。

杨博士聊生信·2024-02-02 06:02

OfficeAutomation——Task04 Python 操作 PDF

OfficeAutomation——Task04Python操作PDFlinks：https://github.com/datawhalechina/team-learning-program/blob

棠糖䉎·2024-02-01 16:08

Flink 数据保存 Redis(自定义Redis Sink ) 实现exactly-once

通过如下链接：Flink官方文档，我们知道数据保存到Redis的容错机制是atleastonce。所以我们通过幂等操作，使用新数据覆盖旧数据的方式，以此来实现exactly-once。

程序猿郭鹏飞神奇经历·2024-02-01 15:36

flink 1.14 自定义 redis sink 与维表

原文出自flinksql知其所以然（二）|自定义redis数据维表（附源码）（侵权删）我是拿来主义，自己将原来1.13.2版本改为1.14.0,注意事项：RedisRowDataLookupFunction

xiaoyan5686670·2024-02-01 15:36

flink维表关联系列之Redis维表关联：实时查询

在做维表关联如果要求低延时，即维表数据的变更能够被立刻感知到，所以就要求在查询时没有缓存策略，直接查询数据库维表信息。本篇以实时查询redis为例，要求redis客户端支持异步查询，可以使用io.lettuce包，支持redis不同模式：单点模式、sentinel模式、集群模式，需要在pom中引入：io.lettucelettuce-core5.0.5.RELEASEio.nettynetty-a

雾岛与鲸·2024-02-01 15:06

重写代码实现Flink连接Redis集群（Java版，解决Flink无法连接私有IP Redis集群问题）

1缘起团队需要使用实时数据（小时级别）给业务系统使用，数据流向是这样：实时数据-》Kafka-》Flink-》Redis（集群和哨兵），可是，Flink原生并不支持Redis连接，于是，有第三方提供连接工具

天然玩家·2024-02-01 15:04

FLINK 基于1.15.2的Java开发-自定义Redis Sink用于连接 Redis Sentinel模式

因此如果只是简单的在代码里用flink自带的redissink，它根本不能用在我们的生产环境。

TGITCIC·2024-02-01 15:34

Flink消费kafka写入hive，报错GC

报错信息Flink消费kafka写入hive，报错GC。Taskmanager内存加到16GB。不起作用。

dgbcf·2024-02-01 15:55

Flink 读取 Kafka 消息写入 Hudi 表无报错但没有写入任何记录的解决方法

博主历时三年精心创作的《大数据平台架构与原型实现：数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，京东购书链接：https://item.jd.com/12677623.html，扫描左侧二维码进入京东手机购书页面。本问题发生的场景是：使用KafkaConnect的DebeziumMySQLSour

　Laurence·2024-02-01 15:24

Flink Savepoint 和 Checkpoint 使用

flinkSavepoint和Checkpoint使用checkpoint应用定时触发，用于保存状态，会过期内部应用失败重启的时候使用，特点是作业容错自动恢复，轻量，自动周期管理savepoint用户手动执行

GOD_WAR·2024-02-01 12:46

1.11 flinksql自定义redis connector 连接器

FlinkStreamApiApacheBahir已经实现了redis对应的连接器FlinkstreamingconnectorforRedismaven仓库如下org.apache.bahirflink-connector-redis

菜到抠脚的cxy·2024-02-01 12:15

Flink检查点（checkpoint）、保存点（savepoint）的区别与联系

FlinkcheckpointCheckpoint是Flink实现容错机制最核心的功能，能够根据配置周期性地基于Stream中各个Operator的状态来生成Snapshot，从而将这些状态数据定期持久化存储下来

雾岛与鲸·2024-02-01 12:44

【Flink】Flink 自定义 redis sink

1.概述内部要做FlinkSQL平台，本文以自定义RedisSink为例来说明FlinkSQL如何自定义Sink以及自定义完了之后如何使用基于Flink1.112.步骤implementsDynamicTableSinkFactoryimplementsDynamicTableSink

九师兄·2024-02-01 12:13

flink（十三）：flink-CheckPoint和SavePoint作用和区别

运行原理开启设置保存多个CheckPoint恢复任务SavePoint运行原理创建SavePoint恢复任务SavePoint和CheckPoint的区别详细区别总结分享大数据博客列表说明本博客周五更新一次Flink

羽落风起·2024-02-01 12:13

flink sql 知其所以然（二）| 自定义 redis 数据维表（附源码）

1.序篇-本文结构背景篇-为啥需要redis维表目标篇-做redis维表的预期效果是什么难点剖析篇-此框架建设的难点、目前有哪些实现维表实现篇-维表实现的过程总结与展望篇本文主要介绍了flinksqlredis

大数据技术派·2024-02-01 12:43

streampark+flink一键整库或多表同步mysql到doris实战

streampark+flink一键整库或多表同步mysql到doris实战，此应用一旦推广起来，那么数据实时异构时，不仅可以减少对数据库的查询压力，还可以减少数据同步时的至少50%的成本，还可以减少30%

京东云技术团队·2024-02-01 12:42

Flink Native Library xxx is being loaded in another classloader

在使用flink连接tdengine时，第一次连接没有问题，当重启任务时，出现flinkNativeLibrarylibtaos.soalreadyloadedinanotherclassloader异常

不会消失的夜晚·2024-02-01 12:11

Flink检查点（checkpoint）、保存点（savepoint）的区别和联系

一、FlinkcheckpointCheckpoint是Flink实现容错机制最核心的功能，能够根据配置周期性的基于Stream中各个Operator的状态来生成Snapshot，从而将这些状态数据定期持久存储下来

小枫@码·2024-02-01 12:41

聊聊flink的ScheduledExecutor

序本文主要研究一下flink的ScheduledExecutorExecutorjava.base/java/util/concurrent/Executor.javapublicinterfaceExecutor

go4it·2024-02-01 08:37

Flink详解系列之五--水位线（watermark）

1、概念在Flink中，水位线是一种衡量EventTime进展的机制，用来处理实时数据中的乱序问题的，通常是水位线和窗口结合使用来实现。

王吉吉real·2024-02-01 07:15

Flink实战五_状态机制

接上文：Flink实战四_TableAPI&SQL在学习Flink的状态机制之前，我们需要理解什么是状态。

core512·2024-02-01 07:26

Flink 集成和使用 Hive Metastore

1.AWSEMR的Flink使用HiveMetastore想在Flink中使用HiveMetastore其实只需要将FlinkHiveConnector以及HiveMetastore有关的Jar包部署到

　Laurence·2024-01-31 16:31

Flink Hudi 源码之HoodieTableSink

Flink源码分析系列文档目录请点击：Flink源码分析系列文档目录源代码分支release-0.9.0Hudi源代码GitHub地址：apache/hudi:Upserts,DeletesAndIncrementalProcessingonBigData

AlienPaul·2024-01-31 15:09

大厂 5 年实时数据开发经验总结，Flink SQL 看这篇就够了！

本文摘编于《FlinkSQL与DataStream入门、进阶与实战》（500页、70万字）作者羊艺超，目前就职于快手，国内最早一批FlinkSQL使用者拥有从0到1使用FlinkSQL建设、保障及治理实时数仓的丰富经验京东机械工业出版社旗舰店限时

zhisheng_blog·2024-01-31 15:29

Apache Paimon 介绍

从FlinkTableStore演进而来Flinktablestore架构如下图：（和今天Paimon的架构相比，LogSystem不再被推荐使用，LakeStore的能力大幅强于LogSystem，除了延时

zhisheng_blog·2024-01-31 15:58

数据湖技术Iceberg0.12预研文档

Iceberg0.12预研本次预研场景主要为kafka=>flinksql=>iceberg=>hive=>hdfs=>trino(presto)本次预研使用组件如下：名称版本描述flink1.12.1

我去探险了·2024-01-31 15:36

使用 Paimon + StarRocks 极速批流一体湖仓分析

摘要：本文整理自阿里云智能高级开发工程师王日宇，在FlinkForwardAsia2023流式湖仓（二）专场的分享。

Apache Flink·2024-01-31 11:25

flink sql运用入门

目录前言一、flink是什么？

yc_zlj·2024-01-31 11:21

Flink实战三_时间语义

接上文：Flink实战二_DataStreamAPI接下来本文分析Flink的时间语义。时间语义是Flink中非常精妙的一部分设计，也可以说是Flink最为重要的一个设计。

core512·2024-01-31 11:20

Flink实战四_TableAPI&SQL

接上文：Flink实战三_时间语义1、TableAPI和SQL是什么？

core512·2024-01-31 11:18

60、Flink CDC 入门介绍及Streaming ELT示例（同步Mysql数据库数据到Elasticsearch）-完整版

Flink系列文章一、Flink专栏Flink专栏系统介绍某一知识点，并辅以具体的示例进行说明。1、Flink部署系列本部分介绍Flink的部署、配置相关基础内容。

一瓢一瓢的饮 alanchanchn·2024-01-31 11:47

Apache Flink 文件上传漏洞 CVE-2020-17518 漏洞复现

ApacheFlink文件上传漏洞CVE-2020-17518漏洞复现一、漏洞描述二、漏洞影响三、漏洞复现1、环境搭建2、漏洞复现四、漏洞POC五、参考链接一、漏洞描述ApacheFlink是一个开源的流处理框架

Senimo_·2024-01-31 10:24

Apache Flink jobmanager/logs 目录穿越漏洞 CVE-2020-17519 漏洞复现

ApacheFlinkjobmanager/logs目录穿越漏洞CVE-2020-17519漏洞复现一、漏洞描述二、漏洞影响三、漏洞复现1、环境搭建2、漏洞复现四、漏洞POC五、参考链接一、漏洞描述ApacheFlink

Senimo_·2024-01-31 10:24

CVE-2020-17518 flink任意文件上传漏洞复现

漏洞描述ApacheFlink是由Apache软件基金会开发的开源流处理框架，其核心是用Java和Scala编写的分布式流数据流引擎。

亚瑞塔斯·D·紫耀·2024-01-31 10:53

漏洞复现----13、Apache Flink 文件上传漏洞 (CVE-2020-17518)

文章目录一、ApacheFlink简介二、漏洞简介三、漏洞复现四、上传jar包getshell一、ApacheFlink简介ApacheFlink是一个框架和分布式处理引擎，用于在无边界和有边界数据流上进行有状态的计算

七天啊·2024-01-31 10:53

Apache Flink 文件上传漏洞 (CVE-2020-17518)