Flink流处理第2页

2024年总结：大转向

职业转向今年我在职业上尝试做了一个转向，具体的结果可能需要比较长的时间来检验我选择是否正确，所以转向的细节我就不全部展开了，可以确定是我依然会专注在Infra和BigData，比如今年我发布了SparkSQL和FlinkSQL

·2025-01-17 20:11

Flink 批作业如何在 Master 节点出错重启后恢复执行进度？

摘要：本文撰写自阿里云研发工程师李俊睿（昕程），主要介绍Flink1.20版本中引入了批作业在JMfailover后的进度恢复功能。

·2025-01-17 19:30

读Flink源码谈设计：Metric

版本日期备注1.02021.10.8文章首发1.12022.3.9fixtypo1.22022.7.3fixtypo0.前言前阵子笔者涉及了些许监控相关的开发工作，在开发过程中也碰到过些许问题，便翻读了Flink

·2025-01-17 19:28

Flink CDC 在阿里云实时计算Flink版的云上实践

摘要：本文整理自阿里云高级开发工程师，ApacheFlinkCommitter阮航老师在FlinkForwardAsia2024生产实践（三）专场中的分享，主要分为以下四个方面：一、FlinkCDC&实时计算

·2025-01-17 15:17

Java 大视界 -- Java 开发 Spark 应用：RDD 操作与数据转换

Spark提供了多种高级API，支持批处理和流处理。Spark提供了两种主要的数据抽象：RDD（弹性分布式数据集）和DataFrame。

一只蜗牛儿·2025-01-17 12:26

Kafka介绍

ApacheKafka是一个高性能、低延迟的分布式流处理平台，广泛用于构建实时数据管道和流式应用。以下是关于Kafka的详细介绍：核心概念•生产者（Producer）：负责向Kafka集群发送消息。

Zero_pl·2025-01-17 04:43

大数据新视界 --大数据大厂之 Apache Beam：统一批流处理的大数据新贵

亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数

青云交·2025-01-17 01:43

Apache PAIMON 学习

新一代实时数据湖技术，ApachePAIMON兼容ApacheFlink、Spark等主流计算引擎，并支持流批一体化处理、快速查询和性能优化，成为加速AI转型的重要工具。

潇锐killer·2025-01-16 22:54

【1】 Kafka快速入门-从原理到实践

、Kafka的重点概念（一）消息（二）偏移量（Offset）（三）副本（Replica）（四）消费者组（ConsumerGroup）（五）分区策略五、Kafka的重点使用场景（一）大数据处理（二）实时流处理

不知名美食探索家·2025-01-16 15:15

nosql数据库技术与应用知识点

Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink

皆过客，揽星河·2024-09-16 08:42

Java面试题精选：消息队列(二)

消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理

芒果不是芒·2024-09-16 07:34

Kafka是如何保证数据的安全性、可靠性和分区的

Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。

喜欢猪猪·2024-09-16 07:00

【Python基础】Python迭代器与生成器（两种强大工具）

文章目录一、前言二、迭代器2.1创建迭代器2.2自定义迭代器2.3处理大型文件三、生成器四、生成器表达式五、实际应用案例5.1数据库查询5.2网络数据流处理六、总结一、前言在Python中，迭代器与生成器是两种非常强大的工具

姑苏老陈·2024-09-15 23:40

Kafka详细解析与应用分析

Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由

芊言芊语·2024-09-15 20:33

全面指南：用户行为从前端数据采集到实时处理的最佳实践

本文将详细介绍如何通过前端JavaScript代码采集用户行为数据、利用API和Kafka进行数据传输、通过Flink实时处理数据的完整流程。

数字沉思·2024-09-15 11:28

详解 Flink 的常见部署方式

一、常见部署模式分类1.按是否依赖外部资源调度1.1Standalone模式独立模式(Standalone)是独立运行的，不依赖任何外部的资源管理平台，只需要运行所有Flink组件服务1.2Yarn模式

文刀小桂·2024-09-15 07:31

大数据之flink与hive

其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源

星辰_mya·2024-09-14 21:17

Java中的大数据处理框架对比分析

本文将重点介绍ApacheHadoop、ApacheSpark、ApacheFlink和ApacheStorm这四种流行的

省赚客app开发者·2024-09-14 20:41

一文搞懂 Flink Task 数据交互之数据写源码

一文搞懂FlinkTask数据交互之数据写源码1.RecordWriterOutput2.RecordWriter3.数据分区器ChannelSelector4.数据输出模型ResultPartition5

mn_kw·2024-09-14 15:39

Reactive 编程-Vert.x

与传统的阻塞式编程不同，Reactive编程能够更好地处理高并发和异步操作，特别适合实时系统、流处理以及需要快速响应的场景。

Flying_Fish_Xuan·2024-09-14 12:48

概率图模型（PGM）综述

RefLink:http://www.sigvc.org/bbs/thread-728-1-1.htmlGraphicalModel的基本类型基本的GraphicalModel可以大致分为两个类别：贝叶斯网络

医学影像处理·2024-09-14 08:21

Python基础知识进阶之正则表达式_头歌python正则表达式进阶

知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是

前端陈萨龙·2024-09-13 13:50

Kafka 应用场景

数据流处理：Kafka支持实时数据流处理，能够在数据流动时进行处理和分析，确保应用程序与最新信息保持同步！日志聚合：可以将来自不同来源的日志集中和聚合，简化应用程序的调试和监控！

zinuxer·2024-09-13 12:15

大数据新视界 --大数据大厂之Flink强势崛起：大数据新视界的璀璨明珠

亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja

青云交·2024-09-13 08:50

无人机动力系统设计之电调芯片参数选型

无人机动力系统设计之电调芯片参数选型1.源由2.关键因素2.1电压范围2.2电流处理能力2.3控制方式2.4PWM输出与分辨率2.5通讯接口2.6保护功能2.7支持霍尔传感器与无传感器模式2.8集成度与外围器件

lida2003·2024-09-13 05:30

flink增量检查点降低状态依赖实现的详细步骤

使用外部状态存储服务，减少Flink状态后端的负担。拆分状态和将状态外部化到其他服务可以帮助减少作业的状态依赖，从而降低恢复时间和复杂度。以下是详

goTsHgo·2024-09-12 13:15

flink table factory基础知识

一、概述在flink中很多组件都是TableFactory的子类。

loukey_j·2024-09-12 07:01

2024年最全使用Python求解方程_python解方程(1)，字节面试官迟到

知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是

2401_84569545·2024-09-12 02:33

01-Flink安装部署及入门案例（仅供学习），音视频时代你还不会NDK开发

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵

小猪佩琪962·2024-09-11 07:18

比较Spark与Flink

ApacheSpark和ApacheFlink都是目前非常流行的大数据处理引擎，但它们在架构、处理模式、应用场景等方面有一些显著的区别。

傲雪凌霜，松柏长青·2024-09-11 04:29

Apache Flink：实时流处理与批处理的统一框架

导语在大数据处理领域，流处理和批处理是两种主要的处理方式。然而，传统的系统通常将这两者视为独立的任务，需要不同的工具和框架来处理。

小码快撩·2024-09-11 04:28

flink独立集群部署

#flink独立集群部署说明安装环境三台服务器47.106.23.1（master）47.112.173.2（worker1）47.115.162.3（worker1）提前装好jdk和ssh,以下操作最好不要用

嘎子吱吱吱吱·2024-09-10 16:28

Flink的时间与watermarks详解

当我们在使用Flink的时候，避免不了要和时间(time)、水位线(watermarks)打交道，理解这些概念是开发分布式流处理应用的基础。那么Flink支持哪些时间语义？

大数据技术与数仓·2024-09-09 21:44

实时数仓之实时数仓架构(Hudi)(1)

目前比较流行的实时数仓架构有两类，其中一类是以Flink+Doris为核心的实时数仓架构方案；另一类是以湖仓一体架构为核心的实时数仓架构方案。

2401_84164527·2024-09-09 19:34

2024年大数据最新实时数仓之实时数仓架构(Hudi)

技术框架Kafka：用于接入数据源；FlinkCDC：如果直接接入业务数据源可以考虑CDC方式，如果通过Kafka缓冲接入业务数据可以忽略;Flink：用于数据ETL，包括接入数据、处理数据及输出数据全链路数据计算任务

2401_84185556·2024-09-09 19:34

实时数仓之实时数仓架构(Hudi)(1)，2024年最新熬夜整理华为最新大数据开发笔试题

湖仓一体数据管理框架，用来管理模型数据，包括ODS/DWD/DWS/DIM/ADS等；+Doris：OLAP引擎，同步数仓结果模型，对外提供数据服务支持；+Hbase：用来存储维表信息，维表数据来源一部分有Flink

2401_84181221·2024-09-09 19:04

Spring常用中间件

（2）Kafka:分布式流处理平台，适合处理大规模数

贺仙姑·2024-09-08 23:15

Flink - CEP

Hadoop3.2集群新版本的搭建详细讲解过程，从下面第一张官方的图来看，最新版是3.2，所以大猪将使用3.2的版本来演示，过程中遇到的坑留给自己，把路留给你们，IT之路还有大猪。大猪为了把文章压缩极简方便小伙伴阅读，将使用root帐号进行所有操作。准备两台主机10.211.55.11、10.211.55.12对应的hostname为m1.example.com、m2.example.com具体命

kikiki1·2024-09-08 21:46

chapter01 Java语言概述知识点Note

JavaSEJavaEEJavaME大数据Java基础常用技术栈mysqlJDBCSSMspring+springmvc+mybatisLinuxnacosHadoopFlinkJAVAEE消息队列rabbitMQdocker

月下绯烟·2024-09-08 18:42

小规模的流处理框架.Part 1: thread pools

TomaszNurkiewicz译者：simonwang(译者：强力推荐这篇文章，作者设计了一个用于小流量的流式数据处理框架，并详细给出了每一个需要注意的设计细节，对比了不同设计方案的优缺点，能够让你对流处理过程

loredp·2024-09-08 16:58

大数据争论：批处理与流处理的C位之战

那就是批处理与流处理之间的P

womenjiademao·2024-09-08 10:18

【无标题】大数据之批处理，流处理，批流一体概念

Spark和Flink都支持批处理，其中Spark使用的是批处理模型，即将一批数据一次性读入内存，然后对其进行处理，处理完成后再将结果写入磁盘。

数字天下·2024-09-08 09:43

【大数据平台】数据处理层：批处理与流处理架构

欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：工重hao：野老杂谈⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️大数据平台建设指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台的核心技术和方法。⭐️《遇见Python：初识、了解与热恋

野老杂谈·2024-09-08 09:07

python flink_《Flink官方文档》Python 编程指南测试版

原文链接译者：hjjxd校对：清英Flink中的分析程序实现了对数据集的某些操作(例如，数据过滤，映射，合并，分组)。这些数据最初来源于特定的数据源(例如来自于读文件或数据集合)。

weixin_39846361·2024-09-08 08:04

flink---window

Window介绍DataStream:https://nightlies.apache.org/flink/flink-docs-release-1.17/zh/docs/dev/datastream/

搞数据的小杰·2024-09-08 00:38

Flink(1.13) 的window机制(一)

窗口概述在流处理应用中，数据是连续不断的，因此我们不可能等到所有数据都到了才开始处理。

万事万物·2024-09-07 22:31

java程序设计实验3_Java面向对象程序设计习题解答与实验(第3版) 张桂珠 9787563530922...

概述和入门程序第3章java程序设计基础第4章类和对象第5章类的继承和派生第6章多态性第7章java实用包第8章图形和java2d第9章gui组件和用户界面设计第10章异常处理第11章多线程第12章输人流和输出流处理第

weixin_39839478·2024-09-07 21:48

pyflink 自定义函数

frompyflink.datastreamimportStreamExecutionEnvironmentfrompyflink.common.typeinfoimportTypesfrompyflink.datastreamimportStreamExecutionEnvironmentfrompyflink.tableimportStreamTableEnvironmentfrompyfli

scan724·2024-09-07 15:05

flink 问题记录

文章目录1.Causedby:java.lang.UnsatisfiedLinkError:org.apache.hadoop.util.NativeCrc32.nativeComputeChunkedSums(IILjava/nio/ByteBuffer;ILjava/nio/ByteBuffer;IILjava/lang/String;JZ)V原因java.util.concurrent.Ex

Jhon_yh·2024-09-07 15:34

Pyflink教程(三)：自定义函数

该文章例子pyflink环境是apache-flink==1.13.6Python自定义函数是PyFlinkTableAPI中最重要的功能之一，其允许用户在PyFlinkTableAPI中使用Python

yuxj记录学习·2024-09-07 15:33

推荐频道

Flink流处理