E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据框架flink
Flink
:从业务实践角度聊聊Checkpoint、Savepoint、容错机制和业务升级
接着状态缓存和内存管理后,再聊聊容错机制上文:
Flink
:从业务实践角度聊聊状态缓存和内存管理多说一句,说实话个人之前研究这部分内容时,有时也会百度,但是很烦的就是,不知道是搜索引擎问题还是大家都喜欢粘贴复制
小明同学YYDS
·
2023-10-27 11:55
Flink
flink
Checkpoint
Savepoint
容错机制
Flink业务升级
Flink
savepoint | checkpoint 恢复
savepoint手动触发savepointroot@
flink
-jobmanager-0:/opt/
flink
/bin#.
胖胖胖胖胖虎
·
2023-10-27 11:55
Flink
flink
大数据
hadoop
flink
版本升级之 checkpoint和savepoint 代码和SQL
savepoint可以恢复.亲测2SQL和TableAPI这两个官方不担保版本升级兼容chk/savepointstreamAPI基本兼容官网有提到连接自己找总结如果你的checkpoint不能丢且后续可能存在
flink
Thomas2143
·
2023-10-27 11:20
free
flink
大数据
flink
sql kafka到mysql累计指标练习
flink
sql累计指标练习数据流向:kafka->kafka->mysql模拟写数据到kafkatopic:wxt中importcom.alibaba.fastjson.JSONObject;importorg.apache.kafka.clients.producer.KafkaProducer
小涛手记
·
2023-10-27 08:29
flink
flink
sql
Apache
Flink
1.10.0 重磅发布,年度最大规模版本升级!
新特性及优化内存管理及配置优化
Flink
目前的TaskExecutor内存模型存在着一些缺陷,导致优化资源利用率比较困难,例如:流和批处理内存占用的配置模型不同;流处理中的RocksDBstatebackend
阿里云技术
·
2023-10-27 07:04
Apache
Flink
1.10.0 重磅发布,年度最大规模版本升级!
翻译|宋辛童校对|李钰Apache
Flink
社区迎来了激动人心的两位数位版本号,
Flink
1.10.0正式宣告发布!
Apache Flink
·
2023-10-27 07:04
Flink
UDF 自动注册实践
https://www.bilibili.com/video/AV36166554/日前,在更新UDF函数这块的一些功能时,发现一些较为细小但大家都会遇到的问题,作为趟过的坑发出来,希望大家能够避免。1.注册UDF函数1.1注册相关方法此处,我们使用的udf函数为标量函数,它继承的是ScalarFunction,该类在我们的使用中,发现它继承自UserDefinedFunction这个类,该处的u
小白程序员的翻身之旅
·
2023-10-27 07:31
技术专栏
Flink
涛哥
多易教育
大数据
java
Apache
Flink
1.10.0 最新发布,年度最大规模版本升级!
Apache
Flink
社区迎来了激动人心的两位数位版本号,
Flink
1.10.0正式宣告发布!
少年阿峣_从零单排
·
2023-10-27 07:28
【
大数据生态
】
#
Flink
flink
Flink
on yarn 加载失败plugins失效问题解决
Flink
onyarn加载失败plugins失效问题解决
flink
版本:1.13.61.问题
flink
任务运行在yarn集群,plugins加载失效,导致通过扩展资源获取任务参数失效2.问题定位yarn
老鼠扛刀满街找猫@
·
2023-10-27 07:28
flink
flink
大数据
展望
Flink
各版本及新特性
展望
Flink
各版本及新特性一
Flink
1.9版本1.1细粒度批作业恢复1.2StateProcessorAPI1.3Stop-with-Savepoint1.4新BlinkSQL查询处理器预览1.5TableAPI
奋斗的IT小白菜
·
2023-10-27 07:28
flink
0基础学习Py
Flink
——用户自定义函数之UDAF
大纲UDAF入参并非表中一行(Row)的集合计算每个人考了几门课计算每门课有几个人考试计算每个人的平均分计算每课的平均分计算每个人的最高分和最低分入参是表中一行(Row)的集合计算每个人的最高分、最低分以及所属的课程计算每课的最高分数、最低分数以及所属人完整代码入参并非表中一行(Row)的集合入参是表中一行(Row)的集合在前面几篇文章中,我们学习了非聚合类的用户自定义函数。这节我们将介绍最简单的
breaksoftware
·
2023-10-27 07:14
大数据
flink
python
大数据
Flink
源码笔记 — execute 后发生了什么?
前言我们知道,
Flink
程序的执行是在我们调用env.execute()后才会真正开始。
飞不高的老鸟
·
2023-10-27 07:54
Flink
1.11升级填坑
背景现有集群版本是
Flink
1.10.1,想要升级到社区最新的版本
Flink
1.11.1.踩坑过程Nohostnamecouldberesolvedforipaddress详细的社区邮件讨论过程如下:http
GuoSmileSmile
·
2023-10-27 06:24
Hudi数据湖-基于
Flink
、Spark湖仓一体、实时入湖保姆级教学
目录Hudi源码编译Hudi扫盲基于Spark-shell集成Hudi基于Spark-Hive集成Hudi手动创建HIVE表基于SparkSQL集成Hudi自动创建HIVE表基于
Flink
SQL集成Hudi
笑一笑、
·
2023-10-27 01:04
BigData
spark
flink
big
data
使用
Flink
Streaming Query 查询Hudi(出现包冲突以及Hive 3.1.3 编译Hudi 时间戳异常)
org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormatClassNotFoundExceptionKeywords:Hudi编译Hive,
Flink
Such Devotion
·
2023-10-27 01:31
Hudi
Hive
flink
大数据
hive
Hudi 0.14.0 编译
1编译环境Java1.8maven3.9.3hadoop3.3.4hive3.1.3spark3.2.1
flink
1.16.0hudi0.14.02hudi准备2.1源码$gitclonehttps:/
跟着大数据和AI去旅行
·
2023-10-27 01:00
大数据企业级实战
hudi
0基础学习Py
Flink
——用户自定义函数之UDF
大纲标量函数入参并非表中一行(Row)入参是表中一行(Row)aliasPy
Flink
中关于用户定义方法有:UDF:用户自定义函数。UDTF:用户自定义表值函数。UDAF:用户自定义聚合函数。
breaksoftware
·
2023-10-27 01:50
大数据
flink
大数据
python
0基础学习Py
Flink
——用户自定义函数之UDTF
大纲表值函数完整代码在《0基础学习Py
Flink
——用户自定义函数之UDF》中,我们讲解了UDF。
breaksoftware
·
2023-10-27 01:15
大数据
flink
大数据
python
技本功丨用短平快的方式告诉你:
Flink
-SQL的扩展实现 ...
回馈给Apache
Flink
社区。官方称,计算延迟已经降到毫秒级,也就是你在浏览网页的时候,眨了一下眼睛,淘宝、天猫处理的信息已经刷新了17亿次。
weixin_34081595
·
2023-10-26 18:00
数据库
大数据
flink
sql 知其所以然(一)| source\sink 原理
1.序篇-本文结构本文从以下五个小节介绍
flink
sqlsource\sink\format的概念、原理。
大数据羊说
·
2023-10-26 18:29
Apache
Flink
实战技巧
实时计算
Flink
、Iceberg和Hive的Catalog比较研究
所谓Catalog即数据目录,简单讲,Catalog是企业用于管理数据资产的方式,Catalog借助元数据来管理数据,包括数据收集、组织、访问、发现和治理。可见,Catalog在数据资产管理中处于核心位置。元数据本身内容非常丰富,包括技术元数据、业务元数据和操作元数据,本文仅仅研究大数据计算存储框架本身的技术元数据,比如数据库、数据表、分区、视图、函数等。限于篇幅,参与比较的计算存储框架为Flin
滴普科技
·
2023-10-26 18:55
DEEPNOVA开发者社区
hive
flink
big
data
flink
学习(一)
前言:之前学习
flink
时没有系统性的复习,现在不多BB就是为了复习
flink
(从头再来)1.1
flink
的引入计算引擎分为几代有些争议,这里我选择的是四代第一代计算引擎,MapReduce(首先第一代的计算引擎
Daivei_lai
·
2023-10-26 18:25
flink
flink
(二开)
Flink
修改源码拓展 SQL 语法
1、
Flink
扩展calcite中的语法解析1)定义需要的SqlNode节点类-以SqlShowCatalogs为例a)类位置
flink
/
flink
-table/
flink
-sql-parser/src
猫猫爱吃小鱼粮
·
2023-10-26 18:54
Flink精通~源码设计解析
flink
sql
k8s 1.28版本:使用StorageClass动态创建PV,Sel
fLink
问题修复
k8s中提供了一套自动创建PV的机制,就是基于StorageClass进行的,通过StorageClass可以实现仅仅配置PVC,然后交由StorageClass根据PVC的需求动态创建PV。问题: 使用k8s1.28版本,通过kubectlgetpvc,发现PVC一直处于Pending状态。通过kubectldescribepvc[pvc名称]描述,发现如下错误:Waitingforavo
扛麻袋的少年
·
2023-10-26 16:38
kubernetes
kubernetes
容器
云原生
flink
接入mqtt数据源
flink
没有原生的mqtt数据源,但可以通过自定义数据源进行添加mqtt的数据源。
如果丶可以坑
·
2023-10-26 14:45
1024程序员节
flink
流式计算系统
从2018年年中参与
Flink
社区的开发,到在阿里巴巴BLINK团队和鹅厂数据中心的
FLINK
团队基于
Flink
支持了诸多流式计算作业的运行,这段时间的经历使
slivelight
·
2023-10-26 13:14
数据技术
大数据
Flink
写入HDFS(文本,parquet,parquet+snappy)
flink
版本:1.10.0code://构建env环境valenv=StreamExecutionEnvironment.getExecutionEnvironmentenv.enableCheckpointing
乖乖猪001
·
2023-10-26 12:43
flink
大数据
hdfs
flink
java
【
Flink
实战系列】
Flink
SQL 使用 filesystem connector 同步 Kafka 数据到 HDFS(parquet 格式 + snappy 压缩)
Flink
SQL同步Kafka数据到HDFS(parquet+snappy)在上一篇文章中,我们用datastreamAPI实现了从Kafka读取数据写到HDFS并且用snappy压缩,今天这篇文章我们来实现一个
JasonLee实时计算
·
2023-10-26 12:12
Flink
实战系列
kafka
flink
sql
hdfs
flink
on k8s (
flink
-1.13.0 最新版本 application 部署方式)
flink
onk8s(
flink
-1.13.0最新版本application部署方式)run-application模式(此方式一劳永逸,节省资源+数据隔离,集群之间不会相互影响)①,将自己的项目jar
静坛灵露
·
2023-10-26 12:10
flink
k8s
kubernetes
java
docker
实时数仓Hologres
实时更新、实时分析,支持标准SQL(兼容PostgreSQL协议),支持PB级数据多维分析(OLAP)与即席分析(AdHoc),支持高并发低延迟的在线数据服务(Serving),与MaxCompute、
Flink
大数据开发工程师-宋权
·
2023-10-26 12:09
Hologres
big
data
数据库
数据仓库
flink
on k8s 访问hive hadoop
本文适用于
flink
1.10-1.12版本。
Yaphets丶混世大魔王
·
2023-10-26 12:09
#
flink
flink
hive
hadoop
行为分析环境安装手册:Nginx+Flume+Kafka+
Flink
+Clickhouse
一、Nginx1、简介Nginx("enginex")是一款是由俄罗斯的程序设计师IgorSysoev所开发高性能的Web和反向代理服务器,也是一个IMAP/POP3/SMTP代理服务器。在高连接并发的情况下,Nginx是Apache服务器不错的替代品。2、安装步骤系统平台:CentOSrelease6.664位●安装编译工具及库文件yum-yinstallmakezlibzlib-develgc
小象智慧
·
2023-10-26 12:08
小象分析
flume
kafka
flink
nginx
修炼k8s+
flink
+hdfs+dlink(六:学习namespace,service)
一:什么是namespace?你可以认为namespaces是你kubernetes集群中的虚拟化集群。在一个Kubernetes集群中可以拥有多个命名空间,它们在逻辑上彼此隔离。他们可以为您和您的团队提供组织,安全甚至性能方面的帮助!二:怎么创建绑定namespace?1.创建。cat>>product_namespaces.yaml<
宇智波云
·
2023-10-26 12:36
1024程序员节
大数据
Flink
(一百零二):SQL 聚合函数(Aggregate Function)
文章目录SQL聚合函数(AggregateFunction)SQL聚合函数(AggregateFunction)PythonUDAF,即PythonAggregateFunction。PythonUDAF用来针对一组数据进行聚合运算,比如同一个window下的多条数据、或者同一个key下的多条数据等。针对同一组输入数据,PythonAggregateFunction产生一条输出数据。比如以下示例,
Lansonli
·
2023-10-26 10:41
大数据入门核心技术
#
Flink
大数据
flink
爬虫进阶-反爬破解9(下游业务如何使用爬取到的数据+数据和文件的存储方式)
一、下游业务如何使用爬取到的数据(一)常用数据存储方案1.百万级别数据:单机数据库,搭建和使用方便快捷,成本低2.千万级别数据:负载均衡的多台数据库,安全和稳定3.海量数据:
大数据框架
,分布式部署,承载量巨大
有洁癖的懒羊羊
·
2023-10-26 09:42
爬虫
大数据
爬虫
【API篇】十一、
Flink
水位线传递与迟到数据处理
文章目录1、水位线传递2、水位线设置空闲等待3、迟到数据处理:窗口允许迟到4、迟到数据处理:侧流输出5、问1、水位线传递上游task处理完水位线,时钟改变后,要把数据和当前水位线继续往下游算子的task发送。当一个任务接收到多个上游并行任务传递来的水位线时,以最小的那个作为当前任务的事件时钟。如图:上游算子并行度为4,:-第一波的2.4.3.6传递到下游task,取2-其中一个上游task的数据4
-代号9527
·
2023-10-26 07:38
Flink
flink
大数据
大数据技术之Hadoop-入门
2006Cloudera内部集成了很多
大数据框架
,对应产品CDH。2008Hortonworks文档较好,对应产品HDP
华尔街的幻觉
·
2023-10-26 06:14
hadoop
大数据
hdfs
Flink
动态读取Nacos配置
1.需求:实时读取Nacos的配置,打印在控制台2.额外的依赖:com.alibaba.nacosnacos-client1.4.2代码很简单,就直接贴了packagecom.xianghu.
flink
.nacos
Mathieu66
·
2023-10-26 04:42
Apache
Flink
flink
nacos
动态
配置
0基础学习Py
Flink
——不可以用UDTAF装饰器装饰function的原因分析
在研究
Flink
的“用户自定义方法”(UserDefinedFunction)时,我们看到存在如下几种类型的装饰器:UDF:UserDefinedScalarFunctionUDTF:UserDefinedTableFunctionUDAF
breaksoftware
·
2023-10-26 03:44
大数据
数据库
flink
大数据
Leetcode 876. Middle of the Linked List
Givenanon-empty,singlylinkedlistwithheadnodehead,returnamiddlenodeo
flink
edlist.Iftherearetwomiddlenodes
大龄码农的技术点滴
·
2023-10-26 02:42
Flink
集群启动报错 org.apache.
flink
.client.deployment.ClusterDeploymentException
org.apache.
flink
.client.deployment.ClusterDeploymentExceptionCouldn’tdeployYarn出现此类错误,主要的原因是Currentusage
十一师兄
·
2023-10-25 21:28
Flink
flink
双向链表C语言版
1、声明链表节点操作函数linklist.h#ifnde
fLINK
LIST_H__#defineLINKLIST_H__#include#include#include//#defineTAIL_ADD
fengchengwu2012
·
2023-10-25 21:50
c/c++
链表
c语言
数据结构
1024程序员节
Flink
架构、原理与部署测试
Apache
Flink
是一个面向分布式数据流处理和批量数据处理的开源计算平台,它能够基于同一个
Flink
运行时,提供支持流处理和批处理两种类型应用的功能。
AAA小肥杨
·
2023-10-25 21:03
大数据计算
Rocksdb LSM Tree Compaction策略
这张图取自
Flink
PMC大佬StefanRichter在
Flink
Forward2018演讲的PPT,笔者重画了一下。
大隐隐于野
·
2023-10-25 21:32
#
Ceph
Rocksdb专栏
rocksdb
RocksDB基本架构与原理详解
Rocksdb
Flink
提供基于流的有状态计算,除了提供实时数据流的处理能力,还需要将计算产生的状态存储起来。
大隐隐于野
·
2023-10-25 21:32
#
Ceph
Rocksdb专栏
rocksdb
【
flink
sql & table api】时间属性的指定与使用注意事项
DataStream到Table转换时定义3.使用TableSource定义四.事件时间的指定1.在DDL中定义2.在DataStream到Table转换时定义3.使用TableSource定义五.小结
Flink
roman_日积跬步-终至千里
·
2023-10-25 20:11
#
flink
实战
flink
sql
python
【理论知识:Window Aggregation】
flink
窗口聚合功能概述:两种窗口聚合模式的使用例子、功能说明
文章目录一.WindowingTVFs1.三种类型聚合的例子2.GROUPINGSETS子句语法ing2.1.ROLLUP2.2.CUBE3.SelectingGroupWindowStartandEndTimestamps4.级联窗口聚合(CascadingWindowAggregation)二.GroupWindowAggregation1.GroupWindowFunctions2.时间属性
roman_日积跬步-终至千里
·
2023-10-25 20:36
#
flink
实战
1024程序员节
Flink
窗口函数(Window Functions)处理迟到数据
Flink
Alienware^
·
2023-10-25 18:29
#
Flink
Flink
Flink
窗口函数(Window Functions)增量聚合函数
文章目录增量聚合函数(incrementalaggregationfunctions)归约函数(ReduceFunction)聚合函数(AggregateFunction)定义了窗口分配器,我们只是知道了数据属于哪个窗口,可以将数据收集起来了;至于收集起来到底要做什么,其实还完全没有头绪。所以在窗口分配器之后,必须再接上一个定义窗口如何进行计算的操作,这就是所谓的“窗口函数”(windowfunc
Alienware^
·
2023-10-25 18:59
#
Flink
Flink
Flink
流处理Window API之窗口函数
接上篇
Flink
中流处理之Window,上节中我们提到了可以为窗口设置滚动窗口,滑动窗口等,在设置后其实不能就这样结束了,我们还需要在窗口中指定如何计算,从而引入了窗口函数的概念,一旦窗口关闭,windowfunction
落花流水i
·
2023-10-25 18:29
Flink
flink
上一页
49
50
51
52
53
54
55
56
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他