E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Flink流处理
11、
Flink
配置
flink
-conf.yaml详细说明(HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg)
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2023-12-15 21:14
#
Flink专栏
flink
flink
配置
flink
流批一体化
flink
kafka
flink
ha
flink
高可用
flink
集群
2、
Flink
1.13.5二种部署方式(Standalone、Standalone HA )、四种提交任务方式(前两种及session和per-job)验证详细步骤
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2023-12-15 21:13
#
Flink专栏
flink
大数据
standalone部署
standalone
ha部署
flink
session模式
flink
per-job模式
流批一体化
3、
flink
重要概念(api分层、角色、执行流程、执行图和编程模型)及dataset、datastream详细示例入门和提交任务至on yarn运行
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2023-12-15 21:13
#
Flink专栏
flink
大数据
dataset
示例
datastream
示例
on
yarn
flink
flink执行流程
flink编程模型
5、
Flink
的 source、transformations、sink的详细示例(一)
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2023-12-15 21:43
#
Flink专栏
flink
大数据
flink
source
flink
转换处理
flink
sink
流批一体
datastrean
10、
Flink
的source、transformations、sink的详细示例(二)-source和transformation示例【补充示例】
Flink
系列文章一、
Flink
专栏
Flink
专栏系统介绍某一知识点,并辅以具体的示例进行说明。1、
Flink
部署系列本部分介绍
Flink
的部署、配置相关基础内容。
一瓢一瓢的饮 alanchan
·
2023-12-15 21:13
#
Flink专栏
flink
flink
流批一体化
flink
实时计算
flink
离线计算
flink
kafka
flink
滑动窗口
flink
滚动窗口
Flink
使用场景
Apache
Flink
功能强大,支持开发和运行多种不同种类的应用程序。它的主要特性包括:批流一体化、精密的状态管理、事件时间支持以及精确一次的状态一致性保障等。
程序猿进阶
·
2023-12-15 21:39
Flink
flink
大数据
算法
运维
后端
websocket
网络
大数据学习(一)-------- HDFS
已经有了很多框架方便使用,常用的有hadoop,storm,spark,
flink
等,辅助框架hive,kafka,es,sqoop,flume等。常见应用推荐系统,用户画像等。
大数据流动
·
2023-12-15 21:01
flink
1.12.4消费kafka 报错 The coordinator is not available
org.apache.kafka.common.errors.CoordinatorNotAvailableException:Thecoordinatorisnotavailable.但是任务还在正常跑.开源bug[
FLINK
青云游子
·
2023-12-15 21:07
Flink
kafka
flink
【
Flink
on k8s】- 15 - 将
flink
on yarn 迁移到
flink
on k8s
目录1、集群现状2、与
Flink
onyarn对比2.1
Flink
onyarn的一些痛点2.2
Flink
onk8s的一些优点
high2011
·
2023-12-15 21:37
Flink
kubernetes
operator
Flink(理论+实战)
flink
大数据
Flink
系列文章汇总索引
Flink
系列文章一、
Flink
专栏本专栏系统介绍某一知识点,并辅以具体的示例进行说明。
一瓢一瓢的饮 alanchan
·
2023-12-15 21:36
flink
示例专栏
flink
大数据
flink
流批一体化
flink
hive
flink
kafka
flink
聚合计算
flink
实时计算
kmeans设置中心_Spark分布式机器学习源码分析:Kmeans族聚类
Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,
流处理
上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。
weixin_39699121
·
2023-12-15 19:27
kmeans设置中心
spark
kmeans打印质心
Flink
源码之 Buffer Timeout优化
Flink
源码分析系列文档目录请点击:
Flink
源码分析系列文档目录BufferTimeout概念
Flink
每个算子向下游发送数据需要两个条件:输出buffer空间占满buffer中数据存在时间超过buffertimeout
AlienPaul
·
2023-12-15 18:55
大数据基础知识
为了一场紧急考试,没有正经系统学习过大数据知识的我开始恶补概念涉及Hadoop、Hbase、Spark、
Flink
、Flume、Kafka、Sqoop、HDFS、Hive、Mapreduce、Impala
偶余杭
·
2023-12-15 17:22
使用
Flink
完成流数据统计 | 京东云技术团队
统计流程所有流计算统计的流程都是:1、接入数据源2、进行多次数据转换操作(过滤、拆分、聚合计算等)3、计算结果的存储其中数据源可以是多个、数据转换的节点处理完数据可以发送到一个和多个下一个节点继续处理数据
Flink
京东云开发者
·
2023-12-15 16:02
技术分享
https
Flink
大数据
Flink
反压如何查看和优化
我们在使用
Flink
程序进行流式数据处理时,由于种种原因难免会遇到性能问题,如我们在使用
Flink
程序消费kafka数据,可能会遇到kafka数据有堆积的情况,并且随着时间的推移,数据堆积越来越多,这就表名消费处理数据的速度没有跟上生产的速度
后季暖
·
2023-12-15 15:18
flink
大数据
FLink
开发遇到java 泛型报错
FLink
开发遇到java报错/Library/jdk1.8.0_372.jdk/Contents/Home/bin/java-javaagent:/Applications/IntelliJIDEA.app
Bonyin
·
2023-12-15 15:45
flink
java
python
Flink
之迟到的数据
Duration.ofSeconds(2))设置窗口延迟关闭:.allowedLateness(Time.seconds(3))使用侧流接收迟到的数据:.sideOutputLateData(lateData)publicclass
Flink
12
十七✧ᐦ̤
·
2023-12-15 15:13
flink
大数据
java
Flink
之JDBCSink连接MySQL
输出到MySQL添加依赖org.apache.
flink
flink
-connector-jdbc3.1.0-1.17com.mysqlmysql-connector-j8.0.32启动MySQL,在test
十七✧ᐦ̤
·
2023-12-15 15:43
flink
mysql
大数据
flink
中如何把DB大表的配置数据加载到内存中对数据流进行增强处理
背景在处理
flink
的数据流时,比如处理商品流时,一般我们从kafka中只拿到了商品id,此时我们需要把商品的其他配置信息比如品牌品类等也拿到,此时就需要关联上外部配置表来达到丰富数据流的目的,如果外部配置表很大
lixia0417mul2
·
2023-12-15 15:08
flink
flink
数据库
大数据
以csv为源
flink
创建paimon 临时表相关 join 操作
环境:各组件版本如下kyuubi1.8.0
flink
1.17.1paimon0.5正式版本hive3.1.3阅读此文前,需涉及前置的知识点如下kyuubi整合
flink
yarnapplication
流月up
·
2023-12-15 15:00
大数据
flink
大数据
csv
paimon
临时表
join
抖音违规一次会限流多长时间?违规行为是什么?
抖音作为中国最大的短视频平台之一,为了维护平台秩序和用户体验,对于违反平台规则的用户会采取限
流处理
。那么,抖音违规一次限流的时长到底是多久呢?
氧惠导师
·
2023-12-15 15:57
计算机毕业设计Python+Spark知识图谱微博舆情预警系统 微博舆情分析 微博推荐系统 微博可视化 微博数据分析 微博大数据 微博爬虫 微博预测系统 大数据毕业设计 大数据毕业设计 机器学习
开发框架前端:vue.jselement-ui后端:springbootmybatis中间件:sparkhadoophive
flink
数据库:mysql关系型数据库neo4j图数据库算法:协同过滤推荐算法
计算机毕业设计大神
·
2023-12-15 12:19
【基础知识】大数据概述
发展历程中国开源生态图谱2023参考内容中国开源生态图谱2023.pdf技术组件说明数据集成sqoop、dataX、flume数据存储hdfs、kafka数据处理mapreduce、hive、impala、spark、
flink
偏振万花筒
·
2023-12-15 12:39
大数据
Flink
集群搭建
1安装包下载根据自己的环境下载相应的
flink
安装包:https://
flink
.apache.org/downloads.html下载的版本要与自己的scala版本一致,我安装的scala版本为2.11
NemoonFish
·
2023-12-15 12:20
flink集群搭建
flink
flink
源码分析之功能组件(五)-高可用组件
简介本系列是
flink
源码分析的第二个系列,上一个《
flink
源码分析之集群与资源》分析集群与资源,本系列分析功能组件,kubeclient,rpc,心跳,高可用,slotpool,rest,metrics
中间件XL
·
2023-12-15 11:21
flink
大数据
zookeeper
分布式
Flink
CDC--MySQL
Flink
CDC–MySQL
Flink
CDCMySQL版本单表CDC目标:利用
Flink
将MySQL增量数据同步到Doris执行流程第一步:操作数据库构建表,并加入数据mysql-uroot-pupdateusersetHost
清盏涂墨衣
·
2023-12-15 09:59
flink
mysql
全方位解读SeaTunnel MySQL CDC连接器:实现数据高效同步的强大工具
MySQLCDC源连接器支持的引擎SeaTunnelZeta
Flink
主要特性批量流式
DolphinScheduler社区
·
2023-12-15 07:41
大数据
Kafka-Kafka基本原理与集群快速搭建
一、Kafka介绍ChatGPT对于ApacheKafka的介绍:ApacheKafka是一个分布式
流处理
平台,最初由LinkedIn开发并于2011年开源。
长情知热爱
·
2023-12-15 06:38
kafka
分布式
Kafka基础理论与常用命令详解(超详细)
生产者)2.4Consumer(消费者)2.5ConsumerGroup(消费者组)3.Kafka特点3.1高吞吐量3.2持久性3.3可扩展性3.4实时性3.5可靠性4.Kafka应用场景4.1实时数据
流处理
大数据魔法师
·
2023-12-15 06:53
大数据
kafka
分布式
物流实时数仓:采集通道搭建
hbase安装1.上传并解压2.配置环境变量3.拷贝jar包4.编写配置文件5.分发配置文件3.Redis安装1.安装需要的编译环境2.上传并解压文件3.编译安装4.后台访问4.ClickHouse安装5.
Flink
超哥--
·
2023-12-15 06:34
物流实时数仓
大数据
flink
06 数仓平台MaxWell
Maxwell输出数据格式Maxwell原理Maxwell工作原理是实时读取MySQL数据库的二进制日志(Binlog),从而获取变更数据,再将变更数据以JSON格式发送给Kafka等
流处理
平台。
kk_io
·
2023-12-15 06:02
数据仓库
数据仓库
hadoop
增量同步
Flink
核心概念
在
Flink
执行过程中,每一个算子(operator)可以包含一个或多个子任务(operatorsubtask),这些子任务在不同的线程、不同的物理机或不同的容
Stephen6Yang
·
2023-12-15 03:06
flink
flink
Flink
基本转换算子map/filter/flatmap
mapmap是大家非常熟悉的大数据操作算子,主要用于将数据流中的数据进行转换,形成新的数据流。简单来说,就是一个“一一映射”,消费一个元素就产出一个元素。我们只需要基于DataStream调用map()方法就可以进行转换处理。方法需要传入的参数是接口MapFunction的实现;返回值类型还是DataStream,不过泛型(流中的元素类型)可能改变。publicclassTransMap{publ
Stephen6Yang
·
2023-12-15 03:01
flink
flink
java
转换算子
flatmap
map
【
Flink
系列七】TableAPI和
Flink
SQL初体验
Apache
Flink
有两种关系型API来做流批统一处理:TableAPI和SQLTableAPI是用于Scala和Java语言的查询API,它可以用一种非常直观的方式来组合使用选取、过滤、join等关系型算子
周润发的弟弟
·
2023-12-15 03:48
从零开始搞大数据
flink
大数据
【
Flink
系列六】
Flink
里面的状态一致性
状态一致性有状态的
流处理
,内部每个算子任务都可以有自己的状态,对于
流处理
器内部来说,所谓的状态一致性,其实就是我们所说的计算结果要保证准确。一条数据不应该丢失,也不应该重复计算。
周润发的弟弟
·
2023-12-15 03:18
从零开始搞大数据
flink
大数据
【
Flink
名称解释一】什么是cataLog
Catalog提供了元数据信息,例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。数据处理最关键的方面之一是管理元数据。元数据可以是临时的,例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的,例如HiveMetastore中的元数据。Catalog提供了一个统一的API,用于管理元数据,并使其可以从TableAPI和SQL查询语句中来访问。
周润发的弟弟
·
2023-12-15 03:18
从零开始搞大数据
flink
大数据
【
Flink
系列四】Window及Watermark
3.1、window在
Flink
中Window可以将无限流切分成有限流,是处理有限流的核心组件,现在
Flink
中Window可以是时间驱动的(TimeWindow),也可以是数据驱动的(CountWindow
周润发的弟弟
·
2023-12-15 03:18
从零开始搞大数据
flink
大数据
Flink
Window中典型的增量聚合函数(ReduceFunction / AggregateFunction)
一、什么是增量聚合函数在
Flink
Window中定义了窗口分配器,我们只是知道了数据属于哪个窗口,可以将数据收集起来了;至于收集起来到底要做什么,其实还完全没有头绪,这也就是窗口函数所需要做的事情。
文文鑫
·
2023-12-15 03:45
#
Flink
flink
大数据
kyuubi整合
flink
yarn application model
目录概述配置
flink
配置kyuubi配置kyuubi-defaults.confkyuubi-env.shhive验证启动kyuubibeeline连接使用hivecatalogsql测试结束概述
flink
流月up
·
2023-12-15 03:14
大数据
flink
大数据
kyuubi
yarn
application
1.8.0
kyuubi
1.8.0
【
Flink
系列五】Checkpoint及Barrier原理
本章内容一致性检查点从检查点恢复状态检查点实现算法-barrier保存点Savepoint状态后端(statebackend)本文先设置一个前提,
流处理
的数据都是可回放的(可以理解成消费的kafka的数据
周润发的弟弟
·
2023-12-15 02:11
从零开始搞大数据
flink
大数据
java读取txt文件及乱码处理
目录一、java如何读取txt文件方式1、文件
流处理
(FileInputStream)方式2、JDK11及以上版本方式3、JDK8jdk8方式4、jdk8JDK8jdk8一次性全部读取二、java读取文件的乱码问题场景
Crhy、Y
·
2023-12-15 00:14
后端
Java
JDK
java
开发语言
spring
maven
mybatis
Kafka-快速实战
Kafka介绍ChatGPT对于ApacheKafka的介绍:ApacheKafka是一个分布式
流处理
平台,最初由LinkedIn开发并于2011年开源。
有梦想的年轻人6174
·
2023-12-14 20:21
kafka
java
开源的数据流技术,该选择Redpanda还是Apache Kafka?
目前,ApacheKafka不但成为了数据
流处理
领域事实上的标准,而且带动了同类产品的出现。Redpanda就是其中之一。它是一种轻量级的且兼容C++的Kafka实现。
c++服务器开发
·
2023-12-14 20:56
开源
apache
kafka
【毕业设计】大数据淘宝用户行为数据分析与可视化 -
flink
文章目录0前言1、环境准备1.1
flink
下载相关jar包1.2生成kafka数据1.3开发前的三个小tip2、
flink
-sql客户端编写运行sql2.1创建kafka数据源表2.2指标统计:每小时成交量
caxiou
·
2023-12-14 19:08
大数据
毕业设计
大数据
数据分析
Spark Structured Streaming使用教程
输入数据源2、输出模式3、sink输出结果4、时间窗口4.1、时间窗口4.2、时间水印(Watermarking)5、使用例子StructuredStreaming是一个基于SparkSQL引擎的可扩展和容错
流处理
引擎
penngo
·
2023-12-14 19:17
java
大数据
spark
大数据
flink
源码分析之功能组件(六)-心跳组件
简介本系列是
flink
源码分析的第二个系列,上一个《
flink
源码分析之集群与资源》分析集群与资源,本系列分析功能组件,kubeclient,rpc,心跳,高可用,slotpool,rest,metrics
中间件XL
·
2023-12-14 16:10
flink
中间件
rpc
Flink
-源算子-读取数据的几种方式
Flink
可以从各种来源获取数据,然后构建DataStream进行转换处理。一般将数据的输入来源称为数据源(datasource),而读取数据的算子就是源算子(sourceoperator)。
Stephen6Yang
·
2023-12-14 16:04
flink
flink
大数据
读取数据
Flink
之流的转换
ProcessFuncion处理函数功能拥有富函数功能-生命周期方法-状态编程对元素的处理功能processElement,在不同的处理函数中,该方法的名字略有区别定时器编程TimeService:定时服务,可以用于注册定时器,删除定时器ontimer():定时器触发后会自动调用该方法,我们将需要完成的工作写到该方法中侧输出流分类processFunction:普通流DataStream调用key
十七✧ᐦ̤
·
2023-12-14 16:34
flink
数据库
大数据
Flink
之状态编程
状态的分类托管状态:由
Flink
统一管理的,状态的存储访问、故障恢复和重组等一系列问题都由
Flink
实现。算子状态:状态由算子内所
十七✧ᐦ̤
·
2023-12-14 16:34
flink
java
大数据
Flink
之keyby状态
KeyedState值状态:维护一个具体的值ValueState继承自StateTvalue():从状态中获取维护的数据update():更新状态列表状态:可以当成List使用,维护多个值add():添加一个状态addAll():添加多个状态,不会覆盖原有的状态get():获取状态update():将指定集合的数据直接更新到状态中,会覆盖原有的状态clear():清空状态Map状态:维护一个Map
十七✧ᐦ̤
·
2023-12-14 16:34
flink
windows
linux
大数据
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他