E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Flink流处理
基于Hologres+
Flink
的曹操出行实时数仓建设作者:林震|曹操出行实时计算负责人
作者:林震|曹操出行实时计算负责人曹操出行业务背景介绍曹操出行创立于2015年5月21日,是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务,以“科技重塑绿色共享出行”为使命,将全球领先的互联网、车联网、自动驾驶技术以及新能源科技,创新应用于共享出行领域,以“用心服务国民出行”为品牌主张,致力于打造服务口碑最好的出行品牌。作为一家互联网出行平台,主要提供了网约车、顺风车、专车等一些出行服务。
阿里云大数据AI技术
·
2024-01-11 09:40
flink
大数据
flink
中的row类型详解
在Apache
Flink
中,`Row`是一个通用的数据结构,用于表示一行数据。它是
Flink
TableAPI和
Flink
DataSetAPI中的基本数据类型之一。
后季暖
·
2024-01-11 09:10
flink
大数据
深入理解
Flink
(四)
Flink
Time+WaterMark+Window 深入分析
Flink
Window常见需求背景需求描述每隔5秒,计算最近10秒单词出现的次数——滑动窗口每隔5秒,计算最近5秒单词出现的次数——滚动窗口关于
Flink
time种类TimeCharacteristicProcessingTimeIngestionTimeEventTimeWindowAssigner
我很ruo
·
2024-01-11 09:39
大数据
flink
大数据
分布式
Flink
/Doris生产环境方案选型的一些思考
以
Flink
为主的计算组件和以Doris为代表的存储+计算一体的方案选择问题是我们在技术选型过程中最常见的问题之一。也是很多公司和业务支持过程中会遇到的问题。
王知无(import_bigdata)
·
2024-01-11 09:37
flink
大数据
Flink
-CEP 实战教程
文章目录1.基本概念1.1CEP是什么1.2模式(Pattern)1.3应用场景2.快速上手2.1引入依赖2.2入门实例3.模式API(PatternAPI)3.1个体模式3.1.1基本形式3.1.2量词(Quantifiers)3.1.3条件(Conditions)3.2组合模式3.2.1初始模式(InitialPattern)3.2.2近邻条件(ContiguityConditions)3.2
阿moments
·
2024-01-11 09:06
Flink
flink
java
大数据
Flink
API开发之窗口(Window)
案例用到的测试数据请参考文章:
Flink
自定义Source模拟数据流原文链接:https://blog.csdn.net/m0_52606060/article/details/135436048窗口的概念
Appreciate(欣赏)
·
2024-01-11 09:05
Flink
大数据
flink
java
深入理解
Flink
(五)
Flink
Standalone 集群启动源码剖析
前言
Flink
集群的逻辑概念:JobManager(StandaloneSessionClusterEntrypoint)+TaskManager(TaskManagerRunner)
Flink
集群的物理概念
我很ruo
·
2024-01-11 09:03
大数据
flink
网络
大数据
分布式
yarn
依赖Kafka的Go单元测试例解
Kafka[1]是Apache基金会开源的一个分布式事件
流处理
平台,是Java阵营(最初为Scala)中的一款杀手级应用,其提供的高可靠性、高吞吐量和低延迟的数据传输能力,让其到目前为止依旧是现代企业级应用系统以及云原生应用系统中使用的重要中间件
Tony Bai
·
2024-01-11 08:05
kafka
golang
单元测试
分布式
开发语言
【Kafka-3.x-教程】-【六】Kafka 外部系统集成 【Flume、
Flink
、SpringBoot、Spark】
【Kafka-3.x-教程】专栏:【Kafka-3.x-教程】-【一】Kafka概述、Kafka快速入门【Kafka-3.x-教程】-【二】Kafka-生产者-Producer【Kafka-3.x-教程】-【三】Kafka-Broker、Kafka-Kraft【Kafka-3.x-教程】-【四】Kafka-消费者-Consumer【Kafka-3.x-教程】-【五】Kafka-监控-Eagle【K
bmyyyyyy
·
2024-01-11 06:50
Kafka
kafka
flume
flink
spark
#kafka集成外部系统
Flink
复习3-2-4-6-1(v1.17.0): 应用开发 - DataStream API - 状态和容错 - 数据类型&序列化 - 概述
DataTypes&SerializationSupportedDataTypes(支持的数据类型)TuplesandCaseClassesPOJOsPrimitiveTypes(基本数据类型)GeneralClassTypes(一般类型)ValuesHadoopWritablesSpecialTypes(特殊类型)TypeErasure&TypeInference(类型擦除和类型推断)Typeh
ε(´ο`*)))
·
2024-01-11 05:30
flink复习
flink
大数据
Flink
|《
Flink
官方文档 - DataStream API - 状态与容错 - 数据类型以及序列化 - 概览》学习笔记
学习文档:《
Flink
官方文档-DataStreamAPI-状态与容错-数据类型以及序列化-概览》学习笔记如下:
Flink
使用独特的方式来处理数据类型以及序列化。
长行
·
2024-01-11 05:59
Flink
flink
数据类型
序列化
泛型
面试|Kafka常见面试问题总结
Kafka是一个分布式的
流处理
平台,被越来越多的公司使用,Kafka可以被用于高性能的数据管道,
流处理
分析,数据集成等场景。本文分享总结了几个Kafka常见的面试问题,希望对你有所帮助。
tracy_668
·
2024-01-10 19:22
Flink
SQL设置sink的并行度
createtableaaa(pt_dtstring,proc_timetimestamp,ctimetimestamp,PRIMARYKEY(tqi_id)NOTENFORCED)with('connector'='upsert-kafka','topic'='bbb','properties.bootstrap.servers'='${sql.kafka.bootstrap.server}',
青云游子
·
2024-01-10 15:51
Flink
flink
第 7 节
Flink
standalone集群HA配置
上篇:第6节
Flink
onyarn内部实现1、
Flink
-HA高可用JobManager高可用(HA)jobManager协调每个
flink
任务部署。它负责任务调度和资源管理。
江湖侠客
·
2024-01-10 12:04
Flink入门实战
Flink
1.15本地集群部署Standalone模式(独立集群模式)
一.环境准备1、集群规划,CentOS7环境192.168.11.10411.104(DB测试)centf11104192.168.11.10511.105(DB测试)centf11105192.168.11.10611.106(DB测试)centf11106jdk安装参考:linux环境javajdk12.0.2部署_天一道长--玄彬的博客-CSDN博客2、jdk12安装》配置免密登入》三个节点
天一道长--玄彬
·
2024-01-10 12:04
大数据
flink
java
大数据
Flink
集群安装部署(Standalone,Yarn模式)
目录一.环境准备二.
Flink
集群安装步骤三.
Flink
OnYarn一.环境准备需要提前安装配置JDK,Hadoop二.
Flink
集群安装步骤1.下载安装包下载地址:Indexof/dist/
flink
MJK祺
·
2024-01-10 12:03
大数据
hadoop
flink
flink
Standalone独立集群模式配置和部署:
1.在conf/
flink
-conf.yaml文件下配置机器地址,jobmanger.rpc.addresssjia加上机器名下面红的地方配置就好,注意3台机器都是一样的IP,这样保证这台是主机器2,配置每个文件
平凡天下
·
2024-01-10 12:33
Flink
standalone集群部署配置
文章目录简介软件依赖部署方案二、安装1.下载并解压2.ssh免密登录3.修改配置文件3.启动集群4.访问WebUI简介
Flink
独立模式(Standalone)是部署
Flink
最基本也是最简单的方式:所需要的所有
shandongwill
·
2024-01-10 12:27
大数据
Flink
flink
大数据
5.MapReduce之Combiner-预聚合
目录概述本地预计算Combiner意义实践前提代码日志观察结束概述在MR、Spark、
Flink
中,常用的减少网络传输的手段。
流月up
·
2024-01-10 12:49
大数据
mapreduce
大数据
Combiner
预聚合
4.MapReduce 序列化
序列化序列化对象-->字节序例:存储到磁盘或者网络传输MR、Spark、
Flink
:分布式的执行框架必然会涉及到网络传输ja
流月up
·
2024-01-10 12:46
大数据
mapreduce
大数据
序列化
实践
如何配一台高性价比组装电脑
所以专门写了一篇文章给各位看官,每台电脑的配置都是用料十足,不存在缩水现象,那些某宝整机是没法和装机佬这里的配置相比的,配置图放在下方:主机1号主机1号采用inter的9400f处理器,这款处理器是现在中端电脑的主
流处理
装机佬
·
2024-01-10 09:25
Java8 Stream
流处理
树形结构数据
参考资料Java8新特性-使用Stream流递归实现遍历树形结构目录一.实体类二.模拟查询树形结构数据三.使用stream
流处理
为树形结构四.处理完的树形结构数据一.实体类importlombok.Builder
fengyehongWorld
·
2024-01-10 09:22
#
Stream流
java
深入理解
Flink
(三)
Flink
内核基础设施源码级原理详解
Hadoop生态各大常见组件的RPC技术实现
Flink
RPC网络通信框架Akka详解1、ActorSystem是管理Actor生命周期的组件,Actor是负责进行通信的组件。
我很ruo
·
2024-01-10 08:20
大数据
flink
大数据
hadoop
分布式
详解
flink
exactly-once和两阶段提交
以下是我们常见的三种
flink
处理语义:最多一次(At-most-Once):用户的数据只会被处理一次,不管成功还是失败,不会重试也不会重发。
后季暖
·
2024-01-10 08:58
flink
大数据
深入理解
Flink
(一)
Flink
架构设计原理
大数据分布式计算引擎设计实现剖析MapReduceMapReduce执行引擎解析MapReduce的组件设计实现图Spark执行引擎解析Spark相比于RM的真正优势的地方在哪里:(Simple、Fast、Scalable、Unified)DAG引擎中间计算结果可以进行内存持久化基于内存计算(不完全对,确切地说是把数据都加载(从内存中间件中读取)到内存中,然后来执行计算)生态多样,算子丰富,API
我很ruo
·
2024-01-10 08:57
大数据
flink
大数据
分布式
Flink
CDC使用
Flink
环境准备
Flink
版本对应的CDC版本两个jar包上传到
flink
bin目录下
flink
-sql-connector-mysql-cdcmysql-connector-java重启
Flink
集群
无故事王国LH
·
2024-01-10 08:22
flink
大数据
Flink
编程实践
(一)开发WordCount程序.在Linux系统中实现WordCount程序,并打包成JAR文件,提交到
Flink
中运行。
cwn_
·
2024-01-10 08:20
大数据
flink
大数据
java
深入理解
Flink
(二)
Flink
StateBackend 和 Checkpoint 容错深入分析
Flink
State设计详解State简单说,就是
Flink
Job的Task在运行过程中,产生的一些状态数据。
我很ruo
·
2024-01-10 07:41
大数据
flink
windows
大数据
Flink
之Task重启策略
Task重启策略1策略APInoRestart无参数,task失败后不重启,整个job同时失败,默认策略.代码示例RestartStrategies.noRestart();fixedDelayRestart参数注释restartAttempts最大重启次数delayBetweenAttempts重启时间间隔代码示例//最多重启5次,每次任务失败后间隔1s重启RestartStrategies.f
飞天小老头
·
2024-01-10 06:45
FLink
flink
大数据
安装配置
Flink
安装配置
Flink
1.上传安装包到Linux2.解压到指定路径tar-zxf.
叶子上的考拉
·
2024-01-10 05:28
flink
linux
大数据
Flink
任务实战优化
前言:一个好产品,功能应该尽量包装在服务内部;对于
Flink
而言,无疑是做到了这一点。
i7杨
·
2024-01-10 01:06
Flink
flink
大数据
Flink
CDC的分析和应用代码
前言:原本想讲如何基于
Flink
实现定制化计算引擎的开发,并以
Flink
CDC为例介绍;发现这两个在表达上不知以谁为主,所以先分析
Flink
CDC的应用场景和技术实现原理,下一篇再去分析
Flink
能在哪些方面
i7杨
·
2024-01-10 01:06
Flink
flink
大数据OLAP引擎发展原因及特性分析
在大数据高速发展时期,多个技术团队基于OLAP的应用需求,开发出多种OLAP技术,如Hive、SparkSql、
Flink
Sql、Impala、Kylin、ClickHouse、Doris等,或者在实现其他应用需求的时候
i7杨
·
2024-01-10 01:31
大数据技术分析
大数据
机器学习分布式架构
2.流计算(Storm,Spark,
Flink
)使用滑动窗口,在滑动窗口内的数据全部完成后再滑动到下一个时间窗口进行新一轮的数据处理,以分钟级别居多
小幸运Q
·
2024-01-09 17:27
yarn on
flink
监控
flink
任务监控
Flink
任务一般为实时不断运行的任务,如果没有任务监控,任务异常时无法第一时间处理会比较麻烦。这里通过调用API接口方式来获取参数,实现任务监控。
实时即未来
·
2024-01-09 13:28
flink
大数据
Flink
RestAPI
which
flink
找到
Flink
客户端地址如果输出结果为空,则说明
Flink
客户端没有安装在系统路径中。在这种情况下,您可以通过设置
FLINK
_HOME环境变量来指定
Flink
客户端的路径。
实时即未来
·
2024-01-09 13:57
大数据
Flink
窗口与WaterMark
本文的重心将放在
Flink
如何进行窗口操作以及开发者如何尽可能地利用
Flink
所提供的功能。下面展示了
Flink
窗口在keyedst
大数据技术派
·
2024-01-09 13:26
flink
java
eclipse
大数据
开发语言
flink
sql 知其所以然(十一):去重不仅仅有 count distinct 还有强大的 deduplication
1.序篇下面即是文章目录,也对应到了本文的结论,小伙伴可以先看结论快速了解博主期望本文能给小伙伴们带来什么帮助:背景及应用场景介绍:博主期望你了解到,
flink
sql的deduplication其实就是
程序员的隐秘角落
·
2024-01-09 12:36
阿里云大数据ACA及ACP复习题(81~100)
(B)A:大数据计算服务MaxComputeB:QuickBI数据可视化分析平台C:实时计算
Flink
版D:云原生数据仓库(分析型数据库)AnalyticDB**解析**:阿里云实时计算
Flink
版(AlibabaCloudRealtimeComputeforApache
Flink
周周的奇妙编程
·
2024-01-09 08:20
阿里云
大数据
云计算
初识Kafka
1.初识kafka官网:ApacheKafkaApacheKafka是一个分布式
流处理
平台,最初由LinkedIn开发并于2011年开源。它主要用于解决大规模数据的实时流式处理和数据管道问题。
瑜伽娃娃
·
2024-01-09 08:24
Kafka
kafka
分布式
Flink
SQL1.12 读取Mysql,写到Kafka、Hbase
Flink
SQL1.12读取Mysql,写到Kafka、Hbase概览心路历程案例流程pom文件如下测试代码docker安装kafka、hbase、mysql等hosts概览使用
flink
sql1.12
王糍粑的小夕
·
2024-01-09 07:10
flink
hbase
kafka
mysql
flink
1.17—关于TopN的测试
关于TopN的测试
flink
:1.17.1官网地址:https://nightlies.apache.org/
flink
/
flink
-docs-release-1.17/zh/docs/dev/table
王糍粑的小夕
·
2024-01-09 07:10
flink
flink
大数据
flink
教程-详解
flink
1.11中的新部署模式-Application模式
背景perjob模式的问题引入application模式通过程序提交任务Application模式源码解析背景目前对于
flink
来说,生产环境一般有两个部署模式,一个是session模式,一个是perjob
大数据技术与应用实战
·
2024-01-09 06:53
流式湖仓增强,Hologres +
Flink
构建企业级实时数仓
流式湖仓增强,Hologres+
Flink
构建企业级实时数仓一、Hologres+
Flink
,阿里云上众多客户实时数仓的首选随着大数据从规模化走向实时化,实时数据的需求覆盖互联网、交通、传媒、金融、政府等各个领域
Elivis Hu
·
2024-01-08 22:52
数仓
flink
大数据
Flink
嵌套json 解析成Table
在
flink
table中消息可以理解为表的一行记录。所以对于一个消息队列中的一个topic来说,可以根据json数据格式映射成一张表。
loukey_j
·
2024-01-08 18:52
实战
Flink
Java api消费kafka实时数据落盘HDFS
文章目录1需求分析2实验过程2.1启动服务程序2.2启动kafka生产3JavaAPI开发3.1依赖3.2代码部分4实验验证STEP1STEP2STEP35时间窗口1需求分析在Javaapi中,使用
flink
大数据程序终结者
·
2024-01-08 11:13
flink
java
kafka
Flink
学习笔记(五):
flink
数据合流
上一章记录了
flink
的分流操作,那么有分流是不是应该有合流呢?
胖胖的战士
·
2024-01-08 09:48
Flink
flink
合流
Flink
多流转换 (二)合流
所以
Flink
中合流的操作会更加普遍,对应的API也更加丰富。
Alienware^
·
2024-01-08 09:48
#
Flink
Flink
Flink
项目开发记录之合并数据流
Flink
项目开发记录之合并数据流项目目前的jar包环境:
flink
1.9.0这边就是常用jar,就不列出了,合并流我这边选择是使用相同的key流然后设置时间的上下限,进行合流项目背景:由于业务需求,将原本的从
清清清清清清
·
2024-01-08 09:17
flink
合并流
flink
Flink
自定义Source模拟数据流
maven依赖4.0.0com.zxl
Flink
Join1.0-SNAPSHOT88UTF-81.17.0org.apache.
flink
flink
-core${
flink
.version}org.apache.
flink
flink
-java
Appreciate(欣赏)
·
2024-01-08 09:47
Flink
java
flink
大数据
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他