E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
flink异步io
【
Flink
】如何在
Flink
中规划 RocksDB 内存容量?
1.概述转载:如何在
Flink
中规划RocksDB内存容量?主要是自己学习。
九师兄
·
2023-12-18 15:06
转载
flink
数据库
大数据
Flink
系列之:窗口函数Windowing table-valued functions (Windowing TVFs)
Flink
系列之:窗口函数Windowingtable-valuedfunctionsWindowingTVFs一、窗口函数二、TumbleWindows三、HopWindows四、CumulateWindows
最笨的羊羊
·
2023-12-18 14:42
Flink
大数据
Flink系列
窗口函数
Windowing
table-valued
functions
TVFs
Flink
系列之:窗口关联
Flink
系列之:窗口关联一、窗口关联二、INNER/LEFT/RIGHT/FULLOUTER三、SEMI四、ANTI五、限制一、窗口关联适用于流、批窗口关联就是增加时间维度到关联条件中。
最笨的羊羊
·
2023-12-18 14:22
Flink系列
窗口关联
Flink
实时数仓项目—项目初了解
Flink
实时数仓项目—项目初了解前言一、实时数仓分层介绍1.普通的实时计算与实时数仓比较2.实时电商数仓分层规划二、实时数仓需求概览1.离线计算和实时计算的比较2.实时需求种类2.1日常统计报表或分析图中需要包含当日部分
自学大数据的菜鸡
·
2023-12-18 14:46
实时数仓
大数据项目
Flink
大数据
flink
数据仓库
3、电商数仓(数仓数据同步策略)
实时数仓同步数据实时数仓由
Flink
源源不断从Kafka当中读数据计算,所以不需要手动同步数据到实时数仓。
tianyi6_6
·
2023-12-18 14:46
数据仓库(电商)
大数据
linux
hadoop
kafka
分布式
Flink
电商实时数仓项目03-DWM层
1DWM层与DWS层的设计思路1.1设计思路用户行为日志:模拟日志jar->nginx->web日志服务器->kafka(ods_base_log)->
flink
(BaseLogApp
最佳第六六六人
·
2023-12-18 14:45
大数据项目实战
flink
电商数仓
Flink
电商实时数仓项目04-DWS层
1DWS层和DWM层的设计1.1DWS层前面的总结DWS层的定位是什么呢?轻度聚合,因为DWS层要应对很多实时查询,如果是完全的明细那么查询的压力非常大。将更多的实时数据以主题的形式组合起来便于管理,同时也能减少维度查询的次数。ODS层:--日志数据:nginx+日志采集服务器(3台)将数据采集到Kafka(ods_base_log)--业务数据:Maxwell监控MySQL(binlog)将数据
最佳第六六六人
·
2023-12-18 14:45
大数据项目实战
flink
电商数仓
大数据
Flink
电商实时数仓实战项目流程全解(最终章)
Flink
SQL的简单应用以及数据接口设计思路
Flink
Sql介绍在实际开发过程中,我个人是以StreamAPI为主,
Flink
Sql写的不多,这里主要是参考原本项目代码写的,具体的细节,我也不是很熟悉,建议大家可以单独去了解一下
Flink
Sql;
大数据YYDS
·
2023-12-18 14:14
大数据Flink实战
flink
大数据
Flink
电商实时数仓实战项目流程全解(三)
DWD层日志数据分离在数仓搭建过程中,对日志数据做分离是非常有必要而且有意义的,我们可以通过把日志分为启动、隔离、曝光、异常、页面等日志,可以计算获取访客数量、独立访客数量、页面跳转、页面跳出等统计指标数据;那么在实时数仓和离线数仓中,这里有什么不同点呢?异同点分析在离线数仓的搭建过程中,我们可以获取一段时间内的离线日志数据,然后将日志数据进行过滤和分离,但是在实时数仓中,我们需要得到实时的流数据
大数据YYDS
·
2023-12-18 14:44
大数据Flink实战
大数据
flink
大数据
Flink
电商实时数仓实战项目流程全解(五)
前提概要:之前我们已经实现了动态分流,即通过TableProcessFunction1类把维度数据和事实数据进行了分流处理,接下来就是把数据写入Hbase表和Kafka主题表中:hbaseDS.addSink(newDimSink());kafkaDS.addSink(kafkaSink);此时的动态分流后的2种数据类型大致为:在代码注释种我已经详尽地介绍了输出数据的情况和代码逻辑,接下来我会以代
大数据YYDS
·
2023-12-18 14:44
大数据Flink实战
flink
Flink
实时电商数仓(一)
离线数据仓库为数据分析而设计的企业级数据管理系统。常用的存储系统是Hadoop的HDFS文件系统,使用Hive进行数据计算,并将结果导入HDFS。离线数仓最明显的特点是T+1模式,今天只能算昨天的数据,时效性不够优秀。实时数仓时效性:针对数仓大屏展示这个领域,10~15s刷新一次即可。核心架构日志服务器:采集日志文件Kafka集群:消息缓存HDFS存储:即hadoop集群Hive分层数仓:ODS+
十七✧ᐦ̤
·
2023-12-18 14:14
flink
大数据
【
Flink
on k8s】- 14 -
Flink
kubernetes operator 使用经验分享
目录一、集成
flink
maven项目发布到私有库1、环境准备2、使用maven创建java项目
high2011
·
2023-12-18 12:50
Flink
kubernetes
operator
Flink(理论+实战)
flink
kubernetes
大数据
Flink
系列之:自定义函数
Flink
系列之:自定义函数一、自定义函数二、概述三、开发指南四、函数类五、求值方法六、类型推导七、自动类型推导八、定制类型推导九、确定性十、内置函数的确定性十一、运行时集成十二、标量函数十三、表值函数十四
最笨的羊羊
·
2023-12-18 07:31
Flink
Flink系列
自定义函数
Flink
系列之:监控反压
Flink
系列之:监控反压一、反压二、Task性能指标三、示例四、反压状态
Flink
Web界面提供了一个选项卡来监控正在运行jobs的反压行为。
最笨的羊羊
·
2023-12-18 07:01
Flink
Flink系列
监控反压
Flink
系列之:
Flink
1.8.0 中的状态 TTL:如何在 Apache
Flink
中自动清理应用程序状态
Flink
系列之:
Flink
1.8.0中的状态TTL:如何在Apache
Flink
中自动清理应用程序状态一、状态的瞬态性质二、用于持续清理应用程序状态的状态TTL三、倒垃圾四、保持完整状态快照干净五、堆状态后端的增量清理六
最笨的羊羊
·
2023-12-18 07:25
日常分享专栏
Flink系列
Flink
1.8.0
状态
TTL
自动清理应用程序状态
区分阻塞、非阻塞、IO多路复用 、
异步IO
IOIO(Input/Output,输入/输出)即数据的读取(接收)或写入(发送)操作,通常用户进程中的一个完整IO分为两阶段:用户进程空间内核空间、内核空间设备空间(磁盘、网络等)。IO有内存IO、网络IO和磁盘IO三种,通常我们说的IO指的是后两者。什么是内核态,用户态用户态:也称为用户空间,即上层应用程序的活动空间,应用程序的执行必须依赖于内核提供的资源用户态:也称为用户空间,即上层应用程序
wumx_golang
·
2023-12-18 05:09
linux
运维
服务器
IO多路复用(select/poll/epol),以及golangIO里使用goroutine结合IO多路复用实现的“异步”IO模型
zhuanlan.zhihu.com/p/344581947仅做个人备份,浏览请看原文目录io模型阻塞式IO非阻塞式IOIO多路复用(包含:select/poll/epoll)select/poll/epoll三者的区别epoll介绍
异步
wangfy_
·
2023-12-18 05:01
go
大数据实时(4)-YDJ的
FLink
&Hologres的实时数仓实践
目录:1、场景与痛点2、技术选型3、应用最佳实践1)客户系统实践2)大屏实践3)实时数仓实践4、思考1、场景与痛点一家快速成长的公司,在短期内发展起来时,技术方面都会留下一些问题,比如从大单体到微服务的转型,从选型到落地,有时为了快速满足业务的需求,会采用一些临时方案满足客户要求,造成一些临时方案遗留症。比如:架构方面:多种数据源、多语言、多布式、异构系统、业务侵入严重,多种架构带来的复杂性;数据
天天沐沐
·
2023-12-18 03:39
Hudi 在 vivo 湖仓一体的落地实践
一、Hudi基础能力及相关概念介绍1.1流批同源能力与Hive不同,Hudi数据在Spark/
Flink
写入后,下游可以继续使用Spark/
Flink
引擎以流读的形式实时读取数据。
vivo互联网技术
·
2023-12-18 03:15
数据湖
大数据计算与存储
效率提升
flink
sql 知其所以然(十二):流 join 很难嘛???(上)
1.序篇1.博主会阐明博主期望本文能给小伙伴们带来什么帮助,让小伙伴萌能直观明白博主的心思2.博主会以实际的应用场景和案例入手,不只是知识点的简单堆砌3.博主会把重要的知识点的原理进行剖析,让小伙伴萌做到深入浅出进入正文。下面即是文章目录,也对应到本文的结论,小伙伴可以先看结论快速了解本文能给你带来什么帮助:背景及应用场景介绍:join作为离线数仓中最常见的场景,在实时数仓中也必然不可能缺少它,f
程序员的隐秘角落
·
2023-12-17 22:25
Flink
编译
我的代码版本为release-1.9liyue@liyue-1:~/
flink
/
flink
-1.9$gitremote-voriginhttps://github.com/apache/
flink
.git
晚熟的程序员
·
2023-12-17 21:44
flink
安装
什么是
flink
flink
是一个分布式,高性能,随时可用的以及准确的流处理计算框架,
flink
可以对无界数据(流处理)和有界数据(批处理)进行有状态计算(
flink
天生支持状态计算)的分布式,高性能的计算框架
千百元
·
2023-12-17 19:21
#
flink
flink
大数据
Flink
Hudi 源码之COW表数据写入流程
Flink
源码分析系列文档目录请点击:
Flink
源码分析系列文档目录数据写入流程接上一篇
Flink
Hudi源码之HoodieTableSink。
AlienPaul
·
2023-12-17 19:10
flink
找不到隐式项
增加importorg.apache.
flink
.streaming.api.scala._即可
Thomas2143
·
2023-12-17 15:45
free
flink
大数据
Flink
系列之:Top-N
Flink
系列之:Top-N一、TOP-N二、无排名输出优化一、TOP-N适用于流、批Top-N查询可以根据指定列排序后获得前N个最小或最大值。最小值和最大值集都被认为是Top-N查询。
最笨的羊羊
·
2023-12-17 15:09
Flink
Flink系列
Top-N
Flink
系列之:集合操作
Flink
系列之:集合操作一、集合操作二、UNION三、INTERSECT四、EXCEPT五、IN六、EXISTS一、集合操作适用于流、批操作二、UNIONUNION和UNIONALL返回两个表中的数据
最笨的羊羊
·
2023-12-17 15:39
Flink
Flink系列
集合操作
Flink
系列之:ORDER BY语句和LIMIT语句
Flink
系列之:ORDERBY语句和LIMIT语句一、ORDERBY语句二、LIMIT语句一、ORDERBY语句适用于流、批一体ORDERBY子句使结果行根据指定的表达式进行排序。
最笨的羊羊
·
2023-12-17 15:39
Flink
Flink系列
ORDER
BY语句
LIMIT语句
Flink
系列之:Joins
Flink
系列之:Joins一、Joins二、RegularJoins三、INNEREqui-JOIN四、OUTEREqui-JOIN五、IntervalJoins六、TemporalJoins七、事件时间
最笨的羊羊
·
2023-12-17 15:38
Flink
大数据
Flink系列
Joins
【DataSophon】大数据服务组件之
Flink
升级
是什么1.1DataSophon概述1.2架构概览1.3设计思想二、解压新旧组件安装包三、修改安装包中文件和目录四、重新生成安装包3.1重新打包3.2生成加密码3.3生成md5加密文件五、删除已装的组件包
flink
阿龙先生啊
·
2023-12-17 15:37
大数据运维
hadoop
flink
大数据平台
大数据底座
大数据运维
组件升级
DataSophon
流批一体神器
Flink
之
Flink
State 架构原理解析
身为大数据工程师,你还在苦学Spark、Hadoop、Storm,却还没搞过
Flink
?醒醒吧!
zhisheng_blog
·
2023-12-17 14:32
分布式
大数据
编程语言
flink
hadoop
Flink
-水位线和时间语义
Flink
中的时间含义在实际应用中,事件时间语义会更为常见。一般情况下,业务日志数据中都会记录数据生成的时间戳(timestamp),它就可以作为事件时间的判断基础。
Stephen6Yang
·
2023-12-17 09:42
flink
flink
大数据
水位线
迟到数据
Flink
窗口的概念和分类
窗口的概念
Flink
是一种流式计算引擎,主要是来处理无界数据流的,数据源源不断、无穷无尽。
Stephen6Yang
·
2023-12-17 09:12
flink
flink
大数据
Flink
简介
Flink
简介#一、
Flink
简介#1.
Flink
发展这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有Hadoop、Storm,以及后来的Spark,他们都有着各自专注的应用场景。
lz_matlab
·
2023-12-17 09:09
Flink
flink
大数据
Flink
状态管理
#
Flink
状态管理我们前面写的wordcount的例子,没有包含状态管理。如果一个task在处理过程中挂掉了,那么它在内存中的状态都会丢失,所有的数据都需要重新计算。
lz_matlab
·
2023-12-17 09:39
Flink
flink
java
大数据
Flink
运行架构
Flink
运行架构#
Flink
运行架构#1.
Flink
程序结构
Flink
程序的基本构建块是流和转换(请注意,
Flink
的DataSetAPI中使用的DataSet也是内部流)。
lz_matlab
·
2023-12-17 09:06
Flink
flink
架构
大数据
电商数仓项目----笔记三(用户行为数据同步)
在前面的笔记一和笔记二中,我们已经分别将用户行为数据和业务数据采集到kafka中了:在实时数仓中,由于
Flink
会从kafka中读取数据,也无需我们再同步数据了,因此同步数据是我们离线数仓的事。
zmx_messi
·
2023-12-17 08:43
笔记
Flink
系列之:WITH clause
Flink
系列之:WITHclause适用流、批提供了一种编写辅助语句以在较大查询中使用的方法。这些语句通常称为公共表表达式(CTE),可以被视为定义仅针对一个查询而存在的临时视图。
最笨的羊羊
·
2023-12-17 06:06
Flink
flink
大数据
Flink系列
WITH
clause
Flink
系列之:使用
flink
查询数据和插入数据
SELECT语句和VALUES语句是使用TableEnvironment的sqlQuery()方法指定的。该方法以表的形式返回SELECT语句(或VALUES语句)的结果。Table可以在后续的SQL和TableAPI查询中使用、转换为DataStream或写入TableSink。SQL和TableAPI查询可以无缝混合,并进行整体优化并转换为单个程序。为了在SQL查询中访问表,它必须在Table
最笨的羊羊
·
2023-12-17 06:36
Flink
flink
Flink系列
查询数据和插入数据
Flink
系列之:SQL提示
Flink
系列之:SQL提示一、动态表选项二、语法三、例子四、查询提示五、句法六、加入提示七、播送八、随机散列九、随机合并十、嵌套循环十一、LOOKUP十二、进一步说明十三、故障排除十四、连接提示中的冲突案例十五
最笨的羊羊
·
2023-12-17 06:36
Flink
flink
sql
linq
Flink系列
SQL提示
Flink
系列之:SELECT & WHERE clause
Flink
系列之:SELECT&WHEREclause一、SELECT&WHEREclause二、SELECTDISTINCT适用于流、批一、SELECT&WHEREclauseSELECT语句的一般语法是
最笨的羊羊
·
2023-12-17 06:58
Flink
flink
Flink系列
SELECT
WHERE
clause
【
Flink
-cdc-Mysql-To-Kafka】使用
Flink
sql 利用集成的 connector 实现 Mysql 数据写入 Kafka
【
Flink
-cdc-Mysql-To-Kafka】使用
Flink
sql利用集成的connector实现Mysql数据写入Kafka1)环境准备2)准备相关jar包3)实现场景4)准备工作4.1.Mysql4.2
bmyyyyyy
·
2023-12-17 05:04
Flink
flink
mysql
kafka
【
Flink
-Sql-Kafka-To-ClickHouse】使用
Flink
Sql 将 Kafka 数据写入 ClickHouse
【
Flink
-Sql-Kafka-To-ClickHouse】使用
Flink
Sql将Kafka数据写入ClickHouse1)需求分析2)功能实现3)准备工作3.1.Kafka3.2.ClickHouse4
bmyyyyyy
·
2023-12-17 05:57
Flink
flink
sql
kafka
Flink
SQL的联结和函数
联结查询常规联结InnerJoin:结果集取交集OuterJoinleftouterjoin:左表的数据全取,右表的数据取与左表匹配的数据rightouterjoin:右表的数据全取,左表的数据取与右表匹配的数据fullouterjoin:左表和右表都取匹配的数据常规联结,会将流中的数据一直保留在状态中,需要考虑状态的清除,可以使用TTLtableEnv.getConfig().getConfig
十七✧ᐦ̤
·
2023-12-17 05:32
java
前端
数据库
Flink
SQL中的窗口
Union方案:A,B,C的任意组合共有8种,分别为(A,B,C,AB,AC,BC,ABC,空集)然后每种类型的个数也不一样,需要补足空白的字段将每种类型进行groupby+sum求和后Union在一起
Flink
十七✧ᐦ̤
·
2023-12-17 05:28
flink
windows
大数据
Flink
源码之数据分区
Flink
源码分析系列文档目录请点击:
Flink
源码分析系列文档目录前言
Flink
流处理作业支持并行操作。每一个并行度可以理解为一个数据管道。上游和下游的并行度也可能是不同的。
AlienPaul
·
2023-12-17 02:38
Flink
有状态流式处理
传统批次处理方法【1】持续收取数据(kafka等),以window时间作为划分,划分一个一个的批次档案(按照时间或者大小等);【2】周期性执行批次运算(Spark/Stom等);传统批次处理方法存在的问题:【1】假设计算每小时出现特定事件的转换次数(例如:1、2…),但某个事件正好处于1到2之间就尴尬了。需要将1点处理一半的结果带到2点这个批次中进行运算。而这个划分跟我们事件发生的时间也是有误差的
程序猿进阶
·
2023-12-17 00:30
Flink
flink
大数据
服务器
运维
java
后端
前端
Flink
源码之 SQL 内置function定义方式
Flink
源码分析系列文档目录请点击:
Flink
源码分析系列文档目录前言近期使用
Flink
SQL内置函数的时候遇到了点问题,函数的返回结果和想象中的不一致。
AlienPaul
·
2023-12-16 23:23
Java 网络IO理解
常见IO(Input/Output)模型有阻塞IO、非阻塞IO、多路复用IO、
异步IO
同步异步、阻塞非阻塞概念同步异步是应用程序与内核之间的交互而言同步:指用户进程触发IO操作并等待或者轮询去查看IO操作是否就绪异步
adjsnlxx
·
2023-12-16 21:16
flink
部署模式详解
flink
部署模式详解1.local:本地执行适用于本地调试与测试2.standalone:主机部署分为单机集群部署和多机集群部署,只支持session模式单机模式多机模式3.yarn:yarn集群部署支持
龍尐
·
2023-12-16 20:33
flink
大数据
flink
k8s
yarn
部署模式
Apache
Flink
(十三):
Flink
History Server
个人主页:IT贫道_大数据OLAP体系技术栈,ApacheDoris,Clickhouse技术-CSDN博客私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频目录
IT贫道
·
2023-12-16 20:02
大数据计算体系技术栈
Apache
Flink
apache
flink
大数据
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他