E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
sparkstreaming
SparkStreaming
----复习
一、
SparkStreaming
概述数据处理类型分类静态数据数据源是不变的、有限的、显式离散的多适用于批量计算、离线计算流数据数据是变动的、无限的、连续的多适用于实时计算,能在秒级、秒内处理完成实时数据分类
Object o1
·
2022-12-07 11:12
SparkStreaming
基础理论
一、
SparkStreaming
的介绍(1)为什么要有
SparkStreaming
?
weixin_33815613
·
2022-12-07 11:41
大数据
数据库
网络
spark大数据处理技术读书笔记:spark streaming学习笔记
第十章:
sparkstreaming
流数据处理框架一。
sparkstreaming
程序的几个步骤1.创建StreamingContext。
CodingBoy121
·
2022-12-07 11:11
spark
spark streaning--批处理间隔 滑动间隔 窗口间隔
sparkstreaming
会将一个批处理时间间隔收集到的数据汇总起来作为一批数据让系统来处理。
韩运畅
·
2022-12-07 11:40
#
Spark
Streaming
SparkStream
SparkStreaming
的核心思路:把无边界的数据流抽象成DStream,在时间方向上,按照某个指定的时间间隔,把DStream切割成一个离散的RDD的序列,然后每一个都交给spark执行引擎进行处理
docsz
·
2022-12-07 11:39
spark
spark
大数据分析技术与实战之Spark Streaming
SparkStreaming
是Spark上
chisuijie5678
·
2022-12-07 11:38
开发工具
scala
java
Spark Streaming 学习笔记
SparkStreaming
用来干什么:许多应用需要即时处理收到的数据,例如用来实时追踪页面访问统计的应用、训练机器学习模型的应用,还有自动检测异常的应用。
惹不起的程咬金
·
2022-12-07 11:37
云计算/大数据/并行计算
Spark大数据分析与实战课后答案
Spark大数据分析与实战课后答案(填空判断选择仅供参考)Scala语言基础Spark基础SparkRDD弹性分布式数据集Spark大数据分析与实战HBase分布式数据库Kafka分布式发布订阅消息系统
SparkStreaming
不太聪明的学渣
·
2022-12-07 11:05
Spark
spark
数据分析
scala
大数据
大数据编程实验四:
SparkStreaming
编程
大数据编程实验四:
SparkStreaming
编程文章目录大数据编程实验四:
SparkStreaming
编程一、实验目的与要求二、实验内容三、实验步骤1、利用
SparkStreaming
对不同类型数据源的数据进行处理
-北天-
·
2022-12-07 07:45
大数据
大数据
spark
分布式
【备忘】《图解Spark 核心技术与案例实战》PDF
Spark及其生态圈概述1.1Spark简介1.1.1什么是Spark1.1.2Spark与MapReduce比较1.1.3Spark的演进路线图1.2Spark生态系统1.2.1SparkCore1.2.2
SparkStreaming
1
qq_38472089
·
2022-12-06 02:46
Spark
MLlib
Spark
Streaming
flink 面试题-1
Flink面试题1.简单介绍一下Flink2.
sparkstreaming
与flink对比1.1架构模型1.2运行模型1.3容错机制1.4时间机制1.5任务调度原理3.Flink集群有哪些角色?
大数据学习爱好者
·
2022-11-29 15:29
Flink
开发
flink
Flink高频面试题( 精简 )
目录前言一、
SparkStreaming
和Flink的区别是什么?二、Flink的编程模型?三、Flink中集群有哪些角色?各个角色有什么作用?
HaoRan.
·
2022-11-29 15:20
Flink
flink
java
大数据
大数据分析师题库(一)
A:
SparkStreaming
B:SparkCoreC:GraphxD:SparkSQL正确答案:ABCD答案解析:Spark的设计遵循“一个软件栈满足不同应用场
IMMOMMOI
·
2022-11-29 15:10
大数据
Spark快速入门
文章目录前言一、Spark概述1.1Spark是什么1.2Spark和Hadoop1.3Spark和MR二、Spark核心模块1.SparkCore2.SparkSQL3.
SparkStreaming
4
易逑实战数据
·
2022-11-29 11:41
大数据
spark
big
data
hadoop
电梯实时智能监测与诊断:应用人工智能的案例研究和解决方案
然后,为了选择最佳的大数据处理工具,比较了Flink和
SparkStreaming
的性能。结果表明,Flin
Handsome_Zpp
·
2022-11-23 20:42
文献翻译PHM
运维
flink常见面试题(持续更新中)
1.阐述Flink如何处理反压,相比Storm,
SparkStreaming
提供的反压机制,描述其实现有什么不同?
你好,我叫罗鹏程
·
2022-11-22 14:42
flink
大数据
flink
Spark Streaming Quick Start
SparkStreaming
的基本数据结构是DRDD(discretizedstream),DRDD和RDD类似,但是引入了时间的概念。
東方海竹
·
2022-11-22 08:53
Spark
spark
streaming
大数据
实时
大数据技术栈
:mysql,oracle,pg,etc…OLAP:Kylin,clickhouse,presto,impala,TD,Greenplum离线计算:hive,Hbase,spark流计算:storm,
sparkstreaming
辉常努腻
·
2022-11-20 04:32
大数据
大数据
Spark的一些问题汇总 及 Yarn与Spark架构的对比
核心SparkCore、SQL计算(SparkSQL)、流计算(
SparkStreaming
)、图计算(Graphx)、机器学习(MLlib)3、Spark有哪些特点?
木易巷
·
2022-11-06 22:49
Spark
spark
大数据
分布式
三十五、《大数据项目实战之用户行为分析》Spark Streaming按批次累加单词数量
本例使用
SparkStreaming
实现一个完整的按批次累加的实时单词计数程序。
大数据张老师
·
2022-10-30 07:23
#
spark
大数据
scala
SparkStreaming
[Spark、hadoop]spark Streaming的核心DStream
目录
SparkStreaming
的核心是DStream一、DStream简介二.DStream编程模型三.DStream转换操作
SparkStreaming
的核心是DStream一、DStream简介1
发量不足
·
2022-10-18 07:30
IDEA
hadoop
spark
java
kafka
开发语言
hadoop
[Spark、hadoop]DStream的窗口操作、输出操作、实例——实现网站热词排序
目录DStream窗口操作DStream输出操作DStream实例——实现网站热词排序DStream的概述Dstream(DiscretizedStream)是
SparkStreaming
数据的基本传输单位
发量不足
·
2022-10-18 07:30
spark
IDEA
hadoop
spark
hadoop
scala
大数据组件之Flink简介
这和
SparkStreaming
的思想是完全相反的,
SparkStreaming
的核心是批处理,它将流处理看成是批处理的一种特殊情况,即把数据流进行极小粒度的拆分,拆分为多个
努力的小星星
·
2022-10-04 14:29
大数据
1.Spark 基础解析之概述及集群安装
spark.apache.orgSpark是一种快速、通用、可扩展的大数据分析引擎,2014年2月成为Apache顶级项目,由Scala语言编写目前,Spark生态系统已经发展成为一个包含多个子项目的集合,其中包含SparkSQL、
SparkStreaming
harveybd
·
2022-09-24 00:46
Spark
Spark
sparkStreaming
报错Failed to send RPC 6254780973500208805 to /10.11.10.10:48838: java.nio.channels.Clos
sparkStreaming
报错FailedtosendRPC6254780973500208805to/10.11.10.10:48838:java.nio.channels.ClosedChannelException21
xiaoxiao______
·
2022-09-23 21:02
worker
Apache Flink 简介
实时计算也被称作流计算,代表是Storm、
SparkStreaming
、Flink等大数据技术。
小波同学
·
2022-09-12 23:52
大数据系列(未完,待续)
SparkContext原理解析SparkRDD、DataFrame原理及操作详解SparkOnYarn的两种模式yarn-cluster和yarn-client深度剖析Spark广播变量BroadCast
SparkStreaming
weixin_30425949
·
2022-09-09 09:25
大数据
netty
数据库
深度解读!新一代大数据引擎Flink厉害在哪?(附实现原理细节)
导语|大数据计算分为离线计算和实时计算,其中离线计算就是我们通常说的批计算,代表技术是HadoopMapReduce、Hive等;实时计算也被称作流计算,代表技术是Storm、
SparkStreaming
架构师小秘圈
·
2022-09-08 10:56
(2)
sparkstreaming
滚动窗口和滑动窗口演示
在
sparkstreaming
中,滚动窗口需要设置窗口大小和滑动间隔,窗口大小和滑动间隔都是StreamingContext的间隔时
·
2022-09-05 16:12
推荐系统学习笔记目录
根据b站视频推荐系统算法基础+综合项目实战(大牛老师主讲)整理的学习笔记推荐系统学习笔记目录推荐系统介绍推荐算法HadoopHive&HBaseSparkcoreSparkSQL&
Sparkstreaming
贪钱算法还我头发
·
2022-09-01 07:05
AI
#
Recommendation
System
hive
spark
hadoop
(1)
sparkstreaming
结合sparksql读取socket实时数据流
SparkStreaming
是构建在SparkCore的RDD基础之上的,与此同时
SparkStreaming
引入了一个新的概念:DStream(DiscretizedStream,离散化数据流),表示连续不断的数据流
·
2022-08-31 13:46
Spark Streaming 快速入门系列(一)一文带你了解Spark Streaming
文章目录
SparkStreaming
介绍
SparkStreaming
入门
SparkStreaming
原理
SparkStreaming
操作
SparkStreaming
介绍导读1,流式计算的场景2,流式计算框架
Alienware^
·
2022-08-24 15:49
#
Spark
大数据
spark
Spark Streaming基础概述
文章目录第一章
SparkStreaming
引入
SparkStreaming
介绍实时计算所处的位置第二章
SparkStreaming
原理
SparkStreaming
原理整体流程数据抽象DStream相关操作
九月木樨
·
2022-08-24 15:38
Spark
大数据全家桶
Spark基础知识
1.1Spark基础Spark相对于Hadoop的优势Hadoop和Spark的统一部署1.2Spark核心模块第2章Spark快速上手2.1Spark三种部署方式local模式Standalone模式Yarn模式
SparkStreaming
果子哥丶
·
2022-08-24 15:36
#
Spark
spark
big
data
Spark Streaming(一)
SparkStreaming
(一)导读介绍入门原理操作TableofContents1.
SparkStreaming
介绍2.
SparkStreaming
入门2.原理3.操作1.
SparkStreaming
威风少侠
·
2022-08-24 14:57
大数据
大数据
spark
sparkStreaming
MongoDB + Spark: 完整的大数据解决方案
通用性:我们可以使用SparkSQL来执行常规分析,
SparkStreaming
来流数据处理,以及用Mlib来执行机器学习等。Java,python,scala及R语言的支持
无精疯
·
2022-08-22 23:54
大数据
编程语言
hadoop
数据库
spark
Spark Streaming中流式计算的困境与解决之道
Sparkstreaming
在各种流程处理框架生态中占着举足轻重的位置,但是不可避免地也会面对网络波动带来的数据延迟的问题,所以必须要进行增量数据的累加。
数大招疯
·
2022-08-21 09:27
让Spark-Streaming在Yarn上长时间运行
对于长时间运行的
SparkStreaming
作业,一旦提交到YARN群集便需要永久运行,直到有意停止。任何中断都会引起严重的处理延迟,并可能导致数据丢失或重复。
数大招疯
·
2022-08-21 09:21
Spark Scala版本 | 选择题汇总
个题)第2章Scala语言基础(20个题)第3章Spark的设计与运行原理(10个题)第4章Spark环境搭建和使用方法(10个题)第5章RDD编程(10个题)第6章SparkSQL(10个题)第7章
SparkStreaming
程序喵 尤Ni
·
2022-08-19 14:15
#
大数据应用技术
spark
scala
big
data
Flink概述
Flink概述一、Flink是什么二、为什么要用Flink三、流处理的演变发展四、Flink的主要特点五、Flinkvs
SparkStreaming
一、Flink是什么Flink起源于Stratosphere
若兰幽竹
·
2022-08-02 09:02
Flink
flink
数据湖:流计算处理框架Flink概述
实时计算也被称作流计算,代表是Storm、
SparkStreaming
、Flink等大数据技术。
YoungerChina
·
2022-08-02 09:29
数据湖
flink
大数据
数据湖
流批一体计算
SparkStreaming
-----
SparkStreaming
教程
概要Spark流是对于Spark核心API的拓展,从而支持对于实时数据流的可拓展,高吞吐量和容错性流处理。数据可以由多个源取得,例如:Kafka,Flume,Twitter,ZeroMQ,Kinesis或者TCP接口,同时可以使用由如map,reduce,join和window这样的高层接口描述的复杂算法进行处理。最终,处理过的数据可以被推送到文件系统,数据库和HDFS。image.png在内部,
rong_code
·
2022-07-16 15:01
Spark
Kafka集成
SparkStreaming
SparkStreaming
+Kafka集成指南Kafka项目在版本0.8和0.10之间引入了一个新的消费者API,因此有两个独立的相应
SparkStreaming
包可用。
weixin_42073629
·
2022-07-16 15:00
消息队列
Kafka
Spark
Spark Streaming与流处理
SparkStreaming
与流处理一、流处理1.1静态数据处理在流处理之前,数据通常存储在数据库,文件系统或其他形式的存储系统中。应用程序根据需要查询数据或计算数据。这就是传统的静态数据处理架构。
Keven He
·
2022-07-16 15:00
#
Spark
spark
big
data
scala
大数据
hadoop
sparkstreaming
实时接收rabbitmq的数据(包含scala以及pyspark版本)
目录背景1:scala版本2:pyspark版本注意:以下都是采坑点RabbitMQ启用MQTT功能背景平常我们会实时监听kafka的数据,并且与流处理框架比如
sparkstreaming
和flink进行连接进行消费处理
只会写demo的程序猿
·
2022-07-16 15:58
rabbitmq
sparkstreaming
pyspark
rabbitmq
大数据
Spark总结(SparkCore,SparkSQL,
SparkStreaming
)
SparkCore1.一句话介绍Hadoop和Sparkspark是基于内存的分布式计算框架。hadoop是一个分布式计算开源框架,包含分布式文件系统HDFS、MapReduce分布式计算的软件架构和Yarn资源管理调度系统。2.Spark和MR的区别1.MR是基于磁盘迭代处理数据,Spark是基于内存处理数据2.Spark有DAG有向无环图做优化3.MR是细粒度资源申请,application执
ambitfly
·
2022-07-16 15:58
大数据
大数据
spark
hadoop
java
数据仓库
实时分析:Flume+Kafka+
SparkStreaming
商品评分排行榜
本文主要介绍用流计算
SparkStreaming
对数据进行实时处理。
与李
·
2022-07-16 15:58
大数据
flume
kafka
spark
websocket
大数据
Spark3.x入门到精通-阶段五(
SparkStreaming
详解原理&java&scala双语实战)
SparkStreaming
简介
SparkStreaming
是Spark的一个子模块,用于快速构建可扩展,高吞吐量,高容错的流处理程序。
顶尖高手养成计划
·
2022-07-16 15:26
spark
spark
scala
大数据
实时数据仓库-从0到1实时数据仓库设计&实现(
SparkStreaming
3.x)
简介从数据库的设计,到前端,后端,实时数据仓库一套打通实时数据仓库设计与实现,这个项目的特点就是,麻雀虽小,五脏俱全,一般的实时数据仓库复制粘贴里面的代码就能够实现功能。数据流程图需求利用学生的好强心理,促进学生的好学的习惯,设计这一套全国各地区毕业学生成绩贡献总分数统计,最后按各地区学生所得总分排名(学生提交每一课最优的成绩)代码前期web应用开发springboot,mybatis-plus,
顶尖高手养成计划
·
2022-07-16 15:54
实时数据仓库
数据仓库
数据库
关于 Flink 状态与容错机制
就从我自身的视角看,最近也是在数据团队把一些原本由Flume、
SparkStreaming
、Storm编写的流式作业往Flink迁移,它们之间的优劣对比本篇暂不讨论。近期会总结一些F
Single_Yam
·
2022-07-13 13:00
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他