sparkStreaming 第4页

Mongo+Spark

通用性：我们可以使用SparkSQL来执行常规分析，SparkStreaming来流数据处理，以及用Mlib来执行机器学习等。Java，python，scala及R语言的支持也是其通用性的表现之一。

亮亮-AC米兰·2023-10-23 14:15

01 在CentOS7当中安装Storm

SparkStreaming属于微批处理，并非真正意义上的实时处理。本节将介绍一个真正意义上的流处理框架Storm，本文将阐述Storm的安装。

张力的程序园·2023-10-23 01:27

Spark Streaming入门

为了初始化SparkStreaming程序，一个StreamingContext对象必需被创建，它是SparkStreaming所有流操作的主要入口。

向阳争渡·2023-10-21 11:09

sparkStreaming入门

1、SparkStreaming简介SparkStreaming是核心SparkAPI的扩展，可实现可扩展、高吞吐量、可容错的实时数据流处理。

panxuej_shenx·2023-10-21 11:39

Spark Streaming入门实验

目录一、准备工作二、任务分析三、官网案例四、开发NetWordCount一、准备工作实验环境：netcat安装nc：yuminstall-ync二、任务分析将nc作为服务器端，用户产生数据；启动sparkstreaming

墨染盛夏呀·2023-10-21 11:03

SparkStreaming入门完整案例

packagecom.zx.daoimportorg.apache.spark.SparkConfimportorg.apache.spark.rdd.RDDimportorg.apache.spark.sql.SparkSessionimportorg.apache.spark.streaming.{Seconds,StreamingContext}importorg.apache.spark.

无恋-zx·2023-10-21 11:31

大数据学习15之spark streaming入门

spark-submit执行2.spark-shell执行（测试时使用）六、工作原理一、概述spark官网Documentation->LatestRelease->ProgrammingGuides->SparkStreamingSpark

米泽玄師·2023-10-21 11:30

大数据Spark Streaming入门

2.3Streaming应用监控3Streaming工作原理3.1创建StreamingContext3.2接收器接收数据3.3汇报接收Block报告3.4Streaming工作原理总述1官方案例运行SparkStreaming

赵广陆·2023-10-21 11:28

SparkStreaming入门

SparkStreaming简介支持的输入源：Kafka,Flume,HDFS等数据输入后，可以用RDD处理数据结果可以保存在很多地方，比如HDFS，数据库等SparkStre

十七✧ᐦ̤·2023-10-21 11:21

Spark第一课

Spark)从数据处理的延迟角度离线:数据处理的延迟是以小时,天为单位准(近)实时:以秒为单位实时:延迟以毫秒为单位,Spark是一个批量数据处理的离线数据分析框架为了适应实时分析的场景,创建新功能模块,SparkStreamingSparkStreaming

叫我莫言鸭·2023-10-21 07:52

Flink学习笔记

Flink的特点：1.高吞吐，高性能，低延迟的流式数据处理Flink不像SparkStreaming那样采取将多个微批处理任务串联起来来构建流式数据处理的任务，这样牺牲了吞吐量，造成了高延迟（因此SparkStreaming

zhglance·2023-10-20 08:12

SparkStreaming如何优雅的停止服务

我们都知道SparkStreaming程序是一个长服务，一旦运转起来不会轻易停掉，那么如果我们想要停掉正在运行的程序应该怎么做呢？

尼小摩·2023-10-20 02:50

Spark问题出错汇总

一.经验1.SparkStreaming包含三种计算模式：nonstate.stateful.window2.kafka可通过配置文件使用自带的zookeeper集群3.Spark一切操作归根结底是对RDD

000X000·2023-10-20 02:41

spark常见问题错误汇总

一.经验1.SparkStreaming包含三种计算模式：nonstate.stateful.window2.kafka可通过配置文件使用自带的zookeeper集群3.Spark一切操作归根结底是对RDD

我丶怀念的·2023-10-20 02:40

搭建Spark所遇过的坑

https://www.cnblogs.com/qifengle-2446/p/6424377.html一.经验1.SparkStreaming包含三种计算模式：nonstate.stateful.window2

富的只剩下代码·2023-10-20 02:37

关于Spark Streaming的时间窗口

SparkStreaming是一个强大的工具，用于处理实时数据流。其中，时间窗口操作是非常重要的一部分。

cong_han·2023-10-19 23:17

关于Spark Streaming的使用

在使用Kafka和SparkStreaming的过程中，需要考虑到复杂的逻辑和数据处理流程。

cong_han·2023-10-19 23:47

三十六、《大数据项目实战之用户行为分析》Spark Streaming整合Kafka计算实时单词数量

整合原理Kafka在0.8和0.10版本之间引入了一个新的消费者API，Spark针对这两个版本有两个单独对应的SparkStreaming包可用，分别为spark-streaming-kafka-0-

大数据张老师·2023-10-19 12:18

SparkStreaming整合Kafka实现wordcount案例（spark-streaming-kafka-0-8_2.11版）

Receiver实现：defmain(args:Array[String]):Unit={//创建配置对象文件valconf:SparkConf=newSparkConf().setAppName("SparkStreaming_Demo04

万家林·2023-10-19 12:47

Spark Streaming 整合 Kafka，实现交流

SparkStreaming整合Kafka一、了解SparkStreaming整合Kafka1.1KafkaUtis.createDstream方式二、实战2.1导入依赖（与spark版本一致）2.2案列

唐樽·2023-10-19 12:17

Spark Streaming整合Kafka的两种方式

SparkStreaming整合Kafka，两种整合方式：Receiver-based和Direct方式一:Kafka准备1、分别启动zookeeper.

kingloneye·2023-10-19 12:46

SparkStreaming 整合 Kafka

SparkStreaming整合Kafka架构概述具体实现步骤安装好ZooKeeper和Kafka和flume启动好ZooKeeper和Kafka创建一个Kafka的Topic############启动

夜古诚·2023-10-19 12:40

Spark分布式计算框架之SparkStreaming+kafka

1、SparkStreaming的介绍SparkStreaming是流式处理框架，是SparkAPI的扩展，支持可扩展、高吞吐量、容错的实时数据流处理，实时数据的来源可以是：Kafka,Flume,Twitter

一流觞·2023-10-19 05:14

《Spark大数据分析》一书的书评和采访

\\t了解SparkCore及加载项库，包括SparkSQL、SparkStreaming、GraphX、Mllib和SparkML。

H_MZ·2023-10-19 05:30

SparkStreaming 如何整合 Kafka

Kafka回顾核心概念图解Broker：安装Kafka服务的机器就是一个brokerimageProducer：消息的生产者，负责将数据写入到broker中(push)Consumer：消息的消费者，负责从kafka中拉取数据(pull)，老版本的消费者需要依赖zk，新版本的不需要Topic:主题，相当于是数据的一个分类，不同topic存放不同业务的数据–主题:区分业务Replication：副本

染墨安然·2023-10-18 14:20

Spark工作原理及基础概念（超详细！）

目录一、Spark概述（1）概述（2）Spark整体架构（3）Spark特性（4）Spark与MR（5）SparkStreaming与Storm（6）SparkSQL与Hive二、Spark基本原理（1

bhegi_seg·2023-10-18 07:21

Spark Streaming——Spark第一代实时计算引擎

虽然SparkStreaming已经停止更新，Spark的重点也放到了StructuredStreaming，但由于Spark版本过低或者其他技术选型问题，可能还是会选择SparkStreaming。

大数据流动·2023-10-17 07:03

2023_Spark_实验二十：SparkStreaming累加计算单词频率

一、需求分析在服务器端不断产生数据的时候，sparkstreaming客户端需要不断统计服务器端产生的相同数据出现的总数，即累计服务器端产生的相同数据的出现的次数。

pblh123·2023-10-16 14:57

2023_Spark_实验十九：SparkStreaming入门案例

SparkStreaming入门案例一、准备工作二、任务分析三、官网案例四、开发NetWordCount一、准备工作实验环境：netcat安装nc：yuminstall-ync二、任务分析将nc作为服务器端

pblh123·2023-10-16 14:22

java spark 消费kafka_spark streaming消费kafka数据写入hdfs避免文件覆盖方案(java版)

1.写在前面在sparkstreaming+kafka对流式数据处理过程中，往往是sparkstreaming消费kafka的数据写入hdfs中，再进行hive映射形成数仓，当然也可以利用sparkSQL

吴羽舒·2023-10-16 11:40

53、Spark Streaming:输入DStream之Kafka数据源实战

receiver从Kafka中获取的数据都是存储在SparkExecutor的内存中的，然后SparkStreaming启动的job会去处理那些数据。

weixin_30830327·2023-10-16 11:40

【Spark Streaming】（二）Spark Streaming - 实时数据采集

和spark-streaming依赖包org.apache.sparkspark-core_2.112.4.5org.apache.sparkspark-streaming_2.112.4.5案例一：SparkStreaming

屡傻不改·2023-10-16 11:06

spark stream入门案例：netcat准实时处理wordCount（scala 编程）

目录案例需求代码结果解析案例需求：使用netcat工具向9999端口不断的发送数据，通过SparkStreaming读取端口数据并统计不同单词出现的次数--1.Spark从socket中获取数据：一行一行的获取

超爱慢·2023-10-16 11:03

spark Spark Streaming、kafka数据源Direct模式、自定义数据源

文章目录前言1.Kafka数据源1.1选型1.2Kafka0-10Direct模式2.自定义数据源前言 SparkStreaming广泛运用于流式数据的处理（准实时、微批次的数据处理框架）。

但行益事莫问前程·2023-10-16 11:33

spark streaming从指定offset处消费Kafka数据

一.前言当sparkstreaming程序意外退出时，数据仍然再往Kafka中推送，然而由于Kafka默认是从latest的offset读取，这会导致数据丢失。

L.ZZ·2023-10-16 11:33

Spark（第七节）SparkStreaming介绍，DStream介绍，SparkStreaming接收socket数据、文件数据、自定义数据源数据、RDD队列数据案例

目录SparkStreaming介绍什么是SparkStreamingSparkStreaming与Storm的对比SparkStreaming原理与架构SparkStreaming原理SparkStreaming

hwq317622817·2023-10-16 11:32

大数据Spark DStream

目录1DStream是什么2DStreamOperations2.1函数概述2.2转换函数：transform2.3输出函数：foreachRDD3流式应用状态1DStream是什么SparkStreaming

赵广陆·2023-10-16 11:30

flink教程

文章目录来自于尚硅谷教程1.Flink概述1.1特点1.2与SparkStreaming对比2.Flink部署2.1集群角色2.2部署模式2.3Standalone运行模式2.3.1本地会话模式部署2.3.2

Cool_Pepsi·2023-10-15 22:33

flume+kafka+sparkstreaming+hbase

文章目录爬虫代码MonitorCatcherpom.xml启动爬虫flume配置文件启动flume命令kafka相关命令Hive建立HBase关联表SparkStreamingSparkStreamTestpom.xml

李南想做条咸鱼·2023-10-15 19:18

Hadoop——第三部份 Hadoop3.x之MapReduce

高扩展动态增加服务器高空错海量计算缺点不擅长实时计算(Mysql)不擅长流式计算(Sparkstreamingflink)不擅长DAG有向无环图计算(迭代)(Spark)二、Hadoop序列化序列化和反序列化将内存中

Cyang6·2023-10-15 12:40

Spark入门

目录Spark入门:概述+历史+概述SparkCore：RDDSparkSQL:SparkStreamingSpark内核调优Spark概述回顾：Hadoop=HDFS存储+MR分析计算+YARN调度Hadoop

十七✧ᐦ̤·2023-10-14 12:21

第五篇|Spark-Streaming编程指南(2)

第四篇|Spark-Streaming编程指南(1)对SparkStreaming执行机制、Transformations与OutputOperations、SparkStreaming数据源(Sources

大数据技术与数仓·2023-10-14 04:36

Flink on K8s 在京东的持续优化实践

在2017年左右，我们实时计算是多个引擎并存的，包括Storm、SparkStreaming以及正在引入的新一代计算引擎Flink，其中St

pucheung·2023-10-14 00:53

SparkStreaming

大纲1.SparkStreaming介绍2.SparkStreaming原理与架构3.DStream介绍4.DStream相关操作5.DStream操作实战6.DStream操作实战7.DStreams

c062197eecd2·2023-10-13 15:30

spark组成

sparkspark=SparkCore+SparkSq1+SparkStreaming+MLlib+GraphxSparkCore：实现了Spark的基本功能，包含任务调度、内存管理、错误恢复、与存储系统交互等模块

白纸糊·2023-10-12 12:35

Spark Streaming

SparkStreamingSparkStreaming一、应用场景二、核心机制三、SparkStreaming的程序执行入口3.1StreamingContext3.2StreamingContext

cai-4·2023-10-12 11:03

大数据面试题：Spark和Flink的区别

面试题来源：《大数据面试题V4.0》大数据面试题V3.0，523道题，679页，46w字可回答：1）SparkStreaming和Flink的区别问过的一些公司：杰创智能科技(2022.11)，阿里蚂蚁

蓦然_·2023-10-12 08:54

大数据笔记--SparkStreaming

目录一、实时计算1、离线和批量、实时和流式Ⅰ、批量计算和流式计算：Ⅱ、批量和流式的区别二、SparkStreaming介绍1、概述2、架构设计二、SparkStreaming基础1、WordCount案例

是小先生·2023-10-12 05:03

【基础篇】一、什么是Flink

文章目录1、Flink是什么2、有界流和无界流3、有状态流处理4、Flink的特点5、Flink对比SparkStreaming6、Flink的应用场景7、Flink的分层API1、Flink是什么ApacheFlink

-代号9527·2023-10-11 12:26

Spark分布式计算框架之SparkStreaming+kafka

1、SparkStreaming的介绍SparkStreaming是流式处理框架，是SparkAPI的扩展，支持可扩展、高吞吐量、容错的实时数据流处理，实时数据的来源可以是：Kafka,Flume,Twitter

embelfe_segge·2023-10-11 04:12

推荐频道

sparkStreaming

Mongo+Spark

01 在CentOS7当中安装Storm

Spark Streaming入门

sparkStreaming入门

Spark Streaming入门实验

SparkStreaming入门完整案例

大数据学习15之spark streaming入门

大数据Spark Streaming入门

SparkStreaming入门

Spark第一课

Flink学习笔记

SparkStreaming如何优雅的停止服务

Spark问题出错汇总

spark常见问题错误 汇总

搭建Spark所遇过的坑

关于Spark Streaming的时间窗口

关于Spark Streaming的使用

三十六、《大数据项目实战之用户行为分析》Spark Streaming整合Kafka计算实时单词数量

SparkStreaming整合Kafka实现wordcount案例（spark-streaming-kafka-0-8_2.11版）

Spark Streaming 整合 Kafka，实现交流

Spark Streaming整合Kafka的两种方式

SparkStreaming 整合 Kafka

Spark分布式计算框架之SparkStreaming+kafka

《Spark大数据分析》一书的书评和采访

SparkStreaming 如何整合 Kafka

Spark工作原理及基础概念（超详细！）

Spark Streaming——Spark第一代实时计算引擎

2023_Spark_实验二十：SparkStreaming累加计算单词频率

2023_Spark_实验十九：SparkStreaming入门案例

java spark 消费kafka_spark streaming消费kafka数据写入hdfs避免文件覆盖方案(java版)

53、Spark Streaming:输入DStream之Kafka数据源实战

【Spark Streaming】（二）Spark Streaming - 实时数据采集

spark stream入门案例：netcat准实时处理wordCount（scala 编程）

spark Spark Streaming、kafka数据源Direct模式、 自定义数据源

spark streaming从指定offset处消费Kafka数据

Spark（第七节）SparkStreaming介绍，DStream介绍，SparkStreaming接收socket数据、文件数据、自定义数据源数据、RDD队列数据案例

大数据Spark DStream

flink教程

flume+kafka+sparkstreaming+hbase

Hadoop——第三部份 Hadoop3.x之MapReduce

Spark入门

第五篇|Spark-Streaming编程指南(2)

Flink on K8s 在京东的持续优化实践

SparkStreaming

spark组成

Spark Streaming

大数据面试题：Spark和Flink的区别

大数据笔记--SparkStreaming

【基础篇】一、什么是Flink

Spark分布式计算框架之SparkStreaming+kafka

spark常见问题错误汇总

spark Spark Streaming、kafka数据源Direct模式、自定义数据源