E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
SparkCore
Hadoop生态架构之Spark Streaming
Spark体系内的流式处理框架(和Storm对比)2、和Storm对比Storm:数据像水流一样,最基本的单位是tuple——毫秒级Streaming:把水状的数据,按照时间进行离散化处理——秒级3、和
SparkCore
勇于自信
·
2019-12-28 07:19
【
SparkCore
】 Spark详细内存管理
目录一、SparkExecutor内存管理一、堆内内存和堆外内存1、堆内内存2、堆外内存二、spark内存分配1、静态内存管理2、统一内存管理三、使用1.只用了堆内内存2.用了堆内和堆外内存一、SparkExecutor内存管理主要对Executor的内存管理进行分析,下文中的Spark内存均特指Executor的内存。一、堆内内存和堆外内存作为一个JVM进程,Executor的内存管理建立在JV
lemon胡
·
2019-12-25 15:00
【
SparkCore
】Spark监控
目录1、SparkUI2、SparkHistoryUI3、RESTAPI工作中需要监控Spark作业的运行情况,发现问题,来进行调优。MonitoringandInstrumentation监控指标:1)Launtime启动时间2)Duration持续时间3)GCTime垃圾收集时间4)ShuffleReadSize/Record等监控Spark应用程序的有三种方式:1)SparkUI2)Spar
lemon胡
·
2019-12-25 14:00
【
SparkCore
】RDD缓存优化、序列化、Spark内存管理、spark内存优化之GC调优、数据本地化
目录一、RD缓存1、cache/persist缓存2、那么StorageLevel存储级别有哪些呢二、内存优化之序列化三、内存优化之Spark内存管理1、StaticMemoryManager管理器2、UnifiedMemoryManager统一内存管理器四、spark内存优化之GC调优五、数据本地化一、RD缓存RDDPersistence1、cache/persist缓存背景:1)对相同的RDD
lemon胡
·
2019-12-25 14:00
Spark Core 概念学习
通过对
sparkcore
的核心概念学习,可以更好的了解spark的运行机制和生命周期基本概念:Application:spark应用程序,一个应用程序由一个driver进程和一些executor进程组成
iiiiiiiioooooo
·
2019-12-25 08:23
Spark Streaming(一):DStream
1、SparkStreaming简介SparkStreaming:Spark提供的,对于大数据进行实时计算的一种框架;它的底层,也是基于
SparkCore
的;其基本的计算模型,还是基于内存的大数据实时计算模型
张凯_9908
·
2019-12-25 07:23
1. Spark概述
SparkCore
:离线计算SparkSQL:交互式查询SparkStreaming:实时流计算SparkMLlib:机器学习SparkGraphX:图计算Sp
泊牧
·
2019-12-24 22:25
通过案例对spark streaming透彻理解三板斧之一
spark的核心是
sparkcore
,sparkstreaming,sparkgraph,sparkmlib其实是构建在
sparkcore
之上的一个应用程序,如果要构建一个强大的spark应用程序,sparkstreaming
阳光男孩spark
·
2019-12-23 01:12
Spark的前世今生
Spark包含了大数据领域常见的各种计算框架:比如
SparkCore
用于离线计算,SparkSQL用于交互式查询,SparkStreaming用于实时流式计算,SparkMLlib用于机器学习,SparkGraphX
义焃
·
2019-12-21 09:06
spark认知
一、Spark体系结构Spark是一种基于内存的开源计算框架,不同于Hadoop的MapReduce和HDFS,Spark主要包括
SparkCore
和在
SparkCore
基础之上建立的应用框架SparkSQL
CodeFarmerChen
·
2019-12-21 07:01
Spark
Sparkcore
一、spark是一个分布式同通用计算框架,可用于离线大数据处理、实时流计算、交互式计算、图计算等,集成了SparkSQL、SparkStream、MLLib等库,提供了丰富的API。
_duangduang
·
2019-12-17 00:11
Spark Core解析 2:Scheduler 调度体系
SparkCore
解析2:Scheduler调度体系Overview调度系统,是贯穿整个Spark应用的主心骨,从调度系统开始入手了解
SparkCore
,比较容易理清头绪。
Liam
·
2019-12-13 00:10
spark
001_spark的前世今生
spark包含了大数据领域常见的各种计算框架:比如
sparkcore
用于离线计算,sparksql用于交互式查询,sparkstreaming用于实时流式计算,sparkMLlib用于机器学习,sparkGraphX
iarchitect
·
2019-12-08 13:03
7.Spark Streaming
SparkStreaming是Spark核心api的一个拓展,可以实现高吞吐量/具备容错机制的实时流数据的处理SparkStreaming与
SparkCore
的关系可以用下面的经典部件图来表述:images
山间浓雾有路灯
·
2019-12-08 07:48
(十四)大数据学习之Scala语言
Scala编程语言1.生态:(1)scala编程语言(2)
SparkCore
:Spark内核,最重要的一个部分。(3)SparkSQL:类似于hive和pig。数据分析引擎。
Movle
·
2019-12-07 20:16
spark大数据架构初学入门基础详解
Spark是什么a)是一种通用的大数据计算框架b)
SparkCore
离线计算SparkSQL交互式查询SparkStreaming实时流式计算SparkMLlib机器学习SparkGraphX图计算c)
13157330443
·
2019-11-27 22:11
spark
大数据
架构
Spark基础解析
可扩展的大数据分析引擎1.2历史2009年诞生于加州大学伯克利分校AMPLab,项目由Scala编写2010年开源2013年6月成为Apache的孵化项目2014年2月成为Apache的顶级项目2.Spark的内置模块
SparkCore
我是星星我会发光i
·
2019-11-19 15:03
Spark
Spark基础解析
spark 2.0 新特性
SparkCore
&SparkSQLdataframe与dataset统一,dataframe只是dataset[Row]的类型别名,移除dataframe类。
Cherish_Qiang
·
2019-11-08 18:10
大数据学习路线(完整详细版)
Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,mahout)Storm(Storm,kafka,redis)Spark(scala,spark,
sparkcore
花半唐
·
2019-11-03 03:15
SparkCore
基础(一)
*
SparkCore
基础(一)学习Spark,首先要熟悉Scala,当然你说你会Python或者Java能不能玩Spark?能!
Z尽际
·
2019-11-01 06:23
Spark Core 解析:RDD
引言
SparkCore
是Spark的核心部分,是SparkSQL,SparkStreaming,SparkMLlib等等其他模块的基础,
SparkCore
提供了开发分布式应用的脚手架,使得其他模块或应用的开发者不必关心复杂的分布式计算如何实现
Liam
·
2019-10-30 05:25
spark
Spark学习笔记(一)
2.易用:支持多种语言3.通用:
SparkCore
、SparkSQL、SparkStreaming(流式计算)4.兼容性好:完全兼容HadoopSpar
Jayboy.chen
·
2019-10-19 09:56
大数据
Spark SQL数据倾斜解决方案
之前在
SparkCore
中的数据倾斜的七种解决方案,全部都可以直接套用在SparkSQL上。
studyhardatEnglish
·
2019-10-14 17:35
spark
SparkCore
运行架构
从经典的WordCount来看
SparkCore
运行架构术语:相关术语含义Application基于Spark进行构建的用户程序。
冬瓜螺旋雪碧
·
2019-10-10 10:28
Spark
Spark中Standalone、Yarn和Mesos三种模式的对比
SparkonStandalone:Standalone是
SparkCore
自带的集群资源管理框架,类似于MRV1.0采用的模式(JobTracker),内部实现了容错性和资源管理。
霈行千里
·
2019-09-27 12:44
大数据
Hadoop
[Spark 学习]-- 初级规划
1.1.4参考1.1.5小结1.2
Sparkcore
【点击链接】1.2.1spark技术栈1.2.2spark是怎样工作的1.2.3RDD是什么?有哪些特点?RDD在哪里?
highfei2011
·
2019-09-12 17:53
Spark
Structured Streaming 和 Spark streaming的区别
我先简单的说一下Sparkstreaming,然后在想对比的说一下StructuredStreamingSparkstreaming的概述SparkStreaming是一个基于
SparkCore
之上的实时计算框架
MannerXu
·
2019-09-09 20:34
Spark
spark笔记之Spark Streaming原理
这里的批处理引擎是
SparkCore
,也就是把SparkStreaming的输入数据按照
qq5d3e5bae55f08
·
2019-09-03 14:30
spark笔记之Spark
Strea
Spark
Streaming原理
SparkStreaming简单介绍;SparkStreaming处理数据流程;SparkStreaming运行工作原理与简单优化
SparkStreaming简单介绍流式数据处理(streamprocessing)要处理的数据就像流水一样,源源不断的产生数据,需要实时进行处理对
SparkCore
的高级API的封装,将流式的数据切分为小的批次
无名一小卒
·
2019-08-10 21:25
Spark
Spark项目实战学习电商项目
该项目源码中是用Java开发的,分析计算多用的是
sparkcore
,我在实践这个项目的时候,spark2.x已有了,性能应该比1有提升,所以关于spark部分我基本用的都是SparkSql,并且用scala
maozicb
·
2019-08-09 08:32
分布式计算系统三巨头--Hadoop、Storm、Spark的区别和比较
Spark包括
sparkcore
,sparksql,sparkstreaming,
sparkcore
可以用来
暁洣
·
2019-08-07 11:03
大数据学习
大数据
Hadoop
storm
spark
spark 源码分析之十五 -- Spark内存管理剖析
整体介绍Spark内存管理相关类都在
sparkcore
模块的org.apache.spark.memory包下。文档对这个包的解释和说明如下:Thi
匠心源码
·
2019-07-17 19:00
Spark Core源码精读计划#23:与存储相关的内存池及内存管理器的具体实现
StorageMemoryPool构造与属性成员申请内存释放内存内存管理器MemoryManager构造与属性成员内存管理方法总结前言我们用两篇文章的时间搞清楚了Spark存储中的“块”到底是怎么一回事,接下来我们就可以放心来看
SparkCore
LittleMagic
·
2019-07-06 18:04
Spark中SparkSQL的基础用法
SparkSQL中的DataFrame本质上还是一个RDD但是DataFrame本质上又是一个DataSet,SparkSQL的中心是一个
SparkCore
,SparkCorez中RDD是核心。
木楚
·
2019-06-26 23:12
大数据
Mapreduce和Spark的对比
MR和Spark的对比针对这两款计算框架从下边几个方面进行对比1.通用性1.1Spark一栈式,主要说的是,Spark不仅仅可以进行离线计算(
SparkCore
),同时还可以进行流式处理(SparkStreaming
大数据容器
·
2019-06-25 21:48
Hadoop
spark
Spark Streaming 架构原理分析
DStreamGraph组件4、JobGenerator组件5、JobScheduler组件1、StreamingContextstreamingContext是sparksteaming程序入口,类似
sparkcore
tamir_2017
·
2019-06-23 22:20
spark
spark笔记 环境配置
spark笔记spark简介saprk有六个核心组件:
SparkCore
、SparkSQL、SparkStreaming、StructedStreaming、MLlib,GraphxSparkCore相当于
九转星辰
·
2019-06-23 17:00
Spark 基础操作
1.Spark基础2.
SparkCore
3.SparkSQL4.SparkStreaming5.Spark内核机制6.Spark性能调优1.Spark基础1.1Spark中的相应组件1.2Standalone
思考与践行
·
2019-06-22 23:00
Spark应用开发(上)
),95%的大数据架构都是主从式hadoop-yarn:Yarn:主节点:resourcemanager管理整个集群的资源从节点:nodemanager管理每个服务器的资源sparkcontext就是
sparkcore
SkinnyTracy
·
2019-06-21 00:00
spark
大数据
大数据 Spark 架构,Spark企业级大数据项目实战视频,项目集成Hadoop教程,Spark
26套Spark企业级项目实战,源码深度剖析,实时流处理,机器学习,数据分析,运行原理,性能调优,图计算,性能调优,缓存优化,监控分析
SparkCore
,SparkSQL,SparkStreaming,
wx5d089cc7a67a3
·
2019-06-19 16:29
大数据
spark
架构
大数据 Spark 架构,Spark企业级大数据项目实战视频,项目集成Hadoop教程,Spark
26套Spark企业级项目实战,源码深度剖析,实时流处理,机器学习,数据分析,运行原理,性能调优,图计算,性能调优,缓存优化,监控分析
SparkCore
,SparkSQL,SparkStreaming,
wx5d089cc7a67a3
·
2019-06-19 16:26
大数据
spark
架构
Spark学习笔记(4)Spark2全面深度剖析--知识点视频,源码,调优,JVM,图计算,项目实战
26套Spark企业级项目实战,源码深度剖析,实时流处理,机器学习,数据分析,运行原理,性能调优,图计算,性能调优,缓存优化,监控分析
SparkCore
,SparkSQL,SparkStreaming,
wx5d089cc7a67a3
·
2019-06-19 16:38
spark
源码
调优
Spark 入门实战之最好的实例视频,Spark从入门到上手实战教程
26套Spark企业级项目实战,源码深度剖析,实时流处理,机器学习,数据分析,运行原理,性能调优,图计算,性能调优,缓存优化,监控分析
SparkCore
,SparkSQL,SparkStreaming,
wx5d089cc7a67a3
·
2019-06-19 16:44
spark
入门
实战
Spark 基本架构及原理,Spark核心解密源码剖析,调度流程源码剖析视频教程下载,算子优化
26套Spark企业级项目实战,源码深度剖析,实时流处理,机器学习,数据分析,运行原理,性能调优,图计算,性能调优,缓存优化,监控分析
SparkCore
,SparkSQL,SparkStreaming,
wx5d089cc7a67a3
·
2019-06-19 16:58
spark
原理
架构
Spark学习笔记
SparkCore
1.1RDD概念:ThemainabstractionSparkprovidesisaresilientdistributeddataset(RDD),whichisacollectionofelementspartitionedacrossthenodesoftheclusterthatcanbeoperatedoninparallel.RDD
killianxu
·
2019-06-15 09:00
Spark学习笔记Spark Streaming的使用
1.SparkStreamingSparkStreaming是一个基于
SparkCore
之上的实时计算框架,可以从很多数据源消费数据并对数据进行处理SparkStreaing中有一个最基本的抽象叫DStream
EVAO_大个子
·
2019-06-14 09:55
大数据系列——Spark学习笔记Spark Streaming
1.SparkStreamingSparkStreaming是一个基于
SparkCore
之上的实时计算框架,可以从很多数据源消费数据并对数据进行处理SparkStreaing中有一个最基本的抽象叫DStream
EVAO_大个子
·
2019-06-14 00:00
spark-streaming
Spark之SQL高级知识分享二(DataSource+Tuling+CustomDataSource)
1.DataSource1.1传统的ETL数据操作弊端如上图,传统的方式如MR、Hive、
Sparkcore
方式进行数据ETL操作有如下弊端:弊端一:若涉及数据格式的转换,则代码或sql相关的逻辑就得重写
qq_32641659
·
2019-05-26 12:02
Spark
sparkcore
进行wordcount词频统计
准备一份数据/home/admin/data/helloworld.txthelloworldhellohelloworldwelcomescala>valwc=sc.textFile("file:///home/admin/data/helloworld.txt")scala>wc.flatMap(x=>x.split("\t")).map(x=>(x,1)).reduceByKey(_+_).
大数据修行
·
2019-05-20 16:13
Spark SQL 编译原理
正如大家了解的一样,SparkSQL它其实是一个SQL的编译器,跟普通数据库不同的是它的底层使用的HDFS存储,使用
SparkCore
进行计算。
Sammion
·
2019-05-19 18:36
学习笔记
Hadoop生态圈学习
Hive学习
SparkSQL
源码阅读笔记
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他