E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
---SparkCore
15-
SparkCore
02
Applicationadriverprogram+executorsSparkContext=applicationspark-shell?applicationgatewayapplication1:1driver+10executorsapplication2:1driver+10executorsshareapplication==>njobs==>nstages==>ntaskspart
CrUelAnGElPG
·
2023-07-17 13:44
Spark入门(一篇就够了)
1.1Spark为何物1.2SparkVSHadoop1.3Spark优势及特点1.3.1优秀的数据模型和丰富计算抽象1.3.2完善的生态圈-fullstack1.3.3spark的特点1.4Spark运行模式2.
SparkCore
2.1RDD
杨林伟
·
2023-07-15 06:51
#
Hadoop生态圈
spark
实时计算
大数据
Spark集群架构和核心组件介绍
集群架构执行过程:3.3集群核心组件:3.3.1Driver:3.3.2Executor:3.3.3Master&Worker:3.3.4ApplicationMaster:四.Spark核心组件:4.1
SparkCore
4.2SparkSQL4.3SparkStreaming4.4SparkMLlib4
难以言喻wyy
·
2023-06-22 01:31
spark
大数据
hadoop
架构
Spark Core源码精读计划#12:Spark序列化及压缩机制浅析
本来它并不在这个系列的计划内(因为没有什么比较难的点),但是最近斟酌了一下,序列化和反序列化确实是渗透在
SparkCore
的
LittleMagic
·
2023-06-21 01:12
Flink 学习十 FlinkSQL
Flink学习十FlinkSQL1.FlinkSQL基础概念flinksql基于flinkcore,使用sql语义方便快捷的进行结构化数据处理的上层库;类似理解sparksql和
sparkcore
,hive
C0oOder
·
2023-06-21 00:51
大数据之路
flink
学习
数据库
Spark 1--3章简介,架构体系, 环境搭建
今天开始了新的课程由我们的星哥带领我们踏入Spark的神秘殿堂01_
SparkCore
1.Spark简介1.1什么是SparkSpark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校
All996
·
2023-06-20 10:15
spark
hadoop
大数据
【Apache Spark】
文章目录ApacheSpark的安装与配置ApacheSpark用法ApacheSpark的组件1.
SparkCore
2.SparkSQL3.SparkStreaming4.MLib5.GraphX6.
我是廖志伟
·
2023-06-19 16:58
#
Apache
Spark
spark
apache
大数据
【Spark手机流量日志处理】使用SparkSQL按月统计流量使用量最多的用户
作者:“大数据小禅”文章简介:本篇文章属于Spark系列文章,专栏将会记录从spark基础到进阶的内容内容涉及到Spark的入门集群搭建,核心组件,RDD,算子的使用,底层原理,
SparkCore
,SparkSQL
大数据小禅
·
2023-06-19 05:44
Spark
spark
大数据
hive
spark-streaming笔记
SparkStreaming笔记框架的类型:1.离线批处理:mapreduce、hive、
SparkCore
、Sparksql=》mapreducespark2.SQL的交互式查询:hive、SparkSQL3
最美不过你回眸
·
2023-06-18 23:34
老师笔记
Spark 环境搭建 阿善没用
环境搭建3.掌握Spark入门案例-WordCount4.完成将Spark任务提交到Yarn1.课程说明1.1课程安排整个Spark框架课程分为如下9个部分,如下图所示:第1章:Spark环境搭建第2章:
SparkCore
okbin1991
·
2023-06-18 23:03
spark
大数据
hadoop
hive
scala
尚硅谷大数据技术Spark教程-笔记08【SparkSQL(介绍、特点、数据模型、核心编程、案例实操、总结)】
尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】视频地址:尚硅谷大数据Spark教程从入门到精通_哔哩哔哩_bilibili尚硅谷大数据技术Spark教程-笔记01【
SparkCore
(概述
upward337
·
2023-06-17 07:12
#
Spark
大数据
spark
sparkSQL
sql
DataFrame
spark面试题总结(大数据面试)
1、核心组件
SparkCore
:核心部分包含Spark基本功能(任务调度内存管理容错机制等)SparkSQL:Spark中交互式处理模块Spa
404个问号
·
2023-06-16 22:43
大数据
大数据
java
spark
Spark高频面试题(建议收藏)
它内部的组成模块,包含
SparkCore
,SparkSQL,SparkStreaming,SparkMLlib,SparkGraghx等...它的特点:快Spark计算速度是MapReduce计算速度的
无精疯
·
2023-06-16 22:12
spark
面试
java
大数据
hadoop
Sparkcore
----三层架构模型
一、建立application、controller、service和dao文件。二、各文件的代码application代码:importcom.lzl.bigdata.spark.core.framework.controller.WordCountControllerimportorg.apache.spark.{SparkConf,SparkContext}objectWordCountAp
梦痕长情
·
2023-06-16 06:44
spark
6.2.1 Spark Core(Spark概述、RDD编程【特点、RDD创建、Transformation(常见算子)、Key-ValueRDD操作】)
SparkCore
文章目录
SparkCore
第1节Spark概述1.1什么是Spark1.2Spark与Hadoop1.3系统架构1.4Spark集群部署模式1.5相关术语第3节RDD编程3.1什么是RDD3.2RDD
weixin_47134119
·
2023-06-16 02:46
spark
Spark入门
1.1Spark为何物1.2SparkVSHadoop1.3Spark优势及特点1.3.1优秀的数据模型和丰富计算抽象1.3.2完善的生态圈-fullstack1.3.3spark的特点1.4Spark运行模式2.
SparkCore
2.1RDD
猫腻余腥
·
2023-06-14 18:16
BigData_Study
spark
大数据
分布式
尚硅谷大数据技术Spark教程-笔记09【SparkStreaming(概念、入门、DStream入门、案例实操、总结)】
尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】视频地址:尚硅谷大数据Spark教程从入门到精通_哔哩哔哩_bilibili尚硅谷大数据技术Spark教程-笔记01【
SparkCore
(概述
upward337
·
2023-06-14 14:07
大数据
大数据
spark
SparkStreaming
Dstream
案例实操
Spark大数据处理学习笔记2.1 初识Spark
文章目录一、学习目标二、spark概述(一)Spark的组件1、
SparkCore
2、SparkSQL3、SparkStreaming4、MLlib5、GraphX6、独立调度器、Yarn、Mesos(
人生苦短@我用python
·
2023-06-14 06:03
Spark大数据处理
spark
学习
笔记
sparkcore
分区_Spark Core 学习笔记
何炜杰评审人:韩晶晶徐江河1、Spark简介Spark是一种用于大规模数据处理的统一计算引擎。它是加州大学伯克利分校AMP实验室所开发,后又成为Apache顶级项目。围绕着Spark还推出了SparkSQL、SparkStreaming、MLlib和GraphX等组件。Spark使用Scala语言实现,它是一种面向对象的函数式编程语言,能够像操作本地集合对象一样轻松地操作分布式数据集。2、Spar
晋成公
·
2023-06-12 23:12
sparkcore分区
SparkCore
学习笔记
文章预览:一.RDD概述1.1什么是RDD1.2RDD特点1.3RDD五大特性RDD编程2.1RDD的创建2.2Transformation转换算子2.2.1Value类型2.2.2双Value类型交互2.2.3Key-Value类型2.3Action行动算子RDD序列化RDD依赖关系RDD持久化数据读取与保存累加器4.1系统累加器4.2自定义累加器广播变量一.RDD概述1.1什么是RDDRDD(
十二同学啊
·
2023-06-12 23:38
Spark
大数据
spark
每周一书《Spark与Hadoop大数据分析》分享!
Hadoop大数据分析比较系统地讲解了利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法,既涵盖ApacheSpark和Hadoop的基础知识,又深入探讨所有Spark组件——
SparkCore
BAO7988
·
2023-06-12 23:37
大数据
大数据
大数据分析
大数据开发
大数据学习
spark
《Spark篇》------ Spark基础
目录一、Spark简介1.1、Spark是什么1.2、Spark的特点1.3、Spark生态系统1.4、
SparkCore
的组件1.5、Spark的安装流程1.5.1、基础环境,安装Linux系统、Java
清忖灬
·
2023-06-12 14:37
大数据
spark
大数据
hadoop
spark运行原理
Spark基本工作流程及YARNcluster模式原理5、Spark学习笔记1:Application,Driver,Job,Task,Stage理解6、Spark学习之路(三)Spark之RDD7、
SparkCore
潮生明月
·
2023-06-09 10:19
spark
spark
Spark笔记
DBeaver数据库连接器Download|DBeaverCommunityshell命令bin/spark-submit–classcn.edu.ncut.
sparkcore
.wordcount.Test03
最好的文酱
·
2023-06-09 03:26
scala
开发语言
大数据
Spark-Core[持久化 血缘关系 广播变量 累加器 宽窄依赖]
SparkCore
一、RDD数据1.RDD的血缘关系2.RDD序列化3.RDD持久化CheckPoin检查点缓存Cache缓存和CheckPoin检查点的区别二、广播变量三、累加器1.系统自带累加器;2
Aimyon_36
·
2023-06-09 03:17
Spark
spark
hadoop
大数据
Spark简介和三种部署方式
BothfasttorunandfasttowrtieSpark是专为大规模数据处理而设计的快速通用的计算引擎Spark可以完成各种运算,包括SQL查询、文本处理、机器学习等Spark由Scala语言开发,能够和Scala紧密结合1.2Spark组件
SparkCore
不会编程的小小怪
·
2023-06-08 05:38
Spark
spark
scala
大数据
60、Spark1.5.1
Spark1.4.x的新特性
SparkCore
1.1.提供RESTAPI供外界开发者获取Spark内部的各种信息(jobs/stages/tasks/storageinfo),基于这些API,可以搭建自己的
ZFH__ZJ
·
2023-04-19 20:22
(十五)大数据学习之Spark
Spark一.Spark生态圈:(1)
SparkCore
:RDD(弹性分布式数据集)(2)SparkSQL(3)SparkStreaming(4)SparkMLLib:协同过滤,ALS,逻辑回归等等--
Movle
·
2023-04-16 11:10
尚硅谷大数据技术Spark教程-笔记01【Spark(概述、快速上手、运行环境)】
视频地址:尚硅谷大数据Spark教程从入门到精通_哔哩哔哩_bilibili尚硅谷大数据技术Spark教程-笔记01【
SparkCore
(概述、快速上手、运行环境)】尚硅谷大数据技术Spark教程-笔记
延锋L
·
2023-04-15 08:36
#
Spark
大数据
spark
尚硅谷
hadoop
计算
万字详解 Spark Core 开发调优(建议收藏)
前两天和大家分享了一篇关于
SparkCore
数据倾斜调优相关的文章,今天继续和大家分享一篇关于Spark开发调优的文章,干货文章,建议收藏!
浪尖聊大数据-浪尖
·
2023-04-13 00:59
大数据
编程语言
hadoop
数据库
redis
第二篇|Spark core编程指南
本文将深入探究Spark的核心组件--
Sparkcore
,
SparkCore
是Spark平台的基础通用执行引擎,所有其他功能均建立在该引擎之上。
大数据技术与数仓
·
2023-04-11 16:47
第一章 Spark概述
1.3.2伪分布式环境1.3.3完全分布式环境1.4Spark核心数据集RDD1.4.1RDD常用操作1.4.2RDD的懒操作特性1.4.3宽依赖与窄依赖1.4.4Stage的划分1.1Spark核心组件
SparkCore
苏黎世的民谣
·
2023-04-11 00:23
spark
大数据
数据挖掘
Spark Streaming运行架构分析
韩晶晶严律黄春超简介SparkStreaming是
SparkCore
的扩展,是构建于
SparkCore
之上的实时流处理系统。
senju
·
2023-04-10 20:00
Spark简介及入门
SparkCore
:Spark核心组件,提供了基本的任务调度、内存管理和错误恢复等功能。支持Scala、Java和Python等多种编程语言。
'Wu'
·
2023-04-10 18:39
学习日常
大数据
spark
大数据
hadoop
spark第三章:工程化代码
系列文章目录spark第一章:环境安装spark第二章:
sparkcore
实例spark第三章:工程化代码文章目录系列文章目录前言一、三层架构二、拆分WordCount1.三层拆分2.代码抽取总结前言我们上一次博客
超哥--
·
2023-04-09 13:47
spark
spark
大数据
scala
spark第四章:SparkSQL基本操作
系列文章目录spark第一章:环境安装spark第二章:
sparkcore
实例spark第三章:工程化代码spark第四章:SparkSQL基本操作文章目录系列文章目录@[TOC](文章目录)前言一、添加
超哥--
·
2023-04-09 13:47
spark
spark
大数据
scala
spark第五章:SparkSQL实例
系列文章目录spark第一章:环境安装spark第二章:
sparkcore
实例spark第三章:工程化代码spark第四章:基本操作spark第五章:SparkSQL实例文章目录系列文章目录前言一、数据准备
超哥--
·
2023-04-09 13:47
spark
spark
大数据
hive
spark第二章:
sparkcore
实例
系列文章目录spark第一章:环境安装spark第二章:
sparkcore
实例文章目录系列文章目录前言一、idea创建项目二、编写实例1.WordCount2.RDD实例3.Spark实例总结前言上次我们搭建了环境
超哥--
·
2023-04-09 13:16
spark
spark
scala
大数据
Spark定制班第1课:通过案例对Spark Streaming透彻理解三板斧之一:解密Spark Streaming另类实验及Spark Streaming本质解析
Spark最开始只有
SparkCore
,没有目前的这些子框架。这些子框架是构建于
SparkCore
之上的。没有
rolin-刘瑞
·
2023-04-09 12:12
spark
streaming
spark
spark
streaming
spark第七章:SparkStreaming实例
系列文章目录系列文章目录spark第一章:环境安装spark第二章:
sparkcore
实例spark第三章:工程化代码spark第四章:SparkSQL基本操作spark第五章:SparkSQL实例spark
超哥--
·
2023-04-09 12:57
spark
spark
大数据
scala
spark第六章:SparkStreaming基本操作
系列文章目录spark第一章:环境安装spark第二章:
sparkcore
实例spark第三章:工程化代码spark第四章:SparkSQL基本操作spark第五章:SparkSQL实例spark第六章
超哥--
·
2023-04-07 20:31
spark
spark
scala
大数据
Spark框架
一、Spark框架Spark框架模块包含:
SparkCore
、SparkSQL、SparkStreaming、SparkGraphX、SparkMLlib,而后四项的能力都是建立在核心引擎之上。
万里长江横渡
·
2023-04-05 20:33
大数据
spark
大数据
分布式
PySpark数据分析基础:PySpark基础功能及DataFrame操作基础语法详解
目录前言一、PySpark基础功能1.SparkSQL和DataFrame2.PandasAPIonSpark3.Streaming4.MLBase/MLlib5.
SparkCore
二、PySpark依赖
fanstuck
·
2023-04-03 07:31
数据分析
python
pandas
spark
大数据
大数据hadoop与spark研究——1 spark环境搭建
SparkCore
任务调度,内存管理,错误恢复,与存储系统交互,对RDD的api定义RDD表示分布在多个计算节点上可以并行操作的元素集合SparkSQLspark用来操作结构
南山二毛
·
2023-04-02 00:52
大数据
超全的Spark简介
Spark生态系统
SparkCore
:
SparkCore
包含Spark的基本功能,如内存计算、任务调度、部署模式、故障恢复、存储管理等。Spark建
二哥不像程序员
·
2023-04-01 13:53
Spark
分布式
spark
sparkcore
的join
先准备两个rdd数据scala>vala=sc.parallelize(Array(("A","a1"),("B","b1"),("C","c1"),("E","e1")))a:org.apache.spark.rdd.RDD[(String,String)]=ParallelCollectionRDD[5]atparallelizeat:24scala>valb=sc.parallelize(A
大数据修行
·
2023-03-31 13:57
安装Spark
解压改名修改环境变量修改conf文件spark-env.shworks配置集群用得到配完source一下,使用spark-shell即可进入简单实现wordcount读取本地文件读取hdfs文件Spark技术栈
SparkCore
Triumph-CP
·
2023-03-31 07:01
Spark
spark
scala
大数据
Spark Streaming DStream的操作
DStream的内部,其实是一系列持续不断产生的RDD,RDD是
SparkCore
的核心抽象,即不可变的,分
晓之以理的喵~~
·
2023-03-30 06:03
Hadoop
Spark
大数据
spark
大数据
分布式
Spark及其生态简介
Spark及其生态简介一、Spark简介二、
SparkCore
简介三、SparkSQL简介四、SparkStreaming五、SparkMLlib六、GraphX七、集群管理器八、Spark的用户和用途一
若兰幽竹
·
2023-03-29 18:40
Spark
Spark
Spark的概念、特点、应用场景
它是基于内存计算的大数据并行计算框架Spark生态系统主要包含
SparkCore
.SparkSQL.SparkStreamingMIlibGraphX以及独立调度器:介绍:
SparkCore
:Spark
发量不足
·
2023-03-29 17:52
Scala
IDEA
hadoop
大数据
spark
scala
idea
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他