E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark2
使用SparkSQL操作Elasticsearch - Spark入门教程
从5.0版本开始,elasticsearch-hadoop就支持
Spark2
.0。
DreamsonMa
·
2023-08-17 10:56
Spark Structured Streaming 项目实战
google搜索一下就能找到SparkStreaming项目实战简单架构图原项目中用的是Sparkstreaming,目前spark官网推荐实用SparkStructuredStreaming,也就是对应
spark2
.0
maozicb
·
2023-08-16 06:25
Standalone模式下_taskScheduler和executor运行原理解密
环境:
spark2
.3.3scala2.11.8Java1.8.0_141_taskScheduler和executor运行的代码调用流程,如下图所示:将上述过程,整理简图如下:下面进行具体说明:一:SparkExecutor
ustbxyls
·
2023-08-12 16:34
Spark源码
Spark
大数据
Spark2
.2出现异常:ERROR SparkUI: Failed to bind SparkUI
详细错误信息如下:复制代码19/03/1911:04:18INFOutil.log:Logginginitialized@5402ms19/03/1911:04:18INFOserver.Server:jetty-9.3.z-SNAPSHOT19/03/1911:04:18INFOserver.Server:Started@5604ms19/03/1911:04:18WARNutil.Utils:
行走荷尔蒙
·
2023-08-12 09:11
大数据
安装spark时输入spark-shell报错 “系统找不到指定的路径“
安装spark时输入spark-shell报错“系统找不到指定的路径“1、检查是不是已经安装了py
spark2
、用spark-shell.cmd命令这个问题在网上大部分人都是说Java_Home配置的有问题
幸福右手牵
·
2023-08-12 05:18
spark
第一次scala课程
一、选择Scala版本我们在master虚拟机上安装的是
Spark2
.4.4,为了后续操作不出现任何匹配方面的问题,建议采用跟Spark版本匹配的Scala三、Windows上安装Scala(一)到Scala
snow323H
·
2023-08-11 19:08
scala
spark
big
data
Spark2
.x精通:Master端循环消息处理源码剖析(二)
问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读上一篇文章
Spark2
.x精通:Master端循环消息处理源码剖析
大数据开发运维架构
·
2023-08-11 02:05
解决python3和jupyter-notebook中的报错No module named pyspark和No module named ‘py4j’
背景描述:在centos7–CDH6下配置了
spark2
.4和hive2.3,在linux-shell中输入pyspark可以正常启动,执行下列语句可正常显示frompyspark.sqlimportSparkSessionspark
Nancy_张
·
2023-08-10 20:16
pyspark
linux
python
python
linux
spark
Spark 3.1.1 遇到的 from_json regexp_replace组合表达式慢问题的解决
背景目前公司在从
spark2
.4.x升级到3.1.1的时候,遇到了一类SQL极慢的情况,该SQL的如下(只列举了关键的):selectdevice_personas.
鸿乃江边鸟
·
2023-08-06 19:47
spark
大数据
分布式
spark
大数据
分布式
Spark3-AQE-数据倾斜Join优化
AdaptiveQueryExection(自适应查询计划)简称AQE,在最早在spark1.6版本就已经有了AQE;到了
spark2
.x版本,intel大数据团队进行了相应的原型开发和实践;到了spark3.0
蠟筆小噺没有烦恼
·
2023-08-06 13:34
2 Scala的基础知识
变量值不可修改,一旦分配不能重新指向别的值val:分配后,可以指向类型相同的值vallines=sc.textFile("helloSpark.txt")lines=sc.textFile("hell
Spark2
Achaichai
·
2023-08-03 17:45
Spark2
.x精通:Master端循环消息处理源码剖析(一)
问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读上篇文章:
Spark2
.x精通:Standalone模式Master
大数据开发运维架构
·
2023-08-03 12:57
Centos 7 环境 Storm 2.0.0 完全分布式集群的搭建过程
系列博客地址Centos7环境hadoop3.2.0完全分布式集群搭建Centos7环境hive3.1.1搭建Centos7环境
Spark2
.4.3完全分布式集群的搭建过程Centos7环境HBase2.1.5
小不强
·
2023-08-03 09:51
大数据
spark2
.x--7. 内存管理之StaticMemoryManage
1.MemoryManagerSpark的内存主要分为管理储存(Storage)和执行(Execution),ExecutionMemory是指Shuffles,joins,sorts和aggregation的操作;而StorageMemory是缓存和广播数据相关的,每一个JVM会产生一个MemoryManager来负责管理内存。MemoryManager主要有几个功能:•记录用了多少Storag
shuitai
·
2023-08-02 15:20
Python---pyspark的安装,执行入口,编程模型、RDD对象、数据输入
命令提示符程序内,输入:pipinstallpyspark或使用国内代理镜像网站(清华大学源)pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simplepy
spark2
三月七(爱看动漫的程序员)
·
2023-08-02 05:51
初识python
python
开发语言
pycharm
数据分析
Spark Sql日志分析项目实战
项目简介统计主站最受欢迎的课程TopN访问次数按地市统计主站最受欢迎的TopN课程按流量统计主站最受欢迎的TopN课程环境安装CDH相关软件下载地址Spark环境搭建Spark源码编译(以
spark2
.1.0
kangapp
·
2023-07-24 06:17
Spark之Shuffle参数调优解析
下面是
spark2
.2.0版本的shuffle的属性表,http://spark.apache.org/docs/2.2.0/configuration.html一
zuodaoyong
·
2023-07-23 19:31
spark
spark
【基本功】Spark常用参数详解
一、Hadoop&Hive&Spark官方文档官网文档永远是最好的指导手册hive1.2.1参数配置官方文档
spark2
.2参数配置官方文档/sparksql参数配置文档/spark最新版本官方文档hadoop2.7.1
小马过河@大数据
·
2023-07-22 14:41
Spark
spark
大数据
hadoop
hdfs
hive
基于Flume+Kafka+Spark-Streaming的实时流式处理完整流程
基于Flume+Kafka+Spark-Streaming的实时流式处理完整流程1、环境准备,四台测试服务器spark集群三台,spark1,
spark2
,spark3kafka集群三台,spark1,
玩家_7a4c
·
2023-07-21 23:33
基于Spark3的个性化推荐系统——理论知识
本博客整理自慕课网实战《基于
Spark2
.x的个性化推荐系统》目录一.推荐系统的生态介绍1.生态概述2.常见问题3.效果评测二.协同过滤推荐算法原理1.基于用户的协同过滤2.基于物品的协同过滤3.基于模型的协同过滤
程研板
·
2023-07-21 13:08
#
推荐系统
推荐系统
算法
协同过滤
机器学习
Spark2
.1和2.2 SQL物理执行策略之Join源码分析以及不同类型Join区分
1.objectExtractEquiJoinKeys一个模式匹配,官方注释是:Apatternthatfindsjoinswithequalityconditionsthatcanbeevaluatedusingequi-join.Null-safeequalitywillbetransformedintoequalityasjoiningkey(replacenullwithdefaultva
orisonchan
·
2023-07-20 01:06
【Spark实战】Windows环境下编译
Spark2
Linux上部署Spark On Yarn
文章目录Windows环境下编译
Spark2
环境准备编译准备Linux上部署SparkOnYarn安装前提部署关键步骤配置hadoop变量部署Spark-SQLWindows环境下编译
Spark2
环境准备
顧棟
·
2023-07-20 01:37
#
Spark实战
Spark
spark
windows
linux
spark广播变量的原理_
Spark2
.x(六十二):(
Spark2
.4)共享变量 - Broadcast原理分析...
之前对Broadcast有分析,但是不够深入《
Spark2
.3(四十三):SparkBroadcast总结》,本章对其实现过程以及原理进行分析。
杨良枝
·
2023-07-18 15:14
spark广播变量的原理
如何用Spark SQL实现多Catalog联邦查询
但是,传统的计算引擎如Hive、
Spark2
对多Catalog支持能力很弱,也许是受Flink、Presto(Trino)的步步紧逼,Hive3也开始支持多Catalog,但是仅限于存储层面和API层面
咬定青松
·
2023-07-18 10:25
spark
sql
大数据
hive
hadoop
spark考试练习题
满满的干货第一章1.
Spark2
.X新特征简单讲述三方面,分别为精简的API,Spark作为编译器,智能优化。
刘新源870
·
2023-07-15 07:43
Spark
spark
big
data
大数据
第 3 章 Spark 通讯架构
➢
Spark2
系列中,Spark抛弃Akka,使用Netty。什么是Akk
Wzideng
·
2023-07-14 14:49
#
spark
spark
大数据
分布式
apache hudi 初见
gitclonehttps://gitee.com/apache/Hudi.gitdockerpullyml文件里面的镜像然后docker-compose-fdocker-compose_hadoop284_hive233_
spark2
44
GP0000968523
·
2023-07-13 20:25
apache
hudi
启动Spark集群web界面无work信息
借用一下博主的图片因为我忘记截图了这个博主用的Spark版本是2.3.0版本的,我用的是
Spark2
.4.0版本的不过问题都差不多用同样的方式也解决了礼貌附上链接首先主机查看jps发现Master节点是成功启动的
Asus.Blogs
·
2023-06-20 22:44
Linux
spark
vim
大数据
Spark 1--3章简介,架构体系, 环境搭建
2009年诞生于加州大学伯克利分校AMPLab,2010年开源,2013年6月成为Apache孵化项目,2014年2月成为Apache的顶级项目,2014年5月发布spark1.0,2016年7月发布
spark2
.0
All996
·
2023-06-20 10:15
spark
hadoop
大数据
spark-streaming笔记
SparkStreaming笔记框架的类型:1.离线批处理:mapreduce、hive、SparkCore、Sparksql=》mapreduce
spark2
.SQL的交互式查询:hive、SparkSQL3
最美不过你回眸
·
2023-06-18 23:34
老师笔记
hadoop本地化windows部署
安装winutils-master1.2.5格式化namenode1.2.6启动hadoop1.2.7web-ui登陆hadoophdfs2.sparkonwindows2.1安装scala2.2安装
spark2
.2.1
陈舟的舟
·
2023-06-17 23:03
大数据
hadoop
windows
大数据
hive on spark亲自编译,详细教程
hiveonspark进行编译操作软件hive2.3.6
spark2
.0.0版本hadoop-2.7.6版本操作流程:hadoop-2.7.61、安装hadoop不说了。简单。
Bonyin
·
2023-06-16 21:34
spark
hive
hadoop
Java-Spark系列1-spark概述
文章目录一.大数据技术栈二.Spark概述2.1MapReduce框架局限性2.2Hadoop生态圈中的各种框架2.3
Spark2
.3.1Spark的优势2.3.2Spark特点2.3.3SPRAK2新特性一
只是甲
·
2023-06-16 18:14
大数据和数据仓库
#
Spark
spark
big
data
Spark概述
StarRocks案例4: Spark load第二次运行报错
文章目录一.问题描述二.解决方案一.问题描述需求背景:CDH集群Spark版本2.4.0StarRocks版本2.5.5使用
Spark2
.4.0客户端会报错,java.lang.NoClassDefFoundError
只是甲
·
2023-06-16 18:42
大数据和数据仓库
#
Doris
spark
大数据
StarRocks
广告数仓:数仓搭建
系列文章目录广告数仓:采集通道创建广告数仓:数仓搭建文章目录系列文章目录前言一、环境搭建1.hive安装2.编写配置文件3.拷贝jar包4.初始化源数据库5.修改字符集6.更换Spark引擎1.上传并解压
spark2
超哥--
·
2023-06-15 22:56
广告数仓
hive
hadoop
大数据
在Amazon EKS上部署Zeppelin和Spark分析平台
从Apache
Spark2
.3.0开始,您可以在Kubernetes上运行和管理Spark任务,在Spark3.1版
亚马逊云开发者
·
2023-06-15 17:20
docker
大数据
kubernetes
hadoop
java
图像数据源
spark2
.4开始支持image图片数据源操作importorg.apache.spark.sql.SparkSessionobjectImageDataSourceTest{defmain(args
松松土_0b13
·
2023-06-15 07:17
spark_idea
/bin/spark-submit\--classspark02\--masterspark://hadoop102:7077\--deploy-modeclient\/home/gpb/scala_
spark2
好记性+烂笔头
·
2023-06-14 16:27
#
Spark
spark
intellij-idea
大数据
Ada Tutorial(3)
SPARK2
——Post condition + Loop Invariant 后置条件 + 循环不变量
文章目录divmod循环不变量v.s.后置条件扩展思考divmod--divmod.adbpackagebodyDivModwithSPARK_ModeisprocedureDivMod(X:Positive;N:Positive;K:outNatural;Remainder:outNatural)isY:Natural:=X;beginK:=0;whileY>=NloopY:=Y-N;K:=K+
暖仔会飞
·
2023-06-13 00:32
软件工程学习内容
ada
spark
MongoDB Spark Connector使用
先决条件MongoDB2.6+
Spark2
.2.xScala2.11.xJava1.8+MonogoDBSparkConnector介绍支持数据的读取和写入。
fantasticMao
·
2023-06-11 09:09
pyspark系列--读写dataframe
来源:https://blog.csdn.net/suzyu12345/article/details/796734731.连接
spark2
.创建dataframe2.1.从变量创建2.2.从变量创建2.3
antyzhu
·
2023-06-11 08:03
大数据:hadoop spark,spark特点,功能,架构,模块,角色
大数据:hadoop
spark2
022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,
冰露可乐
·
2023-06-10 16:28
计算机组成原理
大数据
hadoop
spark
yarn
特点功能模块角色
Spark-1.安装和运行
以下基于Hadoop2.7+
Spark2
.4,Mac机器。三个虚拟机(一主两从)做集群。
悠扬前奏
·
2023-06-10 01:53
spark 运行原理
sparkcontext:一个线程只有一个spark的job都是jvm的进程在
spark2
.0之前,SparkContext是所有spark任务的入口,无论spark集群有多少个节点做并行处理,每个程序只可以有唯一的
JackLi_csdn
·
2023-06-09 10:18
spark
spark
Spark学习笔记[3]-Spark安装部署
Spark学习笔记[3]-Spark安装部署1、下载对应版本的spark 官网我始终都下不下来,推荐一个国内的镜像:https://mirrors.tuna.tsinghua.edu.cn/apache/
spark2
kinglinch
·
2023-06-09 08:03
大数据
spark
big
data
Ubuntu常见基本问题
系列文章目录Ubuntu常见基本问题Hadoop3.1.3安装(单机、伪分布)Hadoop集群搭建HBase2.2.2安装(单机、伪分布)Zookeeper集群搭建HBase集群搭建Spark安装和编程实践(
Spark2
.4.0
WE-ubytt
·
2023-06-09 00:30
大数据处理与应用
ubuntu
linux
运维
Spark安装和编程实践(
Spark2
.4.0)
系列文章目录Ubuntu常见基本问题Hadoop3.1.3安装(单机、伪分布)Hadoop集群搭建HBase2.2.2安装(单机、伪分布)Zookeeper集群搭建HBase集群搭建Spark安装和编程实践(
Spark2
.4.0
WE-ubytt
·
2023-06-08 20:41
大数据处理与应用
spark
hadoop
大数据
Spark集群搭建
系列文章目录Ubuntu常见基本问题Hadoop3.1.3安装(单机、伪分布)Hadoop集群搭建HBase2.2.2安装(单机、伪分布)Zookeeper集群搭建HBase集群搭建Spark安装和编程实践(
Spark2
.4.0
WE-ubytt
·
2023-06-08 20:41
大数据处理与应用
spark
hadoop
大数据
HBase集群搭建
系列文章目录Ubuntu常见基本问题Hadoop3.1.3安装(单机、伪分布)Hadoop集群搭建HBase2.2.2安装(单机、伪分布)Zookeeper集群搭建HBase集群搭建Spark安装和编程实践(
Spark2
.4.0
WE-ubytt
·
2023-06-08 20:40
大数据处理与应用
hbase
hadoop
大数据
Hadoop集群搭建
系列文章目录Ubuntu常见基本问题Hadoop3.1.3安装(单机、伪分布)Hadoop集群搭建HBase2.2.2安装(单机、伪分布)Zookeeper集群搭建HBase集群搭建Spark安装和编程实践(
Spark2
.4.0
WE-ubytt
·
2023-06-08 20:05
大数据处理与应用
hadoop
大数据
linux
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他