E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
********Spark
spark
-参数配置总结
Spark
属性控制大多数应用程序设置,并为每个应用程序单独配置。这些属性可以直接在传递给你的
Spark
Conf上设置
Spark
Context。
wyc_595998412
·
2023-11-29 22:39
流式计算
内存参数
spark
参数配置
Spark
面试题
Spark
面试题(一)1、
spark
的有几种部署模式,每种模式特点?(☆☆☆☆☆)1)本地模式
Spark
不一定非要跑在hadoop集群,可以在本地,起多个线程的方式来指定。
終于、
·
2023-11-29 22:38
Spark
性能调优系列:
Spark
参数配置大全(官网资料)
Spark
参数配置大全
Spark
提供了三个位置来配置系统
Spark
属性控制大多数应用程序参数,可以使用
Spark
Conf对象或Java系统属性来设置。
Mr Cao
·
2023-11-29 22:07
大数据
spark
Spark性能调优
Spark
_
spark
参数配置优先级
总结:优先级低-》优先级高
spark
-submit提交的优先级
sparkSQLhint
spark
submit中提交参数#!
高达一号
·
2023-11-29 22:32
Spark
spark
大数据
分布式
Structured Streaming: Apache
Spark
的流处理引擎
今天,我们要探讨的主题是Apache
Spark
的一个核心组件——StructuredStreaming。
俺会hello我的
·
2023-11-29 21:07
spark的一些操作
linq
c#
spark
idea配置依赖后package打包失败,导入jar包爆红的解决方案
Failedtoexecutegoalnet.alchim31.maven:scala-maven-plugin:4.0.1:compile(scala-compile-first)onproject
spark
-dw
星夜读书人
·
2023-11-29 19:54
intellij-idea
java
ide
maven
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2023-11-29 19:45
Module-
Spark
使用文档
title:Linux-
Spark
使用文档.mdtags:2019年08月11号notebook:00技术笔记1.
Spark
简介1.1.
Spark
说明Apache
Spark
是一个围绕速度、易用性和复杂分析构建的大数据处理框架
SuperScfan
·
2023-11-29 17:21
大数据学习(24)-
spark
on hive和hive on
spark
的区别
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦1)
Spark
onHive
Spark
onHive是Hive只作为存储角色
viperrrrrrr
·
2023-11-29 17:30
大数据
学习
spark
大数据学习(26)-
spark
SQL核心总结
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦
Spark
SQL是Apache
Spark
的一个模块,它用于处理结构化数据
viperrrrrrr
·
2023-11-29 17:30
大数据
学习
spark
私有镜像仓库Harbor搭建
Offlineinstaller安装方式1.官网下载压缩文件2.tar-zxfharbor-offline-installer-vx.x.x.tgzharbor/usr/local/harbor3.sudochown-R
spark
请不要问我是谁
·
2023-11-29 16:49
智能AI系统ChatGPT网站系统源码+Midjourney绘画+支持DALL-E3文生图,支持最新GPT-4-Turbo模型
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-29 15:59
人工智能
chatgpt
工具
chatgpt
人工智能
midjourney
源码软件
最新AIGC创作系统ChatGPT系统源码+DALL-E3文生图+图片上传对话识图/支持OpenAI-GPT全模型+国内AI全模型
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-29 15:57
人工智能
chatgpt
系统源码
chatgpt
人工智能
源码软件
AI作画
AIGC
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2023-11-29 15:05
Spark
Streaming-----第一个wordcount,算子,Driver HA
1.
spark
Streaming流式处理框架,是
Spark
API的扩展,RDD最终封装到DStream中2.第一个wordcountpom依赖org.apache.
spark
spark
-streaming
计算机界的小学生
·
2023-11-29 12:41
spark
intellij-idea
jar
java
spark
-submit参数调优
一:
spark
-submit提交job的参数说明示例:
spark
-submit--masteryarn--classxxxx--executor-cores5--executor-memory5G--num-executor4xxx.jar
是谁注册了我的2052
·
2023-11-29 12:07
Spark
【数据仓库】
Spark
算子
第一关:转换算子之map和distinct算子输出每个元素及其长度并去重。//第一步:通过获取rdd中每个元素的长度创建新的rdd1valrdd1=rdd.map(x=>x.length())//第二步:通过zip把rdd1和rdd组合创建rdd2valrdd2=rdd.zip(rdd1)//第三步:去重valrdd3=rdd2.distinct()//第四步:输出结果rdd3.foreach(p
「已注销」
·
2023-11-29 12:05
数据仓库高级技术
scala
Spark
Spark
学习笔记3.
spark
-submit +
spark
-shell
spark
-submit:相当于hadoopjar命令--->提交MapReduce任务(jar文件)提交
Spark
的任务(jar文件)
Spark
提供Example例子:/root/training/
spark
aimmon
·
2023-11-29 12:05
Spark
spark-submit
spark-shell
spark
-RDD
Bin/
spark
-shell码的代码,用Eclipse码一下;(分别使用Java和Scala)Rdd:容器,多台服务器共享的容器;算子:transformaction算子和action算子;RDDAPI
墨染繁华执念心悠
·
2023-11-29 12:34
spark
spark-RDD
spark
大数据
SPARK
-SQL中join问题
首先抛出Dataset的join算子在
spark
-sql_2.11版本2.3.0中所有重载方法:由于本人公司产品在执行挖掘任务时任务过长,划分stage过多,并且在过程中存在着关联关系,因此不得不进行数据关联
marvinbb
·
2023-11-29 12:33
SPARK-SQL
SPARK
SPARK-SQL
【IDEA】
spark
-scala快速返回数据类型的方法
目录1、需求说明2、操作1、需求说明在使用scala语言做
spark
项目时,在IDEA中需要快速返回带类型的值;2、操作
郝少
·
2023-11-29 12:02
Spark技术经验
大数据
spark
scala
intellij-idea
spark
学习一-------------------
Spark
算子最详细介绍
Spark
学习–
spark
算子介绍1.基本概念
spark
算子:为了提供方便的数据处理和计算,
spark
提供了一系列的算子来进行数据处理。
创作者mateo
·
2023-11-29 12:28
spark
大数据专栏
spark
学习
ajax
CET4-星火英语(
Spark
)
口语重点-自我介绍(姓名、年龄、学校、专业、学科领域、理想工作、感谢语)拓展词汇专业课程-Arts文科Science理科major主修minor辅修curriculum课程Finance金融学Medicine医学性格态度-extrovert外向的introvert内向的energetic精力充沛的amiable和蔼可亲的industrious勤奋的业余爱好-sketching素描tennis网球个
圣诺干
·
2023-11-29 11:15
HCIA-Big Data华为认证大数据工程师 习题册 含答案
查看课堂笔记(含习题册)目录1.大数据发展趋势与鲲鹏大数据2.HDFS分布式文件管理系统和ZooKeeper3.Hive分布式数据仓库4.HBase技术原理5.MapReduce和Yarn技术原理6.
Spark
k Chivalrous man
·
2023-11-29 08:16
大数据
大数据
华为
HCIA-Big Data V3.0 华为认证大数据工程师在线课程章节测试题汇总
1.大数据发展趋势与鲲鹏大数据1、(单选)以下哪个不是大数据时代新兴的技术:A.HBaseB.HadoopC.MySQLD.
Spark
正确答案:C2、(单选)第三次信息化浪潮的标志是:A.云计算、大数据
gaogao_jack
·
2023-11-29 08:11
华为ICT
华为认证
大数据
华为云
华为
Spark
出错:No applicable constructor/method found for actual parameters “...types.Decimal“
今天调试一段
spark
代码,收到一个错误:CompileException:File‘generated.java’,Line60,Column30:Noapplicableconstructor/methodfoundforactualparameters
无级程序员
·
2023-11-29 07:31
spark
大数据
Spark
---
Spark
Core(三)
一、
Spark
广播变量和累加器1、广播变量1)、广播变量理解图2)、广播变量使用valconf=new
Spark
Conf()conf.setMaster("local").setAppName("brocast
30岁老阿姨
·
2023-11-29 07:08
Spark
java
javascript
服务器
Spark
Streaming流式数据处理
目录一、
Spark
Streaming简介二、简单的例子三、
Spark
Streaming相关核心类3.1StreamingContext3.2离散流DiscretizedStreams(DStreams)
NightFall丶
·
2023-11-29 07:38
#
Spark
spark
SparkStreaming
Spark
---Master启动及Submit任务提交
一、
Spark
Master启动1、
Spark
资源任务调度对象关系图2、集群启动过程
Spark
集群启动之后,首先调用$
SPARK
_HOME/sbin/start-all.sh,start-all.sh脚本中调用了
30岁老阿姨
·
2023-11-29 07:38
Spark
spark
大数据
分布式
Spark
Streaming + Kafka构建实时数据流
数据见UserBehavior.csv数据解释:本次实战用到的数据集是CSV文件,里面是一百零四万条淘宝用户行为数据,该数据来源是阿里云天池公开数据集根据这一csv文档运用Kafka模拟实时数据流,作为
Spark
Streaming
茶树油酸梅酱
·
2023-11-29 07:08
spark
kafka
json
hadoop
sql
Spark
---
Spark
Core(二)
四、补充算子1、transformations类算子mapPartitionWithIndex类似于mapPartitions,除此之外还会携带分区的索引值。repartition增加或减少分区。会产生shuffle。(多个分区分到一个分区不会产生shuffle)coalescecoalesce常用来减少分区,第二个参数是减少分区的过程中是否产生shuffle。true为产生shuffle,fal
30岁老阿姨
·
2023-11-29 07:08
Spark
spark
大数据
分布式
Spark
Streaming基本数据源
Spark
Streaming基本数据源
Spark
Streaming的大体流程图
Spark
Streaming分周期将数据封装在RDD中,底层抽象使用Dstream。本质还是对RDD中数据的处理。
简丶致
·
2023-11-29 07:06
spark
big
data
spark
Spark
Streaming基本概念
Spark
Streaming是构建在
Spark
上的实时计算框架,它扩展了
Spark
处理大规模流式数据的能力。
晓之以理的喵~~
·
2023-11-29 07:36
Hadoop
Spark
大数据
spark
大数据
数据仓库
Spark
Streaming使用Kafka数据流示例
Spark
作为目前最流行的分布式计算框架,可用于处理实时数据流,本文主要介绍
Spark
Streaming如何使用Kafka数据流做分析,具体使用的版本信息见pom配置。
追风落叶乔木生
·
2023-11-29 07:34
大数据
kafka
spark
java
大数据
基于
Spark
Streaming 的流数据处理和分析
文章目录一.流介绍1.流是什么2.为什么需要流处理3.流处理应用场景4.如何进行流处理二.
Spark
Streaming1.
Spark
Streaming流数据处理架构2.
Spark
Streaming内部工作流程
sun_0128
·
2023-11-29 07:03
spark
spark
Spark
Streaming
Spark
_
Spark
高阶特性
wscgfilter导致断链Codegen向量化simdjsonOrcParquet支持批量读取
spark
本身对parquet支持比较好,因为parquet
高达一号
·
2023-11-29 07:03
Spark
spark
大数据
分布式
Spark
Streaming提取数据
一、简介
Spark
Streaming是一个从各种来源获取实时流数据的框架。它支持的流资包括HDFS、Kafka、Flume以及自定义流等。
简单不过l
·
2023-11-29 07:29
Spark
spark
streaming
Spark
Streaming【数据流处理原理分析】
Spark
Streaming介绍
Spark
Streaming它是对
Spark
核心API的扩展,目的在于对实时数据流进行高吞吐、高容错的处理。
Spark
Streaming底层是
Spark
Core。
Smile to everyday
·
2023-11-29 07:29
spark
大数据
分布式
apache
spark
Spark
Streaming之基本数据源输入
Spark
Streaming拥有两类数据源(1)基本源(Basicsources):这些源在StreamingContextAPI中直接可用。例如文件系统、套接字连接、Akka的actor等。
coco_ethan
·
2023-11-29 07:59
spark
SparkStreaming
基本数据源
使用
Spark
Streaming处理Kafka数据流
Kafka作为优秀的日志采集系统,可以作为
Spark
Streaming的高级数据源,本文主要介绍如何使用
Spark
Streaming实时处理Kafka传递过来的数据流。
打酱油的葫芦娃
·
2023-11-29 07:28
大数据
spark
kafka
linq
Spark
---资源、任务调度
一、
Spark
资源调度源码1、
Spark
资源调度源码过程
Spark
资源调度源码是在Driver启动之后注册Application完成后开始的。
30岁老阿姨
·
2023-11-29 07:25
Spark
spark
大数据
分布式
Spark
Streaming的基本数据流
先来介绍一下按照动静对数据的区分静态数据静态数据(StaticData)指的是在一段时间内不会或很少发生变化的数据。这种类型的数据通常是固定的,并且不会随着时间的推移而更新或仅偶尔更新。静态数据的典型例子包括配置文件、参考表、历史记录、已发布的研究报告等。在大数据环境中,尤其是使用Hadoop分布式文件系统(HDFS)时,数据通常被认为是静态的,这是因为HDFS被设计成适合一次写入和多次读取的场景
俺会hello我的
·
2023-11-29 07:55
spark
大数据
数据仓库
Spark
_
spark
shell退出方式
问题描述在使用
Spark
Shell进行交互式编程时,如何优雅地退出
Spark
Shell,即关闭Shell会话,并释放资源。
高达一号
·
2023-11-29 07:54
Spark
spark
大数据
分布式
Spark
SQL,DF,RDD cache常用方式
._2)).setName("testRDD")testRDD.cache()dataframe中的cache利用catalog以表的形式对数据进行缓存importorg.apache.
spark
.
Spark
Conf
高达一号
·
2023-11-29 07:19
Spark
spark
sql
java
生产环境_sql获
spark
将课程与对应的选课人员以逗号分隔的形式存储
DavidScience|EmilyScience|Franksql代码:SELECT课程,GROUP_CONCAT(人员ORDERBY人员SEPARATOR',')AS课程所有人员FROM表GROUPBY课程;
spark
Matrix70
·
2023-11-29 07:18
数据分析与处理
Spark
SQL
spark
sql
大数据
面试篇
spark
(
spark
core,
spark
sql,
spark
优化)
一:为什么学习
spark
?相比较map-reduce框架,
spark
的框架执行效率更加高效。mapreduce的执行框架示意图。
宇智波云
·
2023-11-29 05:21
面试
spark
sql
Scala写入文件时乱码解决
今天在需要将
spark
操作后的数据保存到本地文件时出现乱码问题,现在记录下来valwriter=newPrintWriter(newFile("E://data/gps_bus_data01.txt")
鬼古神月
·
2023-11-29 03:49
10X空间转录组数据分析之Pattern recognition and clustering
hello,我们接上一篇,10X空间转录组空间高变基因分析之
SPARK
,上一篇我们利用一些方法,找到了很多显著性的空间高变基因,那么这些基因在我们分析数据的时候起到了什么作用呢?
单细胞空间交响乐
·
2023-11-29 03:27
【
Spark
入门】基础入门
【大家好,我是爱干饭的猿,本文重点介绍
Spark
的定义、发展、扩展阅读:
Spark
VSHadoop、四大特点、框架模块、运行模式、架构角色。
爱干饭的猿
·
2023-11-29 02:30
spark
spark
大数据
分布式
解决
Spark
SQL读数据库时不支持某些数据类型的问题
之前开发数据湖新版本时使用
Spark
SQL来完成ETL的工作,但是遇到了
Spark
SQL不支持某些数据类型(比如ORACLE中的TimestampwithlocalTimezone)的问题。
alexlee666
·
2023-11-28 20:49
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他