E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
——Spark
Spark
性能优化指南——基础篇
假如这排版不好,请移步:
Spark
性能优化指南——基础篇一、背景在大数据计算领域,
Spark
已经成为了越来越流行、越来越受欢迎的计算平台之一。
一条水里的鱼
·
2023-10-04 00:57
pyspark
spark
big
data
性能优化
spark
优化指南
目录一、代码优化1.基本原则2.算子优化2.1reduceByKey/aggregateByKey替代groupByKey2.2mapPartitions(foreachPartitions)替代map(foreach)2.3使用filter之后进行coalesce操作2.4repartitionAndSortWithinPartitions替代repartition与sort类操作二、资源配置1
Mr_哲
·
2023-10-04 00:27
spark
spark
优化
shuffle
rdd
java sql 参数缺省_
spark
SQL 参数调优
1
spark
.sql.codegen默认值为false,当它设置为true时,
Spark
SQL会把每条查询的语句在运行时编译为java的二进制代码。这有什么作用呢?
weixin_39754616
·
2023-10-03 21:16
java
sql
参数缺省
2022正式结束全年总基调,向2023迈向新征程
不可言说的另一个自己毕业已经五个月有余,先来汇报一下总体情况,总共自主独立完成两个项目,毕业后分别学习了部分
spark
、docker、达梦数据库、Oracle数据库操作及命令,并且这些大部分都有过实际操作
Love And Program
·
2023-10-03 20:38
小结
经验分享
程序人生
职场和发展
学习方法
跳槽
Python大数据之Py
Spark
(四)
Spark
Base&Core
文章目录
Spark
Base&Core环境搭建-
Spark
onYARN扩展阅读-
Spark
关键概念[了解]Py
Spark
角色分析[了解]Py
Spark
架构后记
Spark
Base&Core学习目标掌握
Spark
OnYarn
Maynor996
·
2023-10-03 19:50
#
PySpark
python
大数据
开发语言
最新
Spark
AI创作系统V2.6.2/ChatGPT网站系统H5源码+微信公众号版+AI绘画系统源码/支持GPT联网提问/支持Prompt应用
一、AI创作系统
Spark
Ai创作系统是基于国外很火的ChatGPT进行开发的AI智能问答系统和AI绘画系统。
白云如幻
·
2023-10-03 17:15
人工智能
ChatGPT
网站源码
人工智能
chatgpt
源码软件
midjourney
prompt
运维开发
springboot三层架构_几张图让你快速了解数据中台技术架构
数钥数据中台,基于Hadoop和
Spark
体系相关技术,融合数据采集、分析、存储能力,以Springboot微服务形态对外提供服务。
weixin_39634997
·
2023-10-03 16:41
springboot三层架构
openfire 4.7.5 Web插件开发
文章目录1、openfire服务端下载安装1.1、openfire解压运行1.2、
Spark
安装和登录2、openfire插件开发2.1、基于servlet开发http接口2.2、基于Jersey开发http
penngo
·
2023-10-03 16:10
java
java
openfire
Jersey
插件
xmpp
5分钟
spark
streaming实践之 与kafka联姻
你:kafka是什么?我:嗯,这个嘛。。看官网。ApacheKafka®isadistributedstreamingplatformKafkaisgenerallyusedfortwobroadclassesofapplications:Buildingreal-timestreamingdatapipelinesthatreliablygetdatabetweensystemsorapplic
5ef43bf0252e
·
2023-10-03 14:44
RDD操作——文件数据读写
执行上上面这条命令以后,并不会马上显示结果,因为,
Spark
采用惰性机制,只有遇到“行动”类型的操作,才会从头到尾执行所有操作。
_羊羽_
·
2023-10-03 13:57
Debezium日常分享系列之:使用数据库中的数据流进行在线机器学习
使用数据库中的数据流进行在线机器学习一、背景介绍二、数据集准备三、使用ApacheFlink进行分类四、使用Debezium和Kafka作为源数据流五、构建Flink流k-means六、评估模型七、使用Apache
Spark
最笨的羊羊
·
2023-10-03 13:07
日常分享专栏
Debezium日常分享系列
数据库
数据流进行在线机器学习
DataFrame添加列
场景需求:将
Spark
SQL计算的结果数据保存到MySQL,但是计算数据里面缺少into_time字段。通过withColumn和UDF实现新加字段。
孤单的阿怪
·
2023-10-03 12:07
Py
Spark
学习:WordCount排序
Py
Spark
学习:WordCount排序环境:1、配置好
Spark
集群环境2、配置好Python环境,在
spark
解压目录下的python文件夹中执行pythonsetup.pyinstall即可安装好
云谁之殇
·
2023-10-03 10:38
Spark
SQL原理之Aggregate实现原理
聚合函数的分类声明式聚合函数:可以由Catalyst中的表达式直接构建的聚合函数,也是比较简单的聚合函数类型,最常见的count,sum,avg等都是声明式聚合函数。命令式聚合函数:是指一类需要显式实现几个方法来操作聚合缓冲区AggBuffer中的数据的聚合函数。命令式聚合函数不那么常见,能找到的命令式聚合函数包括基数统计hyperLogLogPlus、透视转换pivotFirst等。带类型的命令
分裂四人组
·
2023-10-03 08:23
Airflow填坑 - 生产环境实战,开始时间与周期的设置(没看的小伙伴抓紧了)
首先,介绍一下需求在大数据处理阶段,也就是数据的ETL,我们通过公司自己开发的平台,将各个业务流程模型化,模型=输入算子+数据处理算子(SQL化,底层为
spark
sql)+输出算子,类似于这种模型,代表一个个的业务
冯JK
·
2023-10-03 05:20
2019-03-13-
Spark
官方调优文档翻译
Spark
调优由于大部分
Spark
计算都是在内存中完成的,所以
Spark
程序的瓶颈可能由集群中任意一种资源导致,如:CPU、网络带宽、或者内存等。
红魔豆
·
2023-10-03 05:49
计算机毕业设计Python+
Spark
+LSTM中药推荐系统 中药大数据可视化 中药数据分析 中药可视化系统 中药知识图谱
开发技术前端:vue.js、echarts后端:springboot、vue.js数据库:mysql大数据计算框架:
spark
、hadoop算法(机器学习、人工智能):推荐算法(协同过滤算法,基于用户、
计算机毕业设计大神
·
2023-10-03 04:32
Spark
SQL 与 Hive 的小文件调优
文章目录小文件危害表的缓存shuffle分区数调整
Spark
SQL客户端设置合并Hive客户端处理小文件合并动态分区调优小文件归档小文件危害小文件会造成nn处理压力变大,大大降低了读取性能,整个HDFS
月亮给我抄代码
·
2023-10-03 03:51
spark
hive
sql
大数据
Spark
3.0核心调优参数小总结
Spark
重点难点系列:《【
Spark
重点难点01】你从未深入理解的RDD和关键角色》《【
Spark
重点难点02】你以为的Shuffle和真正的Shuffle》《【
Spark
王知无(import_bigdata)
·
2023-10-03 03:21
大数据
spark
python
java
数据分析
spark
-sql调优技巧
spark
SQL概述
spark
SQL的前世今生==Shark是专门针对于
spark
的构建大规模数据仓库系统的一个框架==Shark与Hive兼容、同时也依赖于
Spark
版本Hivesql底层把sql解析成了
柱子z
·
2023-10-03 03:21
spark-sql
大数据
hadoop
spark
Spark
性能调优--资源参数调优、算子调优、Shuffle参数调优、
Spark
数据倾斜调优
一、资源参数调优了解完了
Spark
作业运行的基本原理之后,对资源相关的参数就容易理解了。
四月天03
·
2023-10-03 03:20
Spark
spark
big
data
scala
Spark
任务如何调优
spark
性能调优a.分配更多资源——第一步要做的比如增加executor个数(num_executor)、增加executor的cpu核数(executor_cores)、增加executor的内存量
星空下的那个人影
·
2023-10-03 03:50
大数据面试
spark
spark
spark
任务调优参数及问题整理
2.
spark
.dynamicAllocation.enabled=true开启动态资源
小小小小小小小小小小码农
·
2023-10-03 03:50
大数据
spark
spark
SQL 参数调优
1.
spark
.sql.codegen默认值为false,当它设置为true时,
Spark
SQL会把每条查询的语句在运行时编译为java的二进制代码。这有什么作用呢?
爱学习的小肥猪
·
2023-10-03 03:20
spark
Spark
on Yarn资源调优
前言
Spark
是专为大规模数据处理而设计的快速通用的计算引擎,具有速度快、支持多语言、移植性高的特点。
chimchim66
·
2023-10-03 02:50
Hadoop
spark
big
data
hadoop
Spark
调优 — 资源调优&参数调优
spark
-submit参数具体如下:
spark
-submit\--queue${1}\#指定资源队列,否则默认default--masteryarn--deploy-mode${2}\#clientorcluster
daoxu_hjl
·
2023-10-03 02:50
Spark
Spark
性能调优
文章目录一、概述二、资源参数调优1参数调优①num-executors②executor-memory③executor-core④driver-memory⑤
Spark
.default.parallelism⑥
Spark
.storage.memoryFraction⑦
Spark
.Shuffle.memoryFraction
爱小可爱的IT白
·
2023-10-03 02:49
spark
大数据
分布式
【日更挑战】2022-03-16比赛日NOTES
Kallgren成为枫叶历史上第4位做到这一点的门将,另外3位是Garret
Spark
s(201
扁圆柱体
·
2023-10-03 02:20
MaxCompute
Spark
开发指南
MaxCompute
Spark
开发指南0.概述本文档面向需要使用MaxCompute
Spark
进行开发的用户使用。本指南主要适用于具备有
Spark
开发经验的开发人员。
weixin_34413802
·
2023-10-03 00:58
大数据
java
scala
Spark
性能优化指南
前言在大数据计算领域,
Spark
已经成为了越来越流行、越来越受欢迎的计算平台之一。
夜古诚
·
2023-10-03 00:58
spark
Spark性能优化指南
Spark调优
Spark
SQL中的Encoder
以下错误,想必在做
Spark
的DateSet操作时一定是见过吧?
代码足迹
·
2023-10-03 00:09
Apache
Spark
动态分区 OverWrite 问题
1、问题:
spark
Dataframe:partition_day.write.partitionBy("day").mode(SaveMode.Overwrite).format("orc").saveAsTable
团团饱饱
·
2023-10-02 23:06
初识
当使用集群计算来处理大数据时,Scala+
Spark
是极好的解决方案。基于行的语言,分号和换行均可作为语句的结束。
高永骁
·
2023-10-02 22:47
最新AI智能创作系统源码V2.6.2/AI绘画系统/支持GPT联网提问/支持Prompt应用
一、AI创作系统
Spark
Ai创作系统是基于国外很火的ChatGPT进行开发的AI智能问答系统和AI绘画系统。
只恨天高
·
2023-10-02 21:12
人工智能
程序源码
chatgpt
人工智能
chatgpt
AI作画
源码软件
AIGC
prompt
11
Spark
1.安装anaconda在官网上下载anacondalinux后缀为.sh的安装包运行sh./Anaconda3-2021.05-Linux-x86_64.sh安装过程:输入yes后就安装完成了.验证:安装完成后,退出SecureCRT重新进来:看到这个base开头表明安装好了.base是默认的虚拟环境,检查python是否安装成功换源(推荐)在jaken用户下:vim~/.condarc#新文件
sorry_maker
·
2023-10-02 21:35
spark
大数据
最新AI智能问答系统源码/AI绘画系统源码/支持GPT联网提问/Prompt应用+支持国内AI提问模型
一、AI创作系统
Spark
Ai创作系统是基于国外很火的ChatGPT进行开发的AI智能问答系统和AI绘画系统。
白云如幻
·
2023-10-02 17:51
人工智能
ChatGPT
程序源码
人工智能
chatgpt
教程
AI写作
最新AI创作系统源码ChatGPT源码+附详细搭建部署教程+AI绘画系统+支持国内AI提问模型
一、AI系统介绍
Spark
Ai创作系统是基于国外很火的ChatGPT进行开发的Ai智能问答系统。
白云如幻
·
2023-10-02 17:47
人工智能
教程
程序源码
人工智能
chatgpt
源码软件
AI作画
运维开发
Spark
思维导图
简介
Spark
Spark
是分布式计算框架
Spark
可以和多种存储系统结合使用,如Kafka、HBase、Hive、HDFS以及关系型数据库。
亼珏
·
2023-10-02 14:14
简化云编程,伯克利对serverless的看法(翻译)
译者言:作为了解一个技术最好的方式之一就是对相关论文进行阅读,比如
spark
论文,kafka论文,对自己的提升也是非常巨大的,由于一句话中经常涉及巨大的信息量,所以将论文彻底翻译为中文,仔细理解阅读是非常必要的
田晓亮_7ed1
·
2023-10-02 09:42
return code 3 from org.apache.hadoop.hive.ql.exec.
spark
.
Spark
Task.
Spark
job failed during runtime.
主要是hive-on-
spark
上的配置当进行insert插入操作时,
spark
就会报错,运行不起来hive和
spark
版本适配肯定不必多说我的问题出现在在hive-site.xml配置里面,有个
spark
半岛铁盒@
·
2023-10-02 07:32
大数据开发
hive
spark
hadoop
Invalid signature file digest for Manifest main attributes
InvalidsignaturefiledigestforManifestmainattributes--文件签名不合法在运行
spark
程序的时候报下面的异常:18/03/0609:21:28ERRORyarn.ApplicationMaster
zxfBdd
·
2023-10-02 04:45
Java
java io报错_Phoenix报错(3)java.io.IOException: Broken pipe
解决办法1,在cm上加环境变量cm→
spark
→gateway→高级exportHADOOP_CONF_DIR=/etc/hbase/conf:/etc/hadoop/conf:/etc/hive/conf2
Mars Zhu
·
2023-10-02 04:45
java
io报错
文章标题
k-means聚类hadoop平台思路1.1在参考了《数据算法-hadoop、
spark
》289页;文章ResearchonParallelk-meansAlgorithmDesignBasedonHadoopPlatform
浩海紫冰
·
2023-10-02 03:07
大数据
hadoop
k-means 聚类hadoop 平台
1.k-means聚类hadoop平台思路1.1在参考了《数据算法-hadoop、
spark
》289页;文章ResearchonParallelk-meansAlgorithmDesignBasedonHadoopPlatform
浩海紫冰
·
2023-10-02 03:37
大数据
欢迎使用CSDN-markdown编辑器
k-means聚类hadoop平台1.1在参考了《数据算法-hadoop、
spark
》289页;文章ResearchonParallelk-meansAlgorithmDesignBasedonHadoopPlatform
浩海紫冰
·
2023-10-02 03:37
大数据
hadoop
spark
sql 异常
1.
spark
SQL测试过程中报如下错误org.apache.
spark
.sql.AnalysisException--20/08/2511:42:08INFOClient:resolveAppExceptionMsg
浩海紫冰
·
2023-10-02 03:37
大数据
spark
sql
Spark
核心组件之BlockManager数据存储与管理机制
BlockManager是整个
Spark
底层负责数据存储与管理的一个组件,Driver和Executor的所有数据都由对应的BlockManager进行管理。
Map_Reduce
·
2023-10-01 22:28
最新AI智能创作系统ChatGPT商业源码+详细图文搭建部署教程+AI绘画系统
一、AI系统介绍
Spark
Ai创作系统是基于国外很火的ChatGPT进行开发的Ai智能问答系统。
白云如幻
·
2023-10-01 20:40
人工智能
ChatGPT
运维
人工智能
chatgpt
源码软件
AI作画
midjourney
AI智能问答系统源码/AI绘画商业系统/支持GPT联网提问/支持Midjourney绘画
一、AI创作系统
Spark
Ai创作系统是基于国外很火的ChatGPT进行开发的AI智能问答系统和AI绘画系统。
白云如幻
·
2023-10-01 20:06
ChatGPT
人工智能
程序源码
人工智能
chatgpt
AI作画
midjourney
源码软件
spark
ui 指南
spark
ui指南1.
spark
UI基本介绍2.jobs页面3.stages页面4.storage页面5.environment页面6.ececutor页面7sql页面
spark
ui是反应一个
spark
浩海紫冰
·
2023-10-01 19:37
大数据
hive
etl工程师
上一页
70
71
72
73
74
75
76
77
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他