E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark内存计算
spark
写出分布式的训练算法_
Spark
分布式计算执行模型
引言相对Hadoop,
Spark
在处理需要迭代运算的机器学习训练等任务上有着很大性能提升,同时提供了批处理、实时数据处理、机器学习以及图算法等一站式的服务,因此最近大家一起来学习
Spark
,特别是MLLib
weixin_39965673
·
2023-11-30 02:01
spark写出分布式的训练算法
Spark
分布式环境搭建
Spark
分布式环境搭建1.scala环境搭建1)下载scala安装包scala2.12.10.tgz安装到/usr/scala[root@hadoop001scala]#tar-zxvfscala-2.12.10
陈同学�
·
2023-11-30 02:01
spark
分布式
scala
Spark
完全分布式搭建
Spark
完全分布式搭建教程(Standalone:Master+Slave)分析:1.配置好IP2.修改主机名3.做好IP主机映射4.关闭防火墙5.配置SSH免密登入6.安装Java7.安装Hadoop
明天要开心
·
2023-11-30 02:00
大数据
spark
分布式
Spark
2.3.1的安装运行(伪分布式)
一、
spark
的安装1、本地安装1、在安装
spark
之前需要先安装JDK和scala环境,hadoop环境2、解压安装即可2、standalone安装模式1、解压安装,配置环境变量(通过
spark
-shell
翻斗花园牛爷爷..
·
2023-11-30 02:30
分布式
spark
hadoop
搭建
Spark
伪分布式
文章目录零、本讲学习目标一、搭建伪分布式Hadoop(一)登录ied虚拟机(二)配置免密登录1、在ied虚拟机上生成密钥对2、将生成的公钥发送到本机3、验证虚拟机是否能免密登录本机(三)下载与
Spark
jzy2024
·
2023-11-30 02:00
spark
分布式
hadoop
Spark
Standalone 伪分布模式安装
Spark
在生产环节中,主要部署在安装linux系统的集群中。在linux系统中安装
Spark
需要先安装JDK,Scala等所需的依赖。
小-枝-丫
·
2023-11-30 02:00
linux
spark
spark
大数据
hadoop
1024程序员节
Spark
完全分布式搭建(On Yarn)
目录一、集群规划二、配置
Spark
路径三、修改配置文件1.
spark
-env.sh2.修改slaves文件四、启动集群1.先起动Hadoop的HDFS和Yarn2.启动
Spark
五、Web查看集群启动情况六
Congee小周
·
2023-11-30 02:00
大数据
hadoop
spark
完全分布式
spark-env.sh
slaves
Spark
分布式安装模式
Spark
分布式环境安装目前有四种模式:1.Standalone:
Spark
自带的简单群资源管理器,安装较为简单,不需要依赖Hadoop;2.HadoopYARN:使用YARN作为集群资源管理,安装需要依赖
qq_58647543
·
2023-11-30 02:59
spark
spark
分布式
【必会】
Spark
Streaming的窗口操作及实战
下面,通过一张图来描述
Spark
Streaming的窗口操作,如图所示。基于窗口的操作需要两个参数,如下:窗口长度(wind
wenay
·
2023-11-30 01:58
抖音SEO矩阵系统源码开发关键要素详解!
在该系统的开发过程中,多种编程语言(如Java、Python等)和框架技术(如Hadoop、
Spark
、PyTorch等)被应用,以提高数据处理和分析的效率。
矩阵源码_Muoyu111
·
2023-11-30 01:26
短视频矩阵系统开发
矩阵
线性代数
54、
Spark
性能优化之Java虚拟机垃圾回收调优
Java虚拟机垃圾回收调优的背景如果在持久化RDD的时候,持久化了大量的数据,那么Java虚拟机的垃圾回收就可能成为一个性能瓶颈。因为Java虚拟机会定期进行垃圾回收,此时就会追踪所有的java对象,并且在垃圾回收时,找到那些已经不在使用的对象,然后清理旧的对象,来给新的对象腾出内存空间。垃圾回收的性能开销,是跟内存中的对象的数量,成正比的。所以,对于垃圾回收的性能问题,首先要做的就是,使用更高效
ZFH__ZJ
·
2023-11-30 00:48
Spark
- 动态注册UDF
昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki2
·
2023-11-30 00:38
spark
-submit 样例
spark
-submit--conf
spark
.driver.host=xx\--confhive.metastore.uris=xx\--classcom.mainclass\--num-executors1
旅途心情
·
2023-11-29 22:03
spark
spark
java
java提交
spark
submit_
spark
-submit提交方式测试Demo
写一个小小的Demo测试一下
Spark
提交程序的流程Maven的pom文件1.71.7UTF-81.6.1org.apache.
spark
spark
-core_2.10${
spark
.version}redis.clientsjedis2.7.1org.apache.maven.pluginsmaven-compiler-plugin1.71.7org.apache.maven.pluginsma
航天面面观
·
2023-11-29 22:02
java提交spark
submit
Spark
-submit提交流程
Spark
-submit提交流程代码层面提交
Spark
-submit提交资源分配代码层面提交1.用户传递参数执行
spark
-submit.sh脚本,查询
SPARK
_Home是否设置。
搬转中的码农
·
2023-11-29 22:02
大数据
大数据
spark
spark
-submit:未找到命令
在执行过程中出现错误hadoop@Master:~/
spark
app$
spark
-submit--class"hw10_1_CountLine"/usr/local/
spark
/
spark
app/target
ZYT_庄彦涛
·
2023-11-29 22:02
报错
Spark
spark
大数据
spark
-submit 提交报错
Exceptioninthread"main"java.lang.NoSuchMethodError:scala.Predef$.ArrowAssoc(Ljava/lang/Object;)Ljava/lang/Object;解决方法代码中的
spark
North drift boy
·
2023-11-29 22:31
spark
scala
大数据
7、
spark
的生产应用提交脚本
spark
-submit
一、通过查询命令
spark
-submit--help来查看提交任务时有哪些选项可以用。
Just Jump
·
2023-11-29 22:01
Spark权威指南
spark-submit
Spark
-Shell 及
Spark
-Submit
Spark
-Shell及
Spark
-Submit
Spark
-Shell说明操作命令
Spark
-Submit说明操作命令常用参数示例
Spark
-Shell说明
spark
-shell是
Spark
自带的交互式
半吊子Kyle
·
2023-11-29 22:01
Spark
spark
spark
-submit
相关知识为了完成本关任务,你需要掌握:1.了解
spark
-submit的参数。2.学会提交
Spark
程序在集群运行。
qq_58647543
·
2023-11-29 22:30
spark
spark
大数据
分布式
Spark
_日期参数解析参数-
spark
.sql.legacy.timeParserPolicy
在Apache
Spark
中,
spark
.sql.legacy.timeParserPolicy是一个配置选项,它控制着时间和日期解析策略。此选项主要影响如何解析日期和时间字符串。
高达一号
·
2023-11-29 22:41
Spark
spark
大数据
分布式
Hive_
Spark
_left()函数
在SQL中,LEFT()函数是一个字符串函数,用于从一个字符串的左侧开始提取指定数量的字符。这个函数通常接受两个参数:第一个参数是要从中提取字符的字符串。第二个参数指定要提取的字符数。语法如下:LEFT(string_expression,number_of_characters)string_expression是你想要从中提取子字符串的字符串表达式。number_of_characters是一
高达一号
·
2023-11-29 22:41
Hive
Spark
大数据
spark
-参数配置总结
Spark
属性控制大多数应用程序设置,并为每个应用程序单独配置。这些属性可以直接在传递给你的
Spark
Conf上设置
Spark
Context。
wyc_595998412
·
2023-11-29 22:39
流式计算
内存参数
spark
参数配置
Spark
面试题
Spark
面试题(一)1、
spark
的有几种部署模式,每种模式特点?(☆☆☆☆☆)1)本地模式
Spark
不一定非要跑在hadoop集群,可以在本地,起多个线程的方式来指定。
終于、
·
2023-11-29 22:38
Spark
性能调优系列:
Spark
参数配置大全(官网资料)
Spark
参数配置大全
Spark
提供了三个位置来配置系统
Spark
属性控制大多数应用程序参数,可以使用
Spark
Conf对象或Java系统属性来设置。
Mr Cao
·
2023-11-29 22:07
大数据
spark
Spark性能调优
Spark
_
spark
参数配置优先级
总结:优先级低-》优先级高
spark
-submit提交的优先级
sparkSQLhint
spark
submit中提交参数#!
高达一号
·
2023-11-29 22:32
Spark
spark
大数据
分布式
图片格式及内存占用
1、
内存计算
公式默认情况下,在cocos2d里面加载一张图片的时候,图片中每一个像素点使用4个byte(8位)来表示--分别代表red、green、blue和alpha透明通道。
后山之人
·
2023-11-29 22:22
进阶篇
Structured Streaming: Apache
Spark
的流处理引擎
今天,我们要探讨的主题是Apache
Spark
的一个核心组件——StructuredStreaming。
俺会hello我的
·
2023-11-29 21:07
spark的一些操作
linq
c#
spark
idea配置依赖后package打包失败,导入jar包爆红的解决方案
Failedtoexecutegoalnet.alchim31.maven:scala-maven-plugin:4.0.1:compile(scala-compile-first)onproject
spark
-dw
星夜读书人
·
2023-11-29 19:54
intellij-idea
java
ide
maven
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2023-11-29 19:45
Module-
Spark
使用文档
title:Linux-
Spark
使用文档.mdtags:2019年08月11号notebook:00技术笔记1.
Spark
简介1.1.
Spark
说明Apache
Spark
是一个围绕速度、易用性和复杂分析构建的大数据处理框架
SuperScfan
·
2023-11-29 17:21
大数据学习(24)-
spark
on hive和hive on
spark
的区别
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦1)
Spark
onHive
Spark
onHive是Hive只作为存储角色
viperrrrrrr
·
2023-11-29 17:30
大数据
学习
spark
大数据学习(26)-
spark
SQL核心总结
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦
Spark
SQL是Apache
Spark
的一个模块,它用于处理结构化数据
viperrrrrrr
·
2023-11-29 17:30
大数据
学习
spark
私有镜像仓库Harbor搭建
Offlineinstaller安装方式1.官网下载压缩文件2.tar-zxfharbor-offline-installer-vx.x.x.tgzharbor/usr/local/harbor3.sudochown-R
spark
请不要问我是谁
·
2023-11-29 16:49
智能AI系统ChatGPT网站系统源码+Midjourney绘画+支持DALL-E3文生图,支持最新GPT-4-Turbo模型
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-29 15:59
人工智能
chatgpt
工具
chatgpt
人工智能
midjourney
源码软件
最新AIGC创作系统ChatGPT系统源码+DALL-E3文生图+图片上传对话识图/支持OpenAI-GPT全模型+国内AI全模型
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-29 15:57
人工智能
chatgpt
系统源码
chatgpt
人工智能
源码软件
AI作画
AIGC
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2023-11-29 15:05
Spark
Streaming-----第一个wordcount,算子,Driver HA
1.
spark
Streaming流式处理框架,是
Spark
API的扩展,RDD最终封装到DStream中2.第一个wordcountpom依赖org.apache.
spark
spark
-streaming
计算机界的小学生
·
2023-11-29 12:41
spark
intellij-idea
jar
java
spark
-submit参数调优
一:
spark
-submit提交job的参数说明示例:
spark
-submit--masteryarn--classxxxx--executor-cores5--executor-memory5G--num-executor4xxx.jar
是谁注册了我的2052
·
2023-11-29 12:07
Spark
【数据仓库】
Spark
算子
第一关:转换算子之map和distinct算子输出每个元素及其长度并去重。//第一步:通过获取rdd中每个元素的长度创建新的rdd1valrdd1=rdd.map(x=>x.length())//第二步:通过zip把rdd1和rdd组合创建rdd2valrdd2=rdd.zip(rdd1)//第三步:去重valrdd3=rdd2.distinct()//第四步:输出结果rdd3.foreach(p
「已注销」
·
2023-11-29 12:05
数据仓库高级技术
scala
Spark
Spark
学习笔记3.
spark
-submit +
spark
-shell
spark
-submit:相当于hadoopjar命令--->提交MapReduce任务(jar文件)提交
Spark
的任务(jar文件)
Spark
提供Example例子:/root/training/
spark
aimmon
·
2023-11-29 12:05
Spark
spark-submit
spark-shell
spark
-RDD
Bin/
spark
-shell码的代码,用Eclipse码一下;(分别使用Java和Scala)Rdd:容器,多台服务器共享的容器;算子:transformaction算子和action算子;RDDAPI
墨染繁华执念心悠
·
2023-11-29 12:34
spark
spark-RDD
spark
大数据
SPARK
-SQL中join问题
首先抛出Dataset的join算子在
spark
-sql_2.11版本2.3.0中所有重载方法:由于本人公司产品在执行挖掘任务时任务过长,划分stage过多,并且在过程中存在着关联关系,因此不得不进行数据关联
marvinbb
·
2023-11-29 12:33
SPARK-SQL
SPARK
SPARK-SQL
【IDEA】
spark
-scala快速返回数据类型的方法
目录1、需求说明2、操作1、需求说明在使用scala语言做
spark
项目时,在IDEA中需要快速返回带类型的值;2、操作
郝少
·
2023-11-29 12:02
Spark技术经验
大数据
spark
scala
intellij-idea
spark
学习一-------------------
Spark
算子最详细介绍
Spark
学习–
spark
算子介绍1.基本概念
spark
算子:为了提供方便的数据处理和计算,
spark
提供了一系列的算子来进行数据处理。
创作者mateo
·
2023-11-29 12:28
spark
大数据专栏
spark
学习
ajax
CET4-星火英语(
Spark
)
口语重点-自我介绍(姓名、年龄、学校、专业、学科领域、理想工作、感谢语)拓展词汇专业课程-Arts文科Science理科major主修minor辅修curriculum课程Finance金融学Medicine医学性格态度-extrovert外向的introvert内向的energetic精力充沛的amiable和蔼可亲的industrious勤奋的业余爱好-sketching素描tennis网球个
圣诺干
·
2023-11-29 11:15
HCIA-Big Data华为认证大数据工程师 习题册 含答案
查看课堂笔记(含习题册)目录1.大数据发展趋势与鲲鹏大数据2.HDFS分布式文件管理系统和ZooKeeper3.Hive分布式数据仓库4.HBase技术原理5.MapReduce和Yarn技术原理6.
Spark
k Chivalrous man
·
2023-11-29 08:16
大数据
大数据
华为
HCIA-Big Data V3.0 华为认证大数据工程师在线课程章节测试题汇总
1.大数据发展趋势与鲲鹏大数据1、(单选)以下哪个不是大数据时代新兴的技术:A.HBaseB.HadoopC.MySQLD.
Spark
正确答案:C2、(单选)第三次信息化浪潮的标志是:A.云计算、大数据
gaogao_jack
·
2023-11-29 08:11
华为ICT
华为认证
大数据
华为云
华为
Spark
出错:No applicable constructor/method found for actual parameters “...types.Decimal“
今天调试一段
spark
代码,收到一个错误:CompileException:File‘generated.java’,Line60,Column30:Noapplicableconstructor/methodfoundforactualparameters
无级程序员
·
2023-11-29 07:31
spark
大数据
Spark
---
Spark
Core(三)
一、
Spark
广播变量和累加器1、广播变量1)、广播变量理解图2)、广播变量使用valconf=new
Spark
Conf()conf.setMaster("local").setAppName("brocast
30岁老阿姨
·
2023-11-29 07:08
Spark
java
javascript
服务器
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他