E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
——Spark
spark
环境搭建window篇
spark
环境搭建window篇安装JDK安装hadoop安装
Spark
安装过程出现的问题问题一错误排查问题二错误排查问题三错误排查问题四错误排查Maven整合导入依赖编辑代码设置虚拟机参数运行结果安装
邱可爱
·
2023-10-26 20:48
大数据
java
spark
大数据
hadoop
win10安装
spark
及其环境配置
win10安装
spark
及其环境配置所需安装包1.JDK2.Hadoop3.
Spark
&Scala验证是否成功所需安装包JDK+环境配置Hadoop+环境配置
Spark
+环境配置Scala+环境配置1.
T_Donna
·
2023-10-26 20:48
大数据
spark
scala
大数据
jdk
hadoop
win10java配置环境变量msi_win10安装java+hadoop+
spark
前言操作系统win10安装时间2018年12月java版本jdk1.8.0_191hadoop版本hadoop-2.8.5
spark
版本
spark
-2.3.1-bin-hadoop2.7Java安装方法一下载这时有两种
weixin_39797693
·
2023-10-26 20:18
Win10下安装
spark
踩坑实录
配置
spark
之前,需要有jdk8,Hadoop环境目录配置
spark
之前,需要有jdk8,Hadoop环境一.安装IDE二.安装scalastep1:下载step2:配置环境step3:测试三.安装
Spark
step1
shdxhsq
·
2023-10-26 20:15
大数据学习
spark
scala
hadoop
win10中
spark
环境的配置
在环境变量中配置好JAVA_HOME,CLASSPATH,PATH中添加上%JAVA_HOME%\bin,%JAVA_HOME%\jre\bin,需要注意的是,jdk的路径中不要出现空格,否则下面执行
spark
-shel
vasonyang
·
2023-10-26 20:15
spark
saprk
win10
spark
sparkb安装
win10 安装
spark
开发环境
2、配置
Spark
下载
spark
:官网地址:http://
spark
.apache.org/downloads.html下载完成后解压到D盘根目录下即可。
天地不仁以万物为刍狗
·
2023-10-26 20:45
Spark
Spark
win10搭建
spark
3.1环境(超详细)
目录0.写在前面1.java环境2.安装scala3.安装
spark
4.安装hadoop5.安装winutils6.测试程序0.写在前面目前
Spark
官方提供的最新版本3.2.0,是2021年10月份发布
纵深
·
2023-10-26 20:14
SPARK
scala
spark
大数据
Win10下安装
Spark
(Python+Local版+非虚拟机版)
点赞、关注再看,养成良好习惯Lifeisshort,UneedPython初学Python,快来点我吧由于大部分学生用的都是windows系统,而且博主也是windows系统,所以想在win10上安装
Spark
PyQuant
·
2023-10-26 20:43
Spark+Hadoop
Spark
【
Spark
Streaming】
1、基本数据源1.1、文件流在
spark
Shell下运行:[lyh@hadoop102
spark
-yarn-3.2.4]$
spark
-shellSettingdefaultloglevelto"WARN
让线程再跑一会
·
2023-10-26 20:13
Spark
spark
大数据
分布式
1024程序员节
win10安装
spark
on hadoop流程
转自:https://blog.csdn.net/NJYR21/article/details/80291630说明安装步骤分为java,scala,
spark
和hadoop四步,以下是对我整个安装过程的记录
hemeinvyiqiluoben
·
2023-10-26 20:12
hadoop
spark
scala
基础架构系列篇-基于win10安装
SPARK
3与HADOOP环境
基础架构系列篇-基于win10安装
SPARK
3与HADOOP环境(这里版本是
spark
-3.1.2hadoop-3.2.0)目录1.下载安装
spark
(这里版本是
spark
-3.1.2-bin-hadoop3.2
dong-123456
·
2023-10-26 20:12
大数据
知识点
分布式
big
data
spark
hadoop
hdfs
windows
win10安装
spark
流程
win10安装
spark
流程说明安装步骤分为java,scala,
spark
和hadoop四步,以下是对我整个安装过程的记录。一、安装JDK官网下载了8u172版本。
NJYR21
·
2023-10-26 20:11
win10
spark安装
win10中安装
spark
并使用py
spark
英文原文目录安装环境安装
spark
安装winutils从Jupyter中使用
Spark
至此,大功告成!
Rachel钟老师
·
2023-10-26 20:11
spark
python
windows
10
win10安装
spark
一、进入
spark
下载页面连接Downloads|Apache
Spark
二、解压下载后的.tgz文件直接解压即可三、运行运行bin目录下的
spark
-shell.cmd提示Didnotfindwinutils.exe
早起晨练啊
·
2023-10-26 20:39
spark
ES-
Spark
连接ES后,ES Client节点流量打满分析
问题描述前段时间用es-
spark
读取es数遇到了client节点流量打满的现象。es-
spark
配置的es.nodes是es的域名。
YG_9013
·
2023-10-26 14:27
spark
从入门到放弃十四:
Spark
Context原理剖析
1.1创建TaskSchedulerImpl他其实就是TaskScheduler(后面在做详细的分析)TaskSchedulerImpl底层主要基于
Spark
DeploySchedulerBackend
意浅离殇
·
2023-10-26 13:29
IntelliJ IDEA
Spark
环境搭建
0x00安装安装IntelliJIDEA,并激活安装
Spark
,JDK1.8(
Spark
2.4.3与jdk12版本有兼容问题,降级为jdk8版本可以解决),scala,sbt(一个类似于maven,npm
小道小姐姐
·
2023-10-26 12:38
spark
3.3.x处理excel数据
环境:
spark
3.3.xscala2.12.x引用:
spark
-shell--jars
spark
-excel_2.12-3.3.1_0.18.5.jar或项目里配置pom.xmlcom.crealytics
spark
-excel
就发个快递
·
2023-10-26 10:45
spark
excel
25款大数据入门与实战电子书+视频教程(全程干货)
本资源由菜鸟窝大数据教研团队整理的,共有1.3GB学习资源(电子书)含Hadoop大数据与挖掘实战、Hbase实战、
Spark
大数据处理技术、
Spark
高级数据分析、大数据存储MongoDB实战、大数据架构师指南
菜鸟窝
·
2023-10-26 07:50
Spark
课程记录---Ubuntu_New虚拟机以及与本机连接
一、VM可能会出现导入失败的情况(如下),点击重试,等待导入。开启此虚拟机,出现如下问题,点击“是”。hadoop用户密码:hadoop打开终端获取inet地址$ifconfig打开FileZilla,两种方式连接本地window主机。连接方式文件—>站点管理器—>新站点,把从虚拟机上获取的inet地址,端口为22,协议选择SFTP,这样能够保持稳定连接,输入虚拟机的用户和密码。然后连接。
咖喱要加力
·
2023-10-26 04:08
ubuntu
hadoop
linux
spark
源码分析Master与Worker启动流程篇
spark
通信流程概述
spark
作为一套高效的分布式运算框架,但是想要更深入的学习它,就要通过分析
spark
的源码,不但可以更好的帮助理解
spark
的工作过程,还可以提高对集群的排错能力,本文主要关注的是
那年的坏人
·
2023-10-26 04:23
spark
spark
源码
分布式
框架
大数据系列之
Spark
集群环境部署
Spark
作为一种大数据分布式计算框架,已经构建
Spark
Streaming、
Spark
SQL、
Spark
ML等组件,与文件系统HDFS、资源调度YARN一起,构建了
Spark
生态体系,如下图所示:以下部分将主要介绍
solihawk
·
2023-10-26 04:51
大数据系列
#
spark
大数据
spark
Spark
之 排错与优化
49155087一.运维1.Master挂掉,standby重启也失效Master默认使用512M内存,当集群中运行的任务特别多时,就会挂掉,原因是master会读取每个task的eventlog日志去生成
spark
ui
hankl1990
·
2023-10-26 04:21
spark
(转)
Spark
排错与优化
[+]一.运维1.Master挂掉,standby重启也失效Master默认使用512M内存,当集群中运行的任务特别多时,就会挂掉,原因是master会读取每个task的eventlog日志去生成
Spark
ui
冥想者-定
·
2023-10-26 04:50
__Spark
spark
排错与优化
一.运维1.Master挂掉,standby重启也失效Master默认使用512M内存,当集群中运行的任务特别多时,就会挂掉,原因是master会读取每个task的eventlog日志去生成
Spark
ui
chenji5873
·
2023-10-26 04:49
java
ui
python
Spark
集群中一个Worker启动失败的排错记录
文章目录1检查失败节点worker启动日志2检查正常节点worker启动日志3查看正常节点
spark
环境配置4又出现新的ERROR4.1报错解释4.2报错解决思路4.3端口报错解决操作集群下电停机后再次启动时
程序终结者
·
2023-10-26 04:47
Hadoop生态
报错
1024程序员节
Hadoop+Zookeeper+
Spark
+Hbase集群式部署
2.7.6.tar.gzhbase-1.2.6-bin.tar.gzjdk-8u161-linux-x64.tar.gzzookeeper-3.4.10.tar.gzsqoop-1.99.7.tar.gz
spark
Go ku
·
2023-10-26 01:17
Hadoop
Spark
SQL执行流程与Catalyst优化器
目录一、
Spark
SQL运行流程与Catalyst优化器(1)RDD运行流程(2)
Spark
SQL自动优化(3)Catalyst优化器流程(4)Catalyst优化器总结(5)
Spark
SQL执行流程一
吗喽也是命
·
2023-10-25 23:21
大数据
Spark
_SQL函数定义(定义UDF函数、使用窗口函数)
一、UDF函数定义(1)函数定义(2)
Spark
支持定义函数(3)定义UDF函数(4)定义返回Array类型的UDF(5)定义返回字典类型的UDF二、窗口函数(1)开窗函数简述(2)窗口函数的语法一、UDF
吗喽也是命
·
2023-10-25 23:51
1024程序员节
Spark
_SQL-DataFrame数据写出以及读写数据库(以MySQl为例)
一、数据写出(1)
Spark
SQL统一API写出DataFrame数据二、写出MySQL数据库一、数据写出(1)
Spark
SQL统一API写出DataFrame数据统一API写法:常见源写出:#cording
吗喽也是命
·
2023-10-25 23:50
1024程序员节
大数据面试题汇总
主要包括以下几大类:一、
spark
相关1.
Spark
的Shuffle原理及调优?2.hadoop和
spark
使用场景?3.
spark
如何保证宕机迅速恢复?4.hadoop和
spark
的相同点和不同点?
kuntoria
·
2023-10-25 20:28
常用
spark
sql函数整理
1.条件判断if(条件判断,true,false)casewhen条件1then条件2then值else默认end字段名称2.parse_url解析url字符串parse_url(url,url部分,具体字段)url部分:HOST,QUERY3.map格式解析,列名[字段][uid->119024341,currPage->indexpage,bannerType->yueke,timestamp
星城天空
·
2023-10-25 17:22
2023-10-25 py
spark
使用jar包
提交方式使用参数jars即可--jars"/path/to/local/xxx.jar"py
spark
代码中使用方式sc._jvm.demo.FeatureCalculateDemo或者
spark
.
破阵子沙场秋点兵
·
2023-10-25 16:16
spark
数据倾斜以及解决方案
对
Spark
/Hadoop这样的分布式大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。对于分布式系统而言,理想情况下,随着系统规模(节点数量)的增加,应用整体耗时线性下降。
陈二狗想吃肉
·
2023-10-25 16:09
【js】单文件上传和大文件分片上传功能实现
2、大文件上传需要计算MD5值,使用
spark
-md5库。
前端小袁
·
2023-10-25 11:53
javascript
前端
html
Pandas API on
Spark
使用详解
在上一篇文章中我们介绍了《Py
Spark
DataFrame使用详解》,本篇文章我们继续介绍Py
Spark
系列的第二个重要内容——PandasAPIon
Spark
。
大白兔黑又黑
·
2023-10-25 11:11
#
Spark
大数据
spark
python
pandas
Spark
-Core
Spark
简介
Spark
-Core核心算子
Spark
-Core文章目录一、RDD编程1、RDD序列化1.2Kryo序列化框架2、RDD依赖关系2.1查看血缘关系2.2查看依赖关系2.3窄依赖2.4宽依赖
ha_lydms
·
2023-10-25 09:56
大数据
1024程序员节
spark-core
spark
星火应用商店---在uos及deepin上使用
1、登录星火应用商店的网站https://
spark
-app.store/,下载软件安装包2、点击下载3、点击开始下载4、选择对应的
鹏大师运维
·
2023-10-25 09:20
linux
统信
UOS
linux
服务器
2021-03-02
/bin/bash
spark
-submit--classcom.YYY.rdvs.Sign_and_Pai_Chu.Out_Current_Day\--masteryarn\--deploy-modecluster
sparkle123
·
2023-10-25 09:50
spark
sql 数据类型转换_
Spark
将列转换为存储在字符串中的sql类型
简单的请求是我需要帮助将列添加到数据框,但是列必须是空的,其类型来自...
spark
.sql.types并且类型有从字符串中定义。
weixin_39986171
·
2023-10-25 09:39
spark
sql
数据类型转换
spark
读kafka数据 hbase存储
package
spark
88.utilsimportkafka.common.TopicAndPartitionimportkafka.message.MessageAndMetadataimportkafka.serializer.StringDecoderimportkafka.utils.ZkUtilsimportorg.apache.hadoop.hbase.client
mllhxn
·
2023-10-25 06:08
spark
Ai写作创作系统ChatGPT网站源码+图文搭建教程+支持GPT4.0+支持ai绘画(Midjourney)/支持OpenAI GPT全模型+国内AI全模型
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统+AI绘画系统,支持OpenAIGPT全模型+国内AI全模型。
白云如幻
·
2023-10-25 04:08
人工智能
软件源码
ChatGPT
AI写作
chatgpt
AI作画
人工智能
prompt
midjourney
We All Need Help
Iwa
spark
edinfrontofthemallwipingoffmycar.Comingmywayfromacrosstheparkinglotwaswhatsocietywouldconsiderabum.Ihopehedoesn'taskmeforanymoney.Ithought.Hedidn't.Hecameandsatonthecurbinfrontofthebusstop.Hed
邓月
·
2023-10-25 02:06
Spark
TaskAttempt目录未删除问题排查
https://blog.csdn.net/u013332124/article/details/98356924一、问题描述有业务反馈
spark
任务结束后会遗留一些attempt目录在输出目录上,影响数据的读取
疯狂的哈丘
·
2023-10-25 01:57
Hadoop+Hive+
Spark
+Hbase开发环境练习
app/data/exam查看csv文件行数[root@kb129~]#hdfsdfs-cat/app/data/exam/meituan_waimai_meishi.csv|wc-l2.分别使用RDD和
Spark
SQL
不吃香菜lw
·
2023-10-24 23:45
hadoop
hive
spark
hbase
案例一 预测商品需求量
观测值如下表所示数据集:y,x1,x2100|5100075|760080|6120070|650050|83065|740090|51300100|41100110|3130060|9300预测代码实现:package
Spark
Learning.MLDay01importorg.apache.
spark
.ml.featu
鬼古神月
·
2023-10-24 20:29
spark
-技术链接
构造新的特征-Python实现https://blog.csdn.net/shine19930820/article/details/71713680https://github.com/tjmashu/py
spark
_learning
felixanna
·
2023-10-24 18:30
深入浅出Apache SeaTunnel SQL Server Sink Connector
不仅如此,它还支持多种流处理引擎,例如
Spark
、Flink和SeatTunnelZeta。无论您是初学者还是有经验的开发者
DolphinScheduler社区
·
2023-10-24 16:06
大数据
Spark
的DataFramex写入Oracle中数据类型转换
1.标准hivesql可参考文章2.
Spark
DSL风格sql$"field_name".cast(DecimalType(16,4))as"field_name"3.数值类型的值超过Oracle字段精度未在写入数据库之前定义精度
pageniao
·
2023-10-24 15:15
Spark
spark
sql
大数据
Window 环境连接虚拟机中Hadoop及
Spark
集群
Window环境连接虚拟机中Hadoop及
Spark
集群1.Windows安装Hadoop1.1配置环境变量1.2下载相似版本的文件2.idea进行远程连接操作2.1.启动hive元数据服务2.2.hive.metastore.uris
pageniao
·
2023-10-24 15:15
Spark
hadoop
spark
hive
上一页
56
57
58
59
60
61
62
63
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他