E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark-shell
Spark Q&A
--confspark.sql.files.ignoreCorruptFiles=true另外spark支持的选项可以通过在
spark-shell
耐心的农夫2020
·
2024-03-19 00:12
Spark大数据分析与实战笔记(第二章 Spark基础-06)
2.6IDEA开发WordCount程序
Spark-Shell
通常在测试和验证我们的程序时使用的较多,然而在生产环境中,通常会在IDEA
想你依然心痛
·
2024-02-06 07:38
#
Spark大数据分析与实战
spark
数据分析
笔记
Hudi学习 6:Hudi使用
/editor/1096891432.安装sparkspark学习4:spark安装_hzp666的博客-CSDN博客3.安装ScalaHudi学习6:安装和基本操作_hzp666的博客-CSDN博客
spark-shell
hzp666
·
2024-02-05 14:58
Hudi
hudi
数据湖
湖仓一体
湖仓融合
实时数仓
pyspark的安装及使用
新增测试是否安装成功:javac-versionspark安装官网下载,遇到加载不了选项框的情况可以尝试用手机打开网址获取下载链接后下载直接解压,注意路径不要有空格环境变量配置Path配置测试安装情况,cmd输入
spark-shell
a013067506e4
·
2024-02-02 11:56
启动bin/
spark-shell
警告:WARN NativeCodeLoader: Unable to load native-hadoop library for your platform.
启动bin/
spark-shell
警告:WARNNativeCodeLoader:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable
2301_79479951
·
2024-01-31 00:18
spark
hadoop
大数据
Spark RDD基础实战(弹性分布式数据集)
spark.apache.org/docs/latest/sql-data-sources-json.htmlhttp://jsonlines.org/examples/官网的准备的数据集合启动Spark集群bin/
spark-shell
蜗牛杨哥
·
2024-01-30 15:14
Spark
RDD编程实战指南
大数据
spark-submit 与
spark-shell
介绍
一、spark-submit介绍1、spark-submit介绍程序一旦打包好,就可以使用bin/spark-submit脚本启动应用了。这个脚本负责设置spark使用的classpath和依赖,支持不同类型的集群管理器和发布模式。2、运行方式./bin/spark-submit\--class--master\--deploy-mode\--conf=\...#otheroptions\[app
火成哥哥
·
2024-01-14 09:59
spark
hadoop
spark
java
大数据
linux
Spark大数据分析与实战笔记(第二章 Spark基础-05)
文章目录每日一句正能量前言2.5启动Spark-Shell2.5.1运行
Spark-Shell
命令2.5.2运行
Spark-Shell
读取HDFS文件后记每日一句正能量成长是一条必走的路路上我们伤痛在所难免
想你依然心痛
·
2024-01-07 06:33
spark
数据分析
笔记
Spark 集群搭建
文章目录搭建前准备安装搭建解压并重命名环境变量配置配置文件yarn-site.xmlspark-env.sh官网求π(PI)案例启动
spark-shell
通过浏览器查看显示查看Spark的网页信息展示搭建前准备下载地址
撕得失败的标签
·
2023-12-29 00:42
大数据技术
spark
大数据
分布式
hadoop
yarn
hdfs
175、Spark运维管理进阶之作业资源调度standalone模式下使用动态资源分配
/sbin/.start-shuffle-service.sh启动
spark-shell
,启用动态资源分配添加如下配置--confspark.shuffle.service.enabled=true\-
ZFH__ZJ
·
2023-12-17 04:18
pyspark on yarn
背景描述pyspark相当于python版的
spark-shell
,介于scala的诡异语法,使用pysparkonyarn做一些调试工作还是很方便的。配置获取大数据集群配置文件。
骑着蜗牛向前跑
·
2023-12-16 03:34
大数据
pyspark
on
yarn
python
大数据
Windows平台搭建Spark开发环境(Intellij idea 2020.1社区版+Maven 3.6.3+Scala 2.11.8)
如果需要在本地通过
spark-shell
,或者运行开发完的包,那么就需要完整的hadoop和spark环境,就需要把
阳泉酒家小当家
·
2023-12-15 19:56
大数据
hadoop
spark
scala
spark
intellij-idea
IntelliJ IDEA创建一个spark的项目
如果需要在本地通过
spark-shell
,或者运行开发完的包,那么就需要完整的hadoop和spark环境,就需要把
刘文钊1
·
2023-12-15 19:45
intellij-idea
spark
java
flink学习之sql-client之踩坑记录
flink/bin目录下会看到这个脚本,最开始以为是和
spark-shell
差不多的。结果自行摸索无果,网上查的文章也写的很垃圾,自己查官网看下吧。SQL客户端|ApacheFlink直接.
cclovezbf
·
2023-12-04 02:00
flink
flink
学习
大数据
【Spark】on yarn集群模式安装部署
安装单机版Spark不需要集群,因为把Spark程序提交给YARN运行本质上是把字节码给YARN集群上的JVM运行,但是得有一个东西帮我去把任务提交上个YARN,所以需要一个单机版的Spark,里面的有
spark-shell
没去过埃及的法老
·
2023-11-30 03:23
Sprak
大数据
spark
on
yarn集群模式
安装部署
云计算/大数据
Spark2.3.1的安装运行(伪分布式)
一、spark的安装1、本地安装1、在安装spark之前需要先安装JDK和scala环境,hadoop环境2、解压安装即可2、standalone安装模式1、解压安装,配置环境变量(通过
spark-shell
翻斗花园牛爷爷..
·
2023-11-30 02:30
分布式
spark
hadoop
Spark-Shell
及 Spark-Submit
Spark-Shell
及Spark-SubmitSpark-Shell说明操作命令Spark-Submit说明操作命令常用参数示例
Spark-Shell
说明
spark-shell
是Spark自带的交互式
半吊子Kyle
·
2023-11-29 22:01
Spark
spark
Spark 学习笔记3. spark-submit +
spark-shell
spark-submit:相当于hadoopjar命令--->提交MapReduce任务(jar文件)提交Spark的任务(jar文件)Spark提供Example例子:/root/training/spark-2.1.0-bin-hadoop2.7/examples/spark-examples_2.11-2.1.0.jar#javapythonrresourcesscala#resources
aimmon
·
2023-11-29 12:05
Spark
spark-submit
spark-shell
spark-RDD
Bin/
spark-shell
码的代码,用Eclipse码一下;(分别使用Java和Scala)Rdd:容器,多台服务器共享的容器;算子:transformaction算子和action算子;RDDAPI
墨染繁华执念心悠
·
2023-11-29 12:34
spark
spark-RDD
spark
大数据
什么是spark,spark运行模式,local模式,使用
spark-shell
,Standalone模式,Yarn模式,案例实操WordCount程序
Spark1.2.1快速1.2.2易用1.3.1集群管理器(ClusterManager)第2章Spark运行模式2.1Local模式2.1.1解压Spark安装包2.1.2运行官方求PI的案例2.1.3使用
Spark-shell
长岛山没有雪
·
2023-11-25 01:45
spark
yarn
大数据
分布式
开源
数据分析
1. spark源码分析(基于yarn cluster模式)-任务提交
首先声明,这个系列研究的源码基于spark-2.4.6我们在使用
spark-shell
提交任务的时候,一般采用如下模式提交任务:park-submit--classxxxxx--name'test_xxxx
Leo Han
·
2023-11-25 01:45
大数据
spark
scala
big
data
yarn
<Zhuuu_ZZ>Spark项目之log日志数据分析处理
Spark项目之log日志数据分析处理一项目准备二项目需求三项目战斗1、数据清洗日志字段拆分分析IDEA开发程序2、用户留存分析3活跃用户分析四项目拓展之复杂Json格式的log日志处理分析
Spark-Shell
Zhuuu_ZZ
·
2023-11-22 13:26
Spark
项目
spark
log
数据处理
数据分析
大数据组件spark hadoop hive简单介绍
spark单机启动
spark-shell
集群启动/usr/local/spark-2.4.5-bin-hadoop2.7/sbin/start-all.sh提交任务1.打包python环境:whereispython
转身之后才不会
·
2023-11-19 23:29
大数据
hadoop
大数据
spark
Spark DataFrame的创建
目录1.环境准备2.从txt文件创建DataFrame3.从RDD中创建DataFrame4.一些错误1.环境准备开启虚拟机、开启hadoop集群、开启spark集群、开启
spark-shell
、在
spark-shell
连胜是我偶像
·
2023-11-15 09:56
spark
spark
scala
Spark读取excel文件
文章目录一、excel数据源转成csv二、Spark读取csv文件(一)启动
spark-shell
(二)读取csv生成df(三)查看df内容一、excel数据源转成csv集群bigdata-ubuntu
howard2005
·
2023-11-14 18:48
Spark大数据处理讲课笔记
spark
excel
csv
/
spark-shell
报错拒绝链接,Error initializing SparkContext. java.net.ConnectException:
/
spark-shell
报错拒绝链接22/01/1203:49:27ERRORSparkContext:ErrorinitializingSparkContext.java.net.ConnectException
大白菜程序猿
·
2023-11-08 13:17
spark
大数据
spark
java
.net
Spark系列之Spark启动与基础使用
title:Spark系列第三章Spark启动与基础使用3.1SparkShell3.1.1SparkShell启动安装目录的bin目录下面,启动命令:
spark-shell
$SPARK_HOME/bin
落叶飘雪2014
·
2023-10-30 08:09
Spark
数据计算
Spark
大数据
windows下安装spark
spark将下载的文件解压到一个目录,注意目录不能有空格,比如说不能解压到C:\ProgramFiles作者解压到了这里,image.png将spark的bin路径添加到path中image.pngcmd输入
spark-shell
test_dw
·
2023-10-28 07:26
Hudi数据湖-基于Flink、Spark湖仓一体、实时入湖保姆级教学
目录Hudi源码编译Hudi扫盲基于
Spark-shell
集成Hudi基于Spark-Hive集成Hudi手动创建HIVE表基于SparkSQL集成Hudi自动创建HIVE表基于FlinkSQL集成Hudi
笑一笑、
·
2023-10-27 01:04
BigData
spark
flink
big
data
win10搭建spark3.1环境(超详细)
scala3.安装spark4.安装hadoop5.安装winutils6.测试程序0.写在前面目前Spark官方提供的最新版本3.2.0,是2021年10月份发布,但是该版本搭建Windows下环境,在使用
spark-shell
纵深
·
2023-10-26 20:14
SPARK
scala
spark
大数据
大数据常见错误及解决方案
/bin/
spark-shell
启动spark时遇到异常:java.net.BindException:Can'tassignrequestedaddress:Service'sparkDriver'failedafter16retries
果粒多
·
2023-10-24 07:53
大数据-BigData
spark-shell
启动失败
背景公司小组分配了三台虚拟机,在虚拟机上面意欲装hadoop集群及sparkonyarn版本Hadoop2.7.2spark2.3.2问题配置好hadoop集群与spark配置后,启动spark-shell--masteryarn报错如下Settingdefaultloglevelto"WARN".Toadjustlogginglevelusesc.setLogLevel(newLevel).Fo
望山不是山
·
2023-10-19 08:20
spark-shell
读取hdfs数据
打开
spark-shell
,输入下面代码(注意“yourPATHinHDFS”这里换成自己文件的路径)valtextFile=sc.textFile("hdfs://localhost:9000/yourPATHinHDFS
密言
·
2023-10-19 07:21
分布式框架
spark
基于CentOS7、Hadoop2.7.7搭建Spark2.4.7、Zookeeper3.6.3并开启spark高可用模式
将Spark作业跑在Yarn上,首先需要启动Yarn集群,然后通过
spark-shell
或spark-submit的方式将作业提交到Yarn上
sirLateautumn
·
2023-10-13 15:56
#
大数据集群搭建
spark
zookeeper
大数据下一代变革之必研究数据湖技术Hudi原理实战双管齐下-下
DeltaStreamer集成Flink环境准备sql-clent使用启动插入数据流式读取Bucket索引HudiCatalog集成Spark开发Spark编程读写示例通过IDE如Idea编程实质上和前面的
spark-shell
IT小神
·
2023-10-12 15:56
大数据
数据仓库
大数据
scala
spark
flink
解决 Unable to load native-hadoop library for your platform
安装hadoop启动之后或者在启动
spark-shell
的时候总有警告:Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable
feixiashenxian
·
2023-10-11 16:09
spark
hadoop
Unable
to
load
native-hadoop
l
spark-shell
warning
Spark-submit 提交 报错 org.apache.spark.sql.execution.datasources.orc.OrcFileFormat could not be instant
e.job,e.mgr,e.commfromempejoindeptdone.deptno=d.deptno").filter("commisnotnull").write.parquet("/demp");
spark-shell
路飞DD
·
2023-10-11 10:53
大数据
Spark
SparkSQL
Hadoop
Hive
Spark
spark·-submit
提交报错
Spark
版本冲突
SPARK
在使用
spark-shell
时,进一步使用dataframe进行sql处理,报错:HiveMetaStoreClient:FailedtoconnecttotheMetaStoreServerspark-shell
innersense
·
2023-10-09 14:59
spark
spark
hive
20211005
了解了在
spark-shell
中,初始化了sparksession,️sparksession又创建了sparkcontext名为sc,用sparksession(spark)读文本为spark.read.textFile
Sophie12138
·
2023-09-30 16:22
转载:Spark的运行架构分析(二)
之运行模式详解一:SparkOnLocal此种模式下,我们只需要在安装Spark时不进行hadoop和Yarn的环境配置,只要将Spark包解压即可使用,运行时Spark目录下的bin目录执行bin/
spark-shell
小小少年Boy
·
2023-09-20 05:54
Spark-Shell
的启动与运行
Spark-Shell
的启动与运行一、启动spark2.启动hadoop3.启动spark二、SparkRdd的简单操作1.从文件系统加载数据创建ADD(1)从Linux本地文件系统加载数据创建RDD—
LMY~~
·
2023-09-18 08:40
spark
大数据
hadoop
此时不应有 \Java\jdk1.8.0_144\bin\java
配置windows下spark环境时,使用
spark-shell
命令出现该错误。
MaTae
·
2023-09-12 09:36
spark on ack (ali EMR on ACK) 问题汇总
1、
spark-shell
提交任务以后,终端超时,实际任务不退出,造成资源一直计费。需要进入到spark-gateway机器上手动kill任务进程。
迷茫_小青年
·
2023-09-06 19:13
Hudi 快速体验使用(含操作详细步骤及截图)
文章目录Hudi快速体验使用启动
spark-shell
添加jar包模拟产生Trip乘车数据插入数据利用sqarkSQL查询参考资料:Hudi快速体验使用本示例要完成下面的流程:需要提前安装好hadoop
半岛铁子_
·
2023-08-28 19:09
spark
大数据
Hudi
spark
big
data
hudi
大数据
HiBench成长笔记——(2) CentOS部署安装HiBench
安装Scala使用
spark-shell
命令进入shell模式,查看spark版本和Scala版本:下载Scala2.10.5wgethttps://downloads.lightbend.com/scala
weixin_30323631
·
2023-08-23 00:44
java
scala
开发工具
spark使用心得
/
spark-shell
输出中有这么一行:SparkcontextWebUIavailableathttp://xx.xx.xx.188:4040意味着我们可以从web页面查看spark的运行情况,特别要注意的是
天下无敌笨笨熊
·
2023-08-17 13:59
spark
大数据
分布式
安装spark时输入
spark-shell
报错 “系统找不到指定的路径“
安装spark时输入
spark-shell
报错“系统找不到指定的路径“1、检查是不是已经安装了pyspark2、用spark-shell.cmd命令这个问题在网上大部分人都是说Java_Home配置的有问题
幸福右手牵
·
2023-08-12 05:18
spark
spark读取hive phoenix映射
Kyuubi,由于原有作业中有使用Hive读取Phoenix映射表因此需要做一些适配.过程适配不需要改动代码,只需要拷贝相关jar到sparkjars中即可(phoenix以及hbase),拷贝完成后直接通过
spark-shell
ThomasgGx
·
2023-08-10 18:51
spark
hive
spark
hadoop
在 spark-sql /
spark-shell
/ hive / beeline 中粘贴 sql、程序脚本时的常见错误
有时候我们会粘贴一段已经成功运行过的SQL或程序脚本,但是在spark-sql/
spark-shell
/hive/beeline中执行时可能会报这样的错误:hive>CREATEEXTERNALTABLEIFNOTEXISTSORDERS
Laurence
·
2023-08-03 10:59
大数据专题
spark
sql
hive
Display
possibilities
Spark-hadoop集群中8020:Connection refused
一、使用CentOs7虚拟机运行spark案例报出8020端口出现错误 前提条件,使用standalone模式下的Spark,使用
spark-shell
运行example中的相关测试案例spark-examples
天堂 沙县小吃
·
2023-07-29 07:11
Big
Data
spark
hadoop
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他