E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark2
使用教育网邮箱学生验证Microsoft Imagine 微软开发者 获取window server 2016正版密钥教程
MicrosoftImagine介绍微软免费软件项目Dream
Spark2
016年9月正式更名为MicrosoftImagine,将与一年一度的微软“创新杯(ImagineCup)”齐名。
edu教育邮箱官方资讯平台
·
2023-06-08 19:58
window
server
2016
教育网邮箱
TiDB亿级数据亚秒响应查询整体架构
目录1TiDB的优势2TiDB的组件2.1TiDBServer2.2PD(PlacementDriver)Server2.3TiKVServer2.4Ti
Spark2
.5TiFlash3TiKV整体架构
赵广陆
·
2023-06-08 13:51
tidb
tidb
架构
数据库
Spark2
.1.0的Standalone模式部署
1.下载并解压spark安装包:spark-2.1.0-bin-hadoop2.7.tgz,配置好每台机器上spark的环境变量cd/home/hadoop273/sparktar-zxvf/data/soft/spark/spark-2.1.0-bin-hadoop2.7.tgz-C.vim~/.bash_profileexportSPARK_HOME=/home/hadoop273/spark
逸笔草草
·
2023-06-08 11:24
Spark
spark
Spark Core源码精读计划 番外篇A:AppStatusStore的底层实现
InMemoryViewElementTrackingStoreApp状态监听器LiveEntity添加清理触发器监听事件处理方法基于KVStore和监听器包装AppStatusStore总结前言AppStatusStore这个东西是在
Spark2
.3.0
LittleMagic
·
2023-06-07 03:47
spark大数据任务提交参数的优化记录分析
分析环境
spark2
.2.0基于yarn集群参数spark任务提交参数中最重要的几个:spark-submit--masteryarn--driver-cores1--driver-memory5G--
·
2023-06-06 21:26
Sparklyr
spark.rstudio.com安装Sparklyr:sparklyr::spark_install(version="2.3.0",hadoop_version="2.7"),不依赖于Spark版本,
spark2
Liam_ml
·
2023-04-19 12:45
Spark大数据处理学习笔记(2.2)搭建Spark Standalone集群
安装包上传到master虚拟机1.2将spark安装包解压到指定目录1.3配置spark环境变量1.4编辑spark环境配置文件1.5创建slaves文件,添加从节点二、在slave1虚拟机上安装配置
Spark2
.1
Kox2021
·
2023-04-18 14:32
#
Spark大数据处理学习笔记
spark
学习
大数据
2019-10-29 spark系列(一) spark 安装
针对ScalaAPI,
Spark2
.4.4使用了Scala2.12。您需要一个可兼容的Scala版本(2.12.x)。
非甲即丁
·
2023-04-18 01:52
大数据Spark SparkSession的3种创建方式 Scala语言实现
1、什么是SparkSessionSparkSession是Apache
Spark2
.0版本引入的一个编程接口,用于与Spark进行交互。
申子辰林
·
2023-04-18 01:00
Scala
BigData
Spark
scala
spark
大数据
spark学习(二)从hello world开始
在github中,spark有完整的wordcount源码,代码清晰整洁,是用RDD完成编码的,但上一节提到过
spark2
.0之后推荐使用Dataset进行编码,所以本节笔者试着使用Dataset进行wordcount
mumu_cola
·
2023-04-17 16:15
Spark 简介与原理
目录标题1Spark简介与原理1.1Spark与Hadoop的区别1.2Spark的应用场景1.3Spark的作业运行流程1.4
Spark2
.X与Spark1.X的区别1Spark简介与原理Spark是一个大规模数据处理的统一分析引擎
桑榆嗯
·
2023-04-15 14:25
spark
python
spark
【 大数据分析Hadoop + Spark 】10分钟搭建Hadoop(伪分布式 )+ Spark(Local模式)环境
镜像二、Hadoop安装及配置(伪分布式)1.创建hadoop用户2.更新apt3.安装SSH、配置SSH无密码登陆4.安装Java环境5.安装Hadoop3.1.36.Hadoop伪分布式配置三、安装
Spark2
.4.01
Ì_t小白
·
2023-04-11 03:31
大数据分析
hadoop
分布式
spark
数据分析
Spark+Hadoop环境搭建
一、工具下载:1、spark下载目前最新的是2.1.1,
spark2
.0开始api和之前的还是有比较多的变化,因此如果选择2.0以上版本,最好看一下api变化,下载地址:http://spark.apache.org
m0_67392811
·
2023-04-11 03:28
java
hadoop
spark
大数据
java
开发语言
pyspark(1)介绍与安装概要
目录1.什么是py
spark2
.pyspark的特点3.pyspark的优点4.pyspark架构5.pyspark的模块6.pyspark的安装1.什么是pysparkPySpark是一个用Python
coding_xian
·
2023-04-11 03:23
spark
spark
python
分布式
Spark入门(无理论)
win10idea+虚拟机(hadoop2.6.1+
spark2
.1.0)一、环境配置1.win10配置(1)添加JDK1.8、Maven3.3.9、hadoop对应版本插件需要修改的变量环境变量可以是相对路径
码戈
·
2023-04-09 20:36
Windows上配置Python+Spark开发环境
1、配置过程详细配置步骤参考:Windows和PC机上搭建Spark+Python开发环境的详细步骤按照上述配置过程,当采用Anaconda5.1(Python3.6)+java1.7.0_79+
spark2
.0.1
桂小林
·
2023-04-09 04:27
spark
Spark
Python
WordCount
Spark 2.4.0编程指南--Spark DataSources
Spark2
.4.0编程指南–SparkDataSources更多资源github:https://github.com/opensourceteams/spark-scala-maven-2.4.0视频
thinktothings
·
2023-04-09 02:32
Spark
2.4.0
Spark
DataSources
SparkMLib 数据类型 - Data sources
文章目录图数据源
spark2
.4.8介绍怎样在ML中使用数据源来加载数据.除此之外一些常用的数据源像Parquet,CSV,JSON和JDBC,提供了一些专用的数据源.图数据源图数据源被用来加载目录中图文件
大怀特
·
2023-04-09 02:01
AI
bigdata
spark
scala
ml
机器学习
spark 发送数据到 kafka 报错:Cannot Perform operation after producer has been closed
报错原因总结:spark发送到kafka是有生产者线程池的.这个支持的过期策略在
spark2
.4.4之前的策略是:你taskaccess该producer开始计时.如果10min内没有新的access则
健忘主义
·
2023-04-07 00:20
总结
kafka
spark
java
Java-Spark系列3-RDD介绍
文章目录一.RDD概念1.1RDD的特点1.2RDD的核心属性二.RDD概述2.1准备工作2.2初始化
spark2
.3RDD数据集2.3.1并行集合2.3.2外部数据集三.操作RDD3.1基础知识3.2
只是甲
·
2023-04-06 14:49
#
Spark
大数据和数据仓库
spark
java
RDD介绍
Spark编程
搭载英伟达Jetson Orin的Allspark 2全新亮相,算力高达100TOPS!
All
spark2
系列AI边缘计算机All
spark2
经过设计优化的铝合金外壳,内置静音涡轮风扇,散热优秀。尺寸102.5X62.5X31mm,整机重量188g。
阿木实验室
·
2023-04-04 18:22
ROS
软件工具
人工智能
深度学习
Spark中内存模型管理
本文中阐述的原理基于
Spark2
.1版本,阅读本文需要读者有一定的Spark和Java基础,了解RDD、Shuffle、JVM等相关概念
Perkinl
·
2023-04-03 11:26
spark
spark
内存模型管理
PySpark:DataFrame及其常用列操作
为了解决上述问题,从
Spark2
.x开始,RDD被降级为
Sun_Sherry
·
2023-04-03 08:27
PySpark
PySpark
工作中的一些错误解决记录
-19CDHOOZIEUI页面打不开:解决:把下载好的ext-2.2.zip拷贝到Oozie主机的/var/lib/oozie目录下运行命令unzipext-2.2.zip解压(没有包就下载)2)运行
spark2
抱抱抱抱
·
2023-04-03 07:08
错误问题解决记录
使用sbt编译打包,spark-submit命令提交的详细步骤
Spark2
.1.0入门:Spark的安装和使用使用sbt打包Scala程序该程序依赖SparkAPI,因此我们需要通过sbt进行编译打包。请在.
GloomyHarbor
·
2023-04-02 10:45
大数据-scala的使用
java
linux
python
spark
大数据
Spark简介及运行架构
Spark学习网站建议从学习Spark官方文档开始:QuickStart-
Spark2
.1.1DocumentationSparkProgrammingGuide这里有对应的中译版:Spark官方文档-
一碗竹叶青
·
2023-04-02 02:28
BigData
大数据
spark
hadoop
scala
「Spark 从精通到重新入门(一)」Spark 中不可不知的动态优化
我们Erda的FDP平台(FastDataPlatform)也从
Spark2
.4升级到Spark3.0
尔达 Erda
·
2023-03-31 09:54
elasticsearch
单元测试
测试工具
云原生
spark读取elasticsearch数据报scala.collectino.GenTraversableOnce$class错解决办法
scala.collectino.GenTraversableOnce$class错解决办法spark读取elasticsearch数据报scala.collection.GenTraversableOnce$class错解决办法
spark2
.3
土哥呀
·
2023-03-31 01:09
spark
elasticsearch
Spark3每个job之间任务间隔过长
Spark3比CDH的hiveon
spark2
.4.0要快不少。AQE和CBO真的挺强的。但是使用中发现了一个很奇怪的事情。这个问题在网上搜过,并没有实际解决。
黑眼圈@~@
·
2023-03-30 02:28
Spark
hive
hadoop
大数据
spark
iceberg-Spark3.0SQL 测试案例
点击下载
spark2
.4和spark3的驱动包。
黑眼圈@~@
·
2023-03-30 02:57
iceberg
spark 内存管理机制与相关参数调优
spark内存管理文章目录spark内存管理spark1.6内存管理机制
spark2
.0内存管理机制spark3.3.1官方文档spark内存相关参数调优spark1.6内存管理机制https://0x0fff.com
nefu-ljw
·
2023-03-29 15:39
从零开始学大数据
spark
大数据
调优
内存管理
spark读取Jdbc数据
testorg.example1.0-SNAPSHOT4.0.0
spark2
.3.32.11.122.11org.scala-langscala-library${scala.version}org.apache.sparkspark-sql
qzWsong
·
2023-03-29 15:35
spark
spark
java
大数据
Spark2
:运行架构
Spark2
:运行架构一、运行架构1.概念2.运行流程整体流程注意事项二、Spark集群模式三、执行组件1.RDD2.Scheduler3.Storage4.Shuffle5.与Hadoop的区别参考一
是Yu欸
·
2023-03-29 00:42
海量数据处理(hadoop
spark)
笔记
big
data
spark
hadoop
spark消费kafka(cdh启用kerberos)
不生产博客,只是别人博客的裁缝一入kerberos深似海,从此节操是个玩意儿之前写过一篇spark消费kafka问题记录(cdh5.16.2),主要记录了安装
spark2
后,spark的问题,和本地可以执行
hadoop程序猿
·
2023-03-28 22:10
spark
kafka
spark
kafka
kerberos
【大数据基础】2020年美国新冠肺炎疫情数据分析
https://dblab.xmu.edu.cn/blog/2738https://dblab.xmu.edu.cn/blog/2636/spark安装安装
Spark2
.4.0sudotar-zxf~/
仿生程序员会梦见电子羊吗
·
2023-03-28 18:24
信息管理与信息系统
大数据
数据分析
hadoop
spark dataframe 如何保存到本地
在
Spark2
.x里面,可以直接使用以下命令df.write.format("csv").save(filepath)
zy_now
·
2023-03-28 06:00
Spark的部署脚本解读
ApacheSparkisafastandgeneral-purposeclustercomputingsystem.以下分析的是
Spark2
.3.0版本。
一ke大白菜
·
2023-03-25 18:13
springboot mybatis和spark-sql、SDB对接
spark-sql的整合,通过hive-sql实现spark的鉴权和权限控制,并能够通过springboot、mybatis访问spark查询SequoiaDB中的数据,具体部署环境为下:jdk1.8
spark2
.1
YauChungYin
·
2023-03-22 12:02
Sequoiadb学习笔记
数据库
spring
java
Spark2
.11 + Scala2.11.8环境搭建
标题虽然说是搭建,实际只是想记录下搭建过程中遇到的两个问题。首先在本地创建Scala项目。环境搭建:首先通过IntelliJIDEA建立Scala项目(前提是已经安装了Scala),NewProject->Maven->Createfromarchtype->org.scala-tools.archetypes-archetype-simpleimage.png这是需要选择Scala的版本,我使用
橋声
·
2023-03-21 06:54
spark2
-submit参数及调优
[1]本文以
spark2
.3.0版本(onYARN)为主,可以移步
spark2
.3.0官方了解更多。你可以通过:
spark2
-submit--help来查看详细的参数配置说明。
南宋临安府
·
2023-03-20 00:39
Spark2
.x精通:TaskScheduler的Task任务提交源码剖析
问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读接上篇文章:
Spark2
.x精通:Job触发流程源码深度剖析(
大数据开发运维架构
·
2023-03-19 18:04
Spark介绍
Spark是2009年诞生,2014年成为Apache项目,2016年发布了
Spark2
.0,2019年10月Spark3.0预览版,2020年6月18日Spark3.0正式版发布Spark是一个大数据领域的统一分析引擎
ssttIsme
·
2023-03-18 04:20
pyspark系列3-spark核心之RDD介绍
文章目录一.RDD概念1.1RDD的特点1.2RDD的核心属性二.操作RDD2.1PySpark介绍2.2PySpark环境配置2.3PySpark使用2.3.1初始化
Spark2
.3.2初始化RDD2.3.3RDD
只是甲
·
2023-03-15 12:42
大数据和数据仓库
#
Spark
大数据
python
spark
pyspark
RDD
pyspark--报错java.util.NoSuchElementException: key not found: _PYSPARK_DRIVER_CALLBACK_HOST解决
环境Python3.5.2Py
spark2
.4.2hadoop-2.6.0spark-2.2.0-bin-hadoop2.6.tgz运行spark本地报错:解决安装对应版本pysparkpipintsallpyspark
我心依依旧
·
2023-03-15 12:33
大数据
pyspark
Spark2
.1和2.2 SQL物理执行策略关键源码分析
1.文章开始之前先附上一句SQL,使用tpc-ds的表结构,我们围绕这句SQL讲。SQL:SQL>selectavg(cs_ext_discount_amt)fromcatalog_sales,date_dimwhered_datebetween'1999-02-22'andcast('1999-05-22'asdate)andd_date_sk=cs_sold_date_skgroupbycs_
orisonchan
·
2023-03-15 08:15
hadoop2.9.1+
spark2
.3字数统计java实例集群运行(idea)
一搭环境Hadoop2.9.2+
spark2
.3参考https://blog.csdn.net/qazwsxpcm/article/details/78937820二实例运行1打开idea,file-new-project
葡萄超好吃
·
2023-03-15 07:50
Spark3.0分布,Structured Streaming UI登场
imageSpark3.0主要的新特性如下:相比于
Spark2
.4,性能提升了2倍,主要体现在自适应查询执行,动态分区修剪
大数据流动
·
2023-03-14 10:19
Hadoop - SparkSQL
image.pngDataFrame->DataSet
Spark2
.0Codes:exportSPARK_MAJOR_VERSION=2frompyspark.sqlimportSparkSessionfrompyspark.sqlimportRowfrompyspark.sqlimportfunctionsdefloadMovieNames
Xiangyuan_Ren
·
2023-03-13 17:24
ImportError: No module named bson.int64问题排查
背景在基于hadoop集群的
spark2
环境中,使用python编写任务。groupByKeys后,对value进行处理的时候,处理函数fun需要一个参数。
slowrabbit
·
2023-03-12 14:24
Spark2
.4.4安装配置
spark2
.4.4分布式高可用HA配置conf/slaves配置node1node2node3node4conf/spark-env.sh配置#配置JDK安装位置JAVA_HOME=/usr/lib/
陈文瑜
·
2023-03-11 20:58
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他