E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
——Spark
Scala - 反射动态创建方法
有时候我们想定义一个字符串的方法,然后通过scala的动态创建class,然后反射调用方法,在很多情景下是在学有用的,比较动态自定义
spark
的mapParations,当然了,每个人的需求都不一样,但是底层原理是一样的
kikiki5
·
2023-09-24 13:18
Arduino 常用mems麦克风
SPM1423M5的stick上用了这个芯片,i2S接口INMP441这个是淘宝上最常见的mems麦克风模块用的型号,i2S接口SPH0645LM4H这个是adafruit用的,i2S接口ICS-40180这个是
spark
fun
剑山
·
2023-09-24 10:53
Spark
学习笔记(三):使用Java调用
Spark
集群
我搭建的
Spark
集群的版本是2.4.4。在网上找的maven依赖,链接忘记保存了。。。。
bluesnail95
·
2023-09-24 09:24
Reduce)
spark
Apache Kafka学习笔记
它与ApacheStorm和
Spark
非常好地集成,用于实时流式数据分析。优点可靠性:Kafka是分布式,分区,复制和容错的可扩展性:Kafka消息传递系统轻松缩放,无
wch853
·
2023-09-24 09:53
大数据开发工程师的面试题
大数据开发工程师的面试题通常包括:1.对大数据技术的理解;2.如何使用Hadoop构建大数据系统;3.如何使用MapReduce来处理大数据;4.如何使用
Spark
分析大数据;5.如何使用NoSQL数据库构建大数据系统
高天艳阳
·
2023-09-24 08:00
大数据
hadoop
mapreduce
hdfs
spark
大数据高级开发面试题总结及答案汇总之[
Spark
系列](持续更新中)
目录1.
Spark
架构与作业提交流程2.
Spark
提交作业参数3.RDD属性4.
Spark
算子5.Repartition和Coalesce区别
Adobee Chen
·
2023-09-24 08:58
大数据高级开发面试知识点总结
大数据
spark
分布式
spark
中结合源码理解reduceByKey、groupByKey、combineByKey等几个ByKey算子的区别
源码版本:py
spark
==3.1.21.combineByKey2.reduceByKey3.groupByKey4.aggregateByKey5.foldByKey总结1.combineByKeydefcombineByKey
atwdy
·
2023-09-24 08:50
Spark
spark
reduceByKey
groupByKey
combineByKey
大数据
Fei
Spark
| 变化之觉
夏日一到耳边更多传来知了声声人的记忆似乎总是和温度在一起一到夏日不知是知了先叫了起来还是我们先感受到高温逐渐夏日越来越正式一点一点在靠近盛夏不管怎样高温和知了声都来到了我们身边四季的演变过程就好像大自然在幕后导演一点一点的变化细细体会奇妙无比此时的体会和小时候或过去任何时候体会到的都大不相同有各自不同的味道还有因温度勾起的记忆发现特别喜欢逐渐进入夏日的感觉这就像在体会一种渐变感无论是大自然的色彩变
Cynthia雯霏
·
2023-09-24 06:35
Py
spark
+TIDB
kettle数据库连接测试视图主对象树->转换->右键新建->直接快捷键Ctrl+S另存为test.ktr(自定义后缀,这里建议使用.ktr)选中DB连接,操作验证相关数据库是否能正确连接,这里以MySQL数据库为例。Kettle作业和转换转换:一般文件后缀命名为.ktr,单表迁移数据,构建表输入(读取数据),表输出(写入数据),Linux下使用kitchen.sh脚本调用执行作业:文件后缀为.k
haobu枳
·
2023-09-24 04:19
大数据
Spark
UnsafeShuffleWriter写流程分析
Spark
的UnsafeShuffleWriter是Tungsten-Project(内存管理)引入的新的ShuffleWriter。
WestC
·
2023-09-24 02:25
如何基于RDD方式完成DataFrame的代码构建?
将RDD转换为DataFrame方式1:调用
spark
#首先构建一个RDDrdd[(name,age),()]rdd=sc.textFile("../data/sql/people.txt").
传智教育
·
2023-09-23 21:01
python
7.4-IngestPipeline&PainlessScript
进⾏Aggregation统计PUTtech_blogs/_doc/1{"title":"Introducingbigdata......","tags":"hadoop,elasticsearch,
spark
落日彼岸
·
2023-09-23 20:01
spark
技术架构、工作机制,及安装使用
1、
spark
是什么?
Spark
是基于内存计算的,分布式大数据分析引擎,用于管理文本、图表等不同性质数据集,批量和实时流运算的大数据处理的需求。
沉思的雨季
·
2023-09-23 18:26
spark
本地测试报错:java.lang.NoClassDefFoundError: org/apache/
spark
/sql/
Spark
Sessio
spark
maven项目本地测试报错:Error:AJNIerrorhasoccurred,pleasecheckyourinstallationandtryagainExceptioninthread"main"java.lang.NoClassDefFoundError
万事于足下
·
2023-09-23 18:09
一些错误
Spark
spark
org.apache.
spark
.
Spark
Exception: A master URL must be set in your configuration
spark
maven项目本地测试报错:org.apache.
spark
.
Spark
Exception:AmasterURLmustbesetinyourconfiguration原因是没有指定master
万事于足下
·
2023-09-23 18:09
Spark
一些错误
spark
2023-2024年最新大数据学习路线
阶段案例实战大数据核心基础*02*阶段案例实战千亿级数仓技术*03*阶段项目实战PB级内存计算04阶段项目实战亚秒级实时计算*05*阶段项目实战大厂面试*06*2023-2024年最新大数据学习路线新路线图在
Spark
Maynor996
·
2023-09-23 17:08
大数据
学习
开发语言
数据库
Spark
-streaming-kafka
最近在用
spark
-streaming-kafka遇到的问题问题1Therearesomemessageswhosesizeislargerthanthefetchsize1048576andhencecannotbeeverreturned.Increasethefetchsize
非ban必选
·
2023-09-23 16:45
Kafka
Spark
全分布部署和HA
全分布部署配置文件:conf/
spark
-env.shexportJAVA_HOME=/root/training/jdk1.7.0_75export
SPARK
_MASTER_HOST=
spark
1export
SPARK
_MASTER_PORT
一个人一匹马
·
2023-09-23 15:43
大数据项目连接工具类JDBCUtil、HBaseUtil、MyKafkaUtil、
Spark
Util,四大工具类代码分享
一、项目分层开发**好处**:代码重用:通过将项目分解为多个层次,可以在不同的层次上重用代码,减少重复工作。模块化:每个层次负责特定的功能,使得代码更易于维护和扩展。降低耦合度:各层次之间的依赖关系降低,有利于团队协作和项目的可维护性。提高可读性和可理解性:通过明确的层次结构,可以更容易地理解代码的功能和实现。便于测试和调试:各层次可以独立进行测试和调试,提高了开发效率。二、项目中Util工具类有
严同学正在努力
·
2023-09-23 14:50
大数据Spark
大数据
开发语言
spark
scala3.1.2
测试工具
数据库
maven-shade-plugin插件打包异常解决方案
:[ERROR]Failedtoexecutegoalorg.apache.maven.plugins:maven-shade-plugin:2.4.3:shade(default)onproject
spark
-workcount
樱花庄青山七海
·
2023-09-23 14:54
异常
maven
idea
打包
异常处理
Apache Beam 2.50.0发布,该版本包括改进功能和新功能
亮点
Spark
3.2.2被用作
Spark
运行程序的默认版本(#23804)。GoSDK新增默认本地运行程序,名为Prism(#24789)。
csdn_linuxprobe
·
2023-09-23 12:22
apache
Spark
性能调优-RDD算子调优篇(深度好文,面试常问,建议收藏)
如下图所示:RDD的重复计算对上图中的RDD计算架构进行修改,得到如下图所示的优化结果:RDD架构优化2.尽早filter获取到初始RDD后,应该考虑尽早地过滤掉不需要的数据,进而减少对内存的占用,从而提升
Spark
废柴程序员
·
2023-09-23 11:13
spark
运行报错:java.lang.IllegalArgumentException: Unsupported class file major version 55
项目场景:提示:这里简述项目相关背景:例如:项目场景:用win10启动
spark
,启动没有问题,问题描述:执行数据分析时报错了:报错如下原因分析:提示:这里填写问题的分析:可能是jdk的版本问题,我用的是
空气城堡
·
2023-09-23 08:52
spark
spark
Spark
(八) scala中的Option、Some、None
一、避免null的使用大多数语言都有一个特殊的关键字或者对象来表示一个对象引用的是“无”,在Java,它是null。在Java里,null是一个关键字,不是一个对象,所以对它调用任何方法都是非法的。但是这对语言设计者来说是一件令人疑惑的选择。为什么要在程序员希望返回一个对象的时候返回一个关键字呢?二、Scala的Option的类型Option是针对Map等集合操作的为了让所有东西都是对象的目标更加
文子轩
·
2023-09-23 08:53
如何学习大数据:
spark
发布程序
一、对于
spark
程序只是用于默认的
spark
包的情况直接点击pcakage将程序进行在linux当中进行发布客户端模式:测试
spark
-submit--classcom.keduox.App\--masteryarn
卿卿老祖
·
2023-09-23 08:23
Spark
【分区与并行度】
RDD并行度和分区
Spark
ConfsetMaster("local[*]")我们在创建
Spark
Context对象时通常会指定
Spark
Conf参数,它包含了我们运行时的配置信息。
让线程再跑一会
·
2023-09-23 06:21
Spark
spark
windows
java
Spark
SQL【基于泰坦尼克号生还数据的
Spark
数据分析处理】
前言昨天实验课试着做了一个
Spark
SQL小案例,发现好多内容还是没有掌握,以及好多书上没有的内容需要学习。
让线程再跑一会
·
2023-09-23 06:50
Spark
数据分析
spark
Spark
SQL【电商购买数据分析】
Spark
数据分析(Scala)importorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.sql.
让线程再跑一会
·
2023-09-23 06:18
Spark
spark
sql
数据分析
Spark
DataFrame
DataFrame它不是
spark
sql提出来的,而是早期在R、Pandas语言就已经有了的DataSet:ADataSetisadistributedcollectionofdata.
捕猎者
·
2023-09-23 06:38
虚幻引擎资产管理总结
【U
Spark
le专栏】如果你深怀绝技,爱“搞点研究”,乐于分享也博采众长,我们期待你的加入,让智慧的火花碰撞交织,让知识的传递生生不息!
UWA
·
2023-09-23 04:28
U
Sparkle
精华来稿
虚幻
游戏引擎
unreal
engine
asset
Flink(1.12版本)
spark
和Flink的对比:事件驱动、时间语义、没有共享组:slot个数=最大算子的并行度共享组:slot的个数=组内最大算子的并行度之和一、Flink的重要特点1.1分层API1.2Flink与
Spark
Loreeta
·
2023-09-23 02:17
flink
big
data
spark
Flink
①.Task和OperatorChainFlink是⼀个分布式流计算引擎,该引擎将⼀个计算job拆分成若⼲个Task(等价于
Spark
中的Stage),每个Task都有⾃⼰的并⾏度,每个并⾏度都由⼀个线程表示
纯净天空7
·
2023-09-23 00:33
Flink
flink
datax同步数据翻倍,.hive-staging 导致的问题分析
二、环境Hive版本2.1.1三、分析3.1.hive-staging_hive产生的原因通过
Spark
SQL、HiveSQL、Hue等提交SELECT或者INSERTOVERWRIT
程序员小陶
·
2023-09-23 00:28
大数据进击之路
大数据
hive
bug
hadoop
大数据学习指南
一篇文章彻底弄懂零拷贝底层原理
前言零拷贝是网络编程的关键,很多性能优化都离不开零拷贝,很多优秀的开源框架底层都用的零拷贝,如Netty、RocketMQ、
Spark
等正文1.再看IO在深入零拷贝机制之前,先来了解下传统BIO通信底层发生了什么
CoderBruis
·
2023-09-22 23:19
面试官别再问我系列
java
零拷贝
spark
Structured报错解决
报错,不想看原因的直接去解决方案试试Exceptioninthread"main"java.lang.IllegalArgumentException:Pathname/C:/Users/Administrator/AppData/Local/Temp/1/temporary-611514af-8dc5-4b20-9237-e5f2d21fdf88/metadatafromhdfs://maste
谷新龙001
·
2023-09-22 23:37
spark
异常报错
如何使用python将
Spark
数据写入ElasticSearch
这里以将Apache的日志写入到ElasticSearch为例,来演示一下如何使用Python将
Spark
数据导入到ES中。
Alien_Swordsman
·
2023-09-22 23:53
Docker安装与镜像的使用
大数据技术AIFlink/
Spark
/Hadoop/数仓,数据分析、面试,源码解读等干货学习资料102篇原创内容公众号1、docker简介=============1.1什么是dockerdocker官网地址
hyunbar
·
2023-09-22 22:08
大数据
docker
容器
运维
Spark
(一): 基本架构及原理
Apache
Spark
是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm
麦子星星
·
2023-09-22 19:27
Ubuntu18.04安装JupyterNotebook
目录安装Anaconda配置JupyterNotebookJupyterNotebook与Py
spark
交互参考网站:林子雨《
Spark
编程基础》官网电脑太垃圾了,可能不久要换个新的,就把基本的命令搬了一下
LittleFish0820
·
2023-09-22 19:25
Spark学习
spark
linux
spark
structedStreaming是如何实现容错的
sss如何实现eoc的
spark
structedStreaming简称sss,它主要还是采用微批的模式提供端到端的eoc(exactly-once)语义,要实现eoc,需要3方面保证,一个是可以replay
hongshen
·
2023-09-22 16:09
M2 MacbookPro配置
Spark
源码运行环境
版本信息MacBook:MacBookProM2JDK:1.8.0_381Scala:2.12.15Maven:3.6.3Homebrew:4.1.12(可选,下载Git需要)Git:2.42.0(下载
Spark
&再见萤火虫&
·
2023-09-22 14:32
spark
大数据
分布式
大数据——
Spark
SQL
1、
Spark
SQL是什么
Spark
SQL是
Spark
中用于处理结构化数据的一个模块,前身是Shark,但本身继承了前身Hive兼容和内存列存储的一些优点。
AIGC人工智残
·
2023-09-22 14:56
大数据
大数据
spark
sql
spark
报错:
Spark
Context: Error initializing
Spark
Context
原本以为这个错误是找不到URL地址,不能使用local[*]这种模式,后来发现这个错误的根本是在上一行,也就是:
Spark
Context:Errorinitializing
Spark
Context原因是初始化
啊帅和和。
·
2023-09-22 12:49
出错记录。
Spark专栏。
spark
大数据技术学习:弹性分布式数据集RDD
一、RDD定义RDD(ResilientDistributedDataset)叫做分布式数据集,是
Spark
中基本的数据抽象,它代表一个不可变(数据和元数据)、可分区、里面的元素可并行计算的集合。
QFdongdong
·
2023-09-22 12:17
来看看基于Kubernetes的
Spark
部署完全指南
本文是在Kubernets上搭建
Spark
集群的操作指南,同时提供了
Spark
测试任务及相关的测试数据,通过阅读本文,你可以实践从制作
Spark
镜像、搭建
Spark
容器集群,到在集群上运行测试任务的完整流程
老率的IT私房菜
·
2023-09-22 12:04
BD就业复习第五天
1.核心组件的优化:hive、
spark
、flink针对Hive、
Spark
和Flink这三个核心组件,以下是它们的优化和一些常见面试题以及详细的回答:1.Hive优化面试问题1:什么是Hive?
密斯特.张先生
·
2023-09-22 12:48
数据仓库
Scala学习 一(变量、数据类型、操作符和表达式)
和静态类型语言java.scala(变量a的数据类型:编译阶段确定的)基于JVM(aa.scala->aa.class(java))->JVM为什么要学(1)速度快(2)优雅(3)融入大数据生态圈,为了深入学习
spark
IT蔡
·
2023-09-22 10:27
Py
spark
RDD 概念 属性,如何创建RDD Py
spark
(一)
什么是RDDRDD(ResilientDistributedDataset)叫做分布式数据集,是
Spark
中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。
songhao8080
·
2023-09-22 09:27
132、
Spark
核心编程进阶之yarn模式下日志查看
在yarn模式下,
spark
作业运行相关的executor和ApplicationMaster都是运行在yarn的container中的一个作业运行完了以后,yarn有两种方式来处理
spark
作业打印出的日志第一种是聚合日志方式
ZFH__ZJ
·
2023-09-22 09:19
User class threw exception: java.lang.NoSuchMethodError: scala.Predef$.ArrowAssoc(Ljava/lang/Obje...
Spark
在hadoop上运行时出现异常Userclassthrewexception:java.lang.NoSuchMethodError:scala.Predef$.ArrowAssoc(Ljava
仩渧哋寵
·
2023-09-22 08:09
上一页
74
75
76
77
78
79
80
81
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他