E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
——Spark
Mac中Dbeaver启动时报错:“fail to create java virtual machine”
看到这个信息想起来上周刚在本机上安装了Hadoop,
Spark
,过程中有新下载了JDK,有可能是Java版本问题。遇到环境问题,也没有诀窍,就是网上搜索各位前辈的解决方案。
数据分析师之家
·
2023-11-04 01:46
工具使用
java
macos
jvm
SeaTunnel安装及测试
一.简介架构于
Spark
和Flink之上的分布式的支持海量数据实时同步的高性能分布式数据集成平台官网:http://seatunnel.incubator.apache.org/Gitee:https:
小小大数据
·
2023-11-04 01:59
SeaTunnel
大数据
5.
Spark
Core-
Spark
经典案例之数据排序
业务场景:数据排序1、”数据排序”是许多实际任务执行时要完成的第一项工作,比如学生成绩评比、数据建立索引等。这个实例和数据去重类似,都是先对原始数据进行初步处理,为进一步的数据操作打好基础。1)、需求描述对输入文件中数据进行排序。输入文件中的每行内容均为一个数字,即一个数据。要求在输出中每行有两个间隔的数字,其中,第一个代表原始数据在原始数据集中的位次,第二个代表原始数据。2)输入文件file1:
__元昊__
·
2023-11-03 22:07
Spark
的主要概念
文章目录博主介绍本文内容1.RDD2.
Spark
SQL3.
Spark
Streaming4.MLlib5.GraphX总结文章总结博主目标博主介绍我是廖志伟,一名Java开发工程师、Java领域优质创作者
我是廖志伟
·
2023-11-03 18:49
#
大数据开发
spark
大数据
分布式
sortByKey()
一定会有shuffer作用:在一个(K,V)的RDD上调用,K必须实现Ordered接口,返回一个按照key进行排序的(K,V)的RDDpackagecom.atguiguimportorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
比格肖
·
2023-11-03 15:26
Spark
学习
本片简单的介绍如何使用
Spark
,我们将首先通过
Spark
的交互式shell(在Python或Scala中)介绍API。然后介绍如何使用Scale和python编写应用程序。
Liam_ml
·
2023-11-03 14:20
Flink、Flink SQL学习笔记
文章目录碎碎念1.Flink的特点1.1Flinkvs
Spark
Streaming2.Java快速使用3.Flink部署模式3.1Standalone模式3.2yarn模式1.SesstionCluster
东河西
·
2023-11-03 13:07
大数据
flink
java
大数据学前准备--zookeeper详解与集群搭建(保姆级教程)
我将陆续发布大数据阶段所学,包括但不限于(hadoop,hive,hbase,phoneix,flume,bdeaver,kafka,
spark
,kylin,flink,azkaban)。
毫无感情的dj
·
2023-11-03 09:37
java-zookeeper
zookeeper
java
Spark
学习(四):Array和ArrayBuffer
主要内容摘自博文,点击阅读原文Array定义定长数组,ArrayBuffer定义变长数组上代码,一看就懂:importscala.collection.mutable.ArrayBufferobjectArrayAndArrayBuffer{defmain(args:Array[String]):Unit={//定义Array方式一:valary1=newArray[Int](5)//长度为5的整
CocoMama190227
·
2023-11-03 06:38
4、
Spark
概要
spark
任务后期再计算的时候,job的输出结果可以保存在内存中,后
Tu_jc
·
2023-11-03 05:08
Scala零基础教学【61-80】
第61讲:Scala中隐式参数与隐式转换的联合使用实战详解及其在
Spark
中的应用源码解析第62讲:Scala中上下文界定内幕中的隐式参数与隐式参数的实战详解及其在
Spark
中的应用源码解析/***Scala
weixin_30393907
·
2023-11-03 04:29
scala
java
javascript
ViewUI
怦然心动系列
最近看了《麻理惠的整理秘诀》,一个单词深深印在我脑海里“
Spark
Joy”,中文翻译“怦然心动”。整理的终极秘诀就是,家里只留下那些让我们怦然心动的东西。
裴莉莉
·
2023-11-03 04:45
Py
spark
_ML_线性回归_决策树回归
Py
spark
_ML_线性回归_决策树回归回归模型1,线性回归2,决策树回归回归模型Mllib支持常见的回归模型,如线性回归,广义线性回归,决策树回归,随机森林回归,梯度提升树回归,生存回归,保序回归。
Elvis_hui
·
2023-11-03 03:01
机器
PySpark
决策树
回归
线性回归
Spark
性能优化之Java虚拟机垃圾回收调优
一、Java虚拟机垃圾回收调优的背景如果在持久化RDD的时候,持久化了大量数据,那么Java虚拟机的垃圾回收就可能成为一个性能瓶颈。因此Java虚拟机会定期进行垃圾回收,此时就会追踪所有java对象,并且在垃圾回收时,找到那些已经不存在使用对象,然后清理旧对象,来给新的对象腾出内存空间。垃圾回收的性能开销,是跟内存中的对象的数量成正比的,所以对于垃圾回收的性能问题,首先要做的是使用更高效的数据结构
有一束阳光叫温暖
·
2023-11-03 00:07
大数据四大阵营之OLTP阵营(上)
**·OLTP(在线事务、交易处理):RDBMS、NoSQL、NewSQL·OLAP(在线分析处理):MapReduce、Hadoop、
Spark
等·MPP(大规模并行处理):Greenplum、TeradataAster
Ultipa
·
2023-11-03 00:24
老孙解密大数据
数据库
大数据
数据挖掘
神经网络
机器学习
最新ChatGPT商业运营系统源码+支持GPT4/支持ai绘画+支持Midjourney绘画
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-02 22:03
人工智能
软件源码
ChatGPT
chatgpt
AI作画
midjourney
人工智能
大数据毕业设计选题推荐-系统运行情况监控系统-Hadoop-
Spark
-Hive
✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、部分代码设计五、论文参考六、系统视频结语一、前言随着信息化时代的快
IT毕设梦工厂
·
2023-11-02 21:51
大数据项目
大数据
毕业设计
选题推荐
Hadoop
Spark
Hive
VM虚拟机
idea好用插件整理
1、AlibabaJavaCodingGuidelines阿里巴巴编码格式规范2、BigDataTools大数据开发工具,是一个集成
Spark
且支持编辑和运行ZeppelinNotebooks的IntelliJIDEA
静心得意,天下迎春
·
2023-11-02 19:27
intellij-idea
java
ide
理论学习--【Hadoop生态原理学习】
Mahout2.版本1.0mapreduce还进行资源调度2.0mapreduce=yarn(资源调度)+mapreduce(进行计算运行在yarn上),HDfs:nn,ha2.1.2yarn还支持strom、
spark
zenas_yuan
·
2023-11-02 18:31
Hadoop
hadoop
spark
只基于内存计算
但是
spark
是不是只基于内存计算呢?答案是否定的。
scandly
·
2023-11-02 17:46
Spark
RDD dataframe嘿嘿
RDD(ResilientDistributedDatasets)可扩展的弹性分布式数据集,RDD是
spark
最基本的数据抽象,RDD表示一个只读、分区且不变的数据集合,是一种分布式的内存抽象,与分布式共享内存
南师大蒜阿熏呀
·
2023-11-02 15:19
spark
java
ubuntu
Pytorch基础代码实战系列之定义一个简单的卷积神经网络
深度学习框架Pytroch系列注:大家觉得博客好的话,别忘了点赞收藏呀,本人每周都会更新关于人工智能和大数据相关的内容,内容多为原创,PythonJavaScalaSQL代码,CVNLP推荐系统等,
Spark
FlinkKafkaHbaseHiveFlume
陈万君Allen
·
2023-11-02 14:52
Python和人工智能
pytorch
cnn
人工智能
Spark
的那些事(二)Structured streaming中Foreach sink的用法
Structuredstreaming默认支持的sink类型有Filesink,Foreachsink,Consolesink,Memorysink。特别的说明一下Foreachsink的用法(ps:以通过Foreachsink写入外部redis为例)。lastEtlData.writeStream().foreach(newTestForeachWriter()).outputMode("upd
假文艺的真码农
·
2023-11-02 14:01
Mac 搭建 py
spark
各类疑难杂症解决
安装所需要的包:参考这几篇文章进行安装需要的包,并进行安装流程MACOS如何安装Py
Spark
mac下搭建py
spark
环境InstallingApache
Spark
onMacOS在安装以下文件时都出现了一些小问题
Trance_Fu63
·
2023-11-02 14:57
Mac
OS
X
数据分析
python
spark
2019-12-04
spark
简单代码测试
CreateFromArchetype)安装scala插件image.png删除项目的java目录,新建scala并设置源文件夹image.png4.添加scalaSDKimage.png添加依赖4.0.0com.ganymede
spark
platformstudy1.0
basicGeek
·
2023-11-02 11:38
spark
源码之任务提交过程
一般在命令行我们会以
spark
-submit来提交自己的代码,并会以这个形式提交.
机器不能学习
·
2023-11-02 09:19
Spark
IDEA环境搭建
创建Maven项目增加Scala插件添加依赖关系基本连接与关闭创建Maven项目创建新的maven删除src目录创建
spark
.core工程文件增加Scala插件
Spark
由Scala语言开发的,所以本课件接下来的开发所使用的语言也为
open_test01
·
2023-11-02 09:20
Spark
spark
scala
大数据
在IDEA运行
spark
程序(搭建
Spark
开发环境)
建议大家写在Linux上搭建好Hadoop的完全分布式集群环境和
Spark
集群环境,以下在IDEA中搭建的环境仅仅是在window系统上进行
spark
程序的开发学习,在window系统上可以不用安装hadoop
wanglingli95
·
2023-11-02 09:17
大数据开发
intellij-idea
java
ide
spark
大数据
搭建环境05:部署
Spark
-Standalone模式
目录1.部署所需环境2.集群规划3.解压,配置环境变量5.配置Master6.配置Worker7.配置历史服务8.分发
Spark
到其他worker服务器9.配置第二台服务器的
Spark
10.配置第三台服务器的
m0_37559973
·
2023-11-02 08:56
#
02-环境搭建
Spark
spark
大数据
分布式
如何使用Hive集成Solr?
(1)简单:如果单纯的使用Hadoop编程或者
Spark
编程来构建索引,当然也
三劫散仙
·
2023-11-02 08:55
hive
solr
hive
solr
elasticsearch
全文检索
2018最新大数据的核心技术——
spark
的详细介绍
Spark
性能优化概述
Spark
是基于内存的大数据计算,需要进行性能优化原因是CPU、内存、网络带宽出现了瓶颈。
大数据客栈yi
·
2023-11-02 05:52
centos 搭建 zookeeper 高可用集群
zookeeper-ha主机名IP地址
spark
01192.168.171.101
spark
02192.168.171.102
spark
03192.168.171.1031.升级内核和软件yum-yupdate2
李昊哲小课
·
2023-11-02 05:36
Hadoop
大数据
Zookeeper
centos
zookeeper
linux
大数据
数据分析
CentOS 搭建 Hadoop3 高可用集群
HadoopFullyDistributedMode完全分布式
spark
101
spark
102
spark
103192.168.171.101192.168.171.102192.168.171.103namenodenamenodejournalnodejournalnodejournalnodedatanodedatanodedatanodenodemanagernodemanagernodem
李昊哲小课
·
2023-11-02 05:58
Hadoop
大数据
数据分析
centos
linux
运维
大数据
hadoop
利用文件模拟数据表
importorg.apache.
spark
.
Spark
Confimportorg.apache.
spark
.sql.
Spark
Sessionobject
Spark
App{defmain(args:Array
Jorvi
·
2023-11-02 05:20
spark
源码阅读RDD(一)
1.RDD分布式数据集合,静态模型,解决规划的问题,RDD被运行起来后才解决实际的问题,对应两个操作transformationaction2.
spark
接收到作业后的运行流程(1)RDD之间宽窄依赖分析
line_book
·
2023-11-02 04:55
【
Spark
】What is the difference between Input and Shuffle Read
Spark
调参过程中保持每个task的input+shuffleread量在300-500M左右比较合适The
Spark
UIisdocumentedhere:https://
spark
.apache.org
TaiKuLaHa
·
2023-11-02 04:42
spark
大数据
分布式
08
Spark
R (R on
Spark
)
转载请注明出处,谢谢合作~暂时没用到,留个占位符,以后来填~
Spark
R(Ron
Spark
)
Whaatfor
·
2023-11-02 03:39
seatunnel同步Mysql至Hive
使用场景海量数据同步海量数据整合具有海量数据的ETL海量数据聚合多源数据处理特点简单易用,配置灵活,低代码开发实时流式传输离线多源数据分析高性能、海量数据处理能力模块化和插件机制,易于扩展支持SQL数据处理和聚合支持
Spark
帅骚贯彻一生
·
2023-11-01 21:49
spark
hive
mysql
hadoop
seatunnel
Avro序列化Java中 的BigDecimal
背景由于业务需要,需要将
Spark
SQL中Array、Map、Struct使用avro序列化成一个大的字节数组进行存储。
TMH_ITBOY
·
2023-11-01 18:42
Spark
java
avro
bigdecimal
SparkSQL
Intellij之
Spark
Scala开发环境搭建
https://www.jianshu.com/p/200473f264bchttps://blog.csdn.net/a2011480169/article/details/52712421参考博客:1、http://wwwlouxuemingcom.blog.163.com/blog/static/20974782201321953144457/2、http://blog.csdn.net/s
张明洋_4b13
·
2023-11-01 17:36
spark
streaming 与kafaka结合 低阶 高阶api的一些理解
1.createStream会使用Receiver;而createDirectStream不会,数据会通过driver接收。2.createStream使用Receiver源源不断的接收数据并把数据交给ReceiverSupervisor处理最终存储为blocks作为RDD的输入,从kafka拉取数据与计算消费数据相互独立;而createDirectStream会在每个batch拉取数据并就地消费
搞什么呀
·
2023-11-01 15:44
如何基于 vue3+el-upload 二次封装上传文件组件到阿里云 oss(附上传进度条)
如何基于vue3+el-upload二次封装上传文件组件到阿里云oss附进度条一、创建生成全局唯一标识符方法二、导入计算文件Md5(
spark
-md5)三、安装依赖ali-oss四、创建导出ali-oss
Gik99
·
2023-11-01 14:25
vue3
阿里云
vue
流计算处理系统入门
需要时候使用Hive查询
spark
:微批处理框架。将流数据分割成一系列微小的批处理作
叩钉吧zz
·
2023-11-01 13:42
知识点总结
hadoop
big
data
spark
Kafka基本原理、生产问题总结及性能优化实践 | 京东云技术团队
)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、Storm/
Spark
京东云技术团队
·
2023-11-01 13:07
云服务
硬核干货
kafka
京东云
分布式
最新ai系统ChatGPT程序源码+详细搭建教程+以图生图+Dall-E2绘画+支持GPT4+Midjourney绘画
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-01 10:17
程序源码
人工智能
教程
人工智能
chatgpt
prompt
AI作画
midjourney
2.
Spark
的工作与架构原理
概述目标:
spark
的工作原理
spark
数据处理通用流程rdd什么是rddrdd的特点
spark
架构
spark
架构相关进程
spark
架构原理
spark
的工作原理
spark
的工作原理,如下图图中中间部分是
流月up
·
2023-11-01 10:05
spark
spark
大数据
工作原理
架构原理
最新Ai智能创作系统源码V3.0,AI绘画系统/支持GPT联网提问/支持Prompt应用+搭建部署教程
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-01 10:25
人工智能
ChatGPT
软件源码
人工智能
AI作画
gpt
chatgpt
AI写作
2023最新ChatGPT商业运营系统源码+支持GPT4/支持ai绘画+支持Midjourney绘画
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-01 10:51
软件源码
人工智能
ChatGPT
chatgpt
AI作画
midjourney
人工智能
AI写作
hive的udf通过Waterdrop把hive的数据抽到ClickHouse
1,因业务需要把hive的数据通过WaterDrop抽取到clickhouse,但是每次都要写配置文件,故写一个配置文件自动生成配置信息.1,版本信息: waterdrop版本:1.5.0
spark
版本
wppwpp1
·
2023-11-01 07:53
clickhouse
HQL
UDF
Spark
SQL & ClickHouse RoaringBitmap使用实践
ClickHouse简介RoaringBitmap(RBM)原理ClickHouse中使用RBM存在的问题RoaringBitmap(RBM)定制序列化实现ClickHouse中RoaringBitmap的结构解析
Spark
涛声依旧(竞涛)
·
2023-11-01 07:17
spark
spark
clickhouse
roaringbitmap
bitmap
uv
上一页
52
53
54
55
56
57
58
59
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他