E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark内存计算
Flink快速入门
大数据处理框架发展史大数据-3v-tpezy-分而治之批处理流处理-微信运动、信用卡月度账单、国家季度GDP增速MPI-节点间数据通信-c和pythonMR-2004谷歌提出的编程范式-hadoop/storm/
spark
WaiSaa
·
2023-12-05 21:30
Java
大数据
flink
大数据
基于Docker搭建
Spark
集群
介绍在MacOS下使用Docker搭建
Spark
集群,进行学习。
_吹灭读书灯_
·
2023-12-05 19:39
Spark
中cache和persist区别
cache和persist的区别基于
Spark
1.4.1的源码,可以看到/**PersistthisRDDwiththedefaultstoragelevel(`MEMORY_ONLY`).
西二旗老司机
·
2023-12-05 18:51
Spark
-03:
Spark
SQL 基础编程
目录1.
Spark
SQL简介2.
Spark
Session3.
Spark
SQL数据的读写3.1读写TXT文件3.2读写CSV文件3.3读写JSON文件3.4读写Parquet文件3.5读写ORC文件3.6
m0_37559973
·
2023-12-05 18:17
Spark
spark
Spark
的五种JOIN策略
JOIN操作是非常常见的数据处理操作,
Spark
作为一个统一的大数据处理引擎,提供了非常丰富的JOIN场景。
大数据学习
·
2023-12-05 16:25
spark
mllib和
spark
ml机器学习基础知识
spark
机器学习
Spark
MLib完整基础入门教程-y-z-f-博客园(cnblogs.com)参考
spark
机器学习简介机械学习是一门人工智能的科学,用于研究人工智能,强调算法,经验,性能开发者任务
厨 神
·
2023-12-05 16:50
大数据
python
spark
黑马一站制造数仓实战1
1.项目目标一站制造企业中项目开发的落地:代码开发代码开发:SQL【DSL+SQL】
Spark
Core
Spark
SQL数仓的一些实际应用:分层体系、建模实现2.内容目标项目业务介绍:背景、需求项目技术架构
ZhaoXiangmoStu
·
2023-12-05 15:20
Python
制造
大数据
spark
无法执行pi_如何验证
spark
搭建完毕
在配置yarn环境下的
spark
时,执行尚硅谷的以下命令发现报错,找不到这个也找不到那个,尚硅谷的代码是bin/
spark
-submit\--classorg.apache.
spark
.examples.
Spark
Pi
Guff_hys
·
2023-12-05 10:57
大数据开发学习
spark
大数据
分布式
spark
sql基于RBO的优化
讲解RBO之前必须对
spark
sql的执行计划做一个简单的介绍。
!@123
·
2023-12-05 10:57
大数据
spark
sql
大数据
【
Spark
基础】-- 理解
Spark
shuffle
目录前言1、什么是
Spark
shuffle?2、
Spark
的三种shuffle实现3、参考前言以前,
Spark
有3种不同类型的shuffle实现。每种实现方式都有他们自己的优缺点。
high2011
·
2023-12-05 10:24
Spark
spark
大数据
分布式
Apache
Spark
Apache
Spark
是一个快速、可扩展、开源的大数据处理框架,采用
内存计算
,具有比HadoopMapReduce更高的性能和更好的扩展性。
m0_64180190
·
2023-12-05 10:24
付费
javascript
html5
开发语言
腾讯式“游戏科技”:理解硬核技术、去游戏化和数字解决方案
在刚刚结束的“
SPARK
2022”腾讯游戏发布会上,腾讯结结实实地秀了一把肌肉。
谈游言戏研究所
·
2023-12-05 10:23
spark
c程序idea调试提示内存不足
Exceptioninthread"main"java.lang.IllegalArgumentException:Systemmemory259522560mustbeatleast471859200.Pleaseincreaseheapsizeusingthe--driver-memoryoptionor
spark
.driver.memoryin
Spark
configuration
超超超超子
·
2023-12-05 09:52
spark
java
Spark
SQL中RDD和DF之间相互转换
packagecom.huc.
spark
Sqlimportorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.sql.
huchao7
·
2023-12-05 06:55
笔记
spark
sql
scala
AI创作ChatGPT网站系统源码保姆级搭建部署教程+支持GPT-4图片对话能力
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-05 05:46
人工智能
ChatGPT
教程
chatgpt
人工智能
midjourney
prompt
ai绘画Midjourney绘画提示词Prompt教程
一、Midjourney绘画工具
Spark
Ai【无需魔法使用】:
Spark
Ai是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT?
白云如幻
·
2023-12-05 05:07
人工智能
教程
AI作画
midjourney
prompt
Flink-Flink及主流流框架比较
是不是听起来很像
spark
?没错,两者都希望提供一个统一功能的计算平台给用户。虽然目标非常类似,但是flink在实现上和
spark
存在着很大的区别,flink是一个面向
lisery_nj
·
2023-12-05 05:19
Flink
大数据开发:Hive on
Spark
设计原则及架构
在
Spark
越来越受到主流市场青睐的大背景下,Hive作为Hadoop生态当中的数仓组件工具,在于
Spark
生态的配合当中,开始有了Hiveon
Spark
的思路,那么具体是怎么实现的呢?
成都加米谷大数据
·
2023-12-05 01:44
从 MapReduce 的运行机制看它为什么比
Spark
慢
在Hadoop1中,MapReduce计算框架即负责集群资源的调度,还负责MapReduce程序的运行。一,MapReduce组成MapReduce的运行过程有三个关键进程:1,大数据应用进程。这是用户启动的MapReduce程序进程,主要是指定Map和Reduce类、输入输出文件路径等,并提交作业给Hadoop集群的JobTracker进程。2,JobTracker进程。这是Hadoop集群的常
stone_zhu
·
2023-12-05 00:36
Spark
读写Oracle性能深度调优
Spark
作为一个分布式计算框架,可以很好的适用于Hadoop。那么
Spark
是否可以与关系型数据库较好的进行兼容呢?以
Spark
作为计算,以关系型数据库(例如Oracle)作为存储?
weixin_43370502
·
2023-12-04 21:16
spark
oracle
数据库
如何理解
Spark
SQL中的partitionColumn, lowerBound, upperBound, numPartitions
如何理解
Spark
SQL中的partitionColumn,lowerBound,upperBound,numPartitions在
Spark
SQL中,读取数据的时候可以分块读取。
肿么肥四啊哈
·
2023-12-04 20:43
Spark
spark
大数据的技术栈-逐步完善
分布式文件系统b.Yarn集群资源管理器c.MapReducesql引擎d.Impalasql引擎e.工具概观2.数据仓库知识a.Hive数据库1)HiveSql2)数据库结构b.Doris数据库3.混合处理框架
SPARK
a.
Spark
b
刘文钊1
·
2023-12-04 20:12
大数据
Spark
- 输出parqute文件
pom.xml4.0.0org.springframework.bootspring-boot-starter-parent2.2.5.RELEASEcom.sp
spark
0.0.1-SNAPSHOT
spark
spark
1.8
是个吃不饱的人
·
2023-12-04 20:39
spark
ajax
大数据
hive sql&
spark
优化
在数据抽取中常用到从其他数据库抽取数据后数据灌入到hive数据库的情况。大体逻辑是,连接源数据库,抽取数据,缓存转换,数据插入到hive数据库(或者直接覆盖db文件)。中间源数据库的效率和代码质量、抽取数据的服务器资源、数据转换的效率、hive数据的插入sql效率等都是限制数据抽取效率的瓶颈,如何在保证系统稳定的情况下,效的优化各阶段的运行速度,从而整体提高数据抽取的效率,是一个比较大的课题。从三
刘文钊1
·
2023-12-04 20:08
#
混合处理框架spark
hive
sql
spark
spark
源码之shuffleManager
shufflemanager的实现类:sortshufflemanager
Spark
0.8及以前HashBasedShuffle在ShuffleWrite过程按照Hash的方式重组Partition的数据
cclucc
·
2023-12-04 18:01
Spark
Spark
ListenerEventprotectedoverridedefdoPostEvent(listener:
Spark
ListenerInterface,event:
Spark
ListenerEvent
zhixingheyi_tian
·
2023-12-04 16:00
spark
javascript
前端
2023最新AI创作系统ChatGPT网站源码+Midjourney绘画+支持GPT-4-Turbo模型+即将支持TSS语音对话功能模块
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-04 13:10
人工智能
AIGC
ChatGPT
chatgpt
人工智能
midjourney
大数据分析与应用实验任务十
大数据分析与应用实验任务十实验目的:通过实验掌握
spark
SQL的基本编程方法;熟悉RDD到DataFrame的转化方法;通过实验熟悉
spark
SQL管理不同数据源的方法。
陈希瑞
·
2023-12-04 12:00
数据分析
spark
spark
的reduceByKey
在进行
Spark
开发算法时,最有用的一个函数就是reduceByKey。
zxfBdd
·
2023-12-04 06:24
大数据
spark
Spark
Streaming反压机制介绍
1.反压机制原理
Spark
Streaming中的反压机制是
Spark
1.5.0推出的新特性,可以根据处理效率动态调整摄入速率。
zxfBdd
·
2023-12-04 06:24
大数据
spark
大数据
分布式
内存垃圾回收
尽管您无法直接在方法调用完成后手动释放内存,但您可以通过一些
Spark
实践来帮助垃圾恢复器更及时地恢复一些不再需要的对象。以下是建
北执南念
·
2023-12-04 05:06
Java基础
java
window环境下 Error response from daemon: Get https://index.docker.io/v1/search?q=openjdk..... timeout
q=
spark
&n=25:dialtcp:lookupindex.docker.ioon192.168.65.1:53:readudp192.168.65.2:4
森森之火
·
2023-12-04 04:20
环境搭建
docker
Hudi-集成
Spark
之
spark
-sql方式
Hudi集成
Spark
之
spark
-sql方式启动
spark
-sql#启动
spark
-sql之前需要先启动Hive的Metastorenohuphive--servicemetastore针对
Spark
3.2
spark
-sql
迷雾总会解
·
2023-12-04 02:01
大数据
数据库
spark
sql
大数据
hudi
flink学习之sql-client之踩坑记录
flink/bin目录下会看到这个脚本,最开始以为是和
spark
-shell差不多的。结果自行摸索无果,网上查的文章也写的很垃圾,自己查官网看下吧。SQL客户端|ApacheFlink直接.
cclovezbf
·
2023-12-04 02:00
flink
flink
学习
大数据
spark
-sql 指定metastore地址、读取mysql
spark
-sql-hive
spark
-sql--databasesrc--hiveconfhive.metastore.uris=thrift://hdp02:2083-e"select*fromsrc_db2
qzWsong
·
2023-12-04 02:00
spark
spark
sql
hive
【
Spark
九十四】
spark
-sql工具的使用
spark
-sql是
Spark
bin目录下的一个可执行脚本,它的目的是通过这个脚本执行Hive的命令,即原来通过hive>输入的指令可以通过
spark
-sql>输入的指令来完成。
axxbc123
·
2023-12-04 02:59
Spark
大数据
数据库
基于
Spark
、NoSQL的实时数据处理实践
本文基于TalkingData张学敏在公司内部KOL的分享主题《基于
Spark
、NoSQL实时数据处理实践》的整理,同时也在DTCC大会上做了同主题的分享。
TalkingData
·
2023-12-04 01:10
【数据中台】开源项目(3)-Linkis
通过使用Linkis提供的REST/WebSocket/JDBC等标准接口,上层应用可以方便地连接访问MySQL/
Spark
/Hive/Presto/Flink等底层引擎,同时实现统一变量、脚本、用户定义函数和资源文件等用户资源的跨上层应用互通
码农丁丁
·
2023-12-03 23:42
#
数据中台
#
大数据
开源
数据中台
Linkis
产品迭代更新 | 阿列夫科技基于Linkis+DataSphere Studio的单机安装部署实战
作者:萧寒GitHubID:hx23840阿列夫科技原来的技术平台是基于Hadoop,
Spark
平台搭建的,为了充分的满足业务需求,做了大量接口封装。
微众开源
·
2023-12-03 23:12
开源
微众开源
大数据
科技
hadoop
大数据
推荐系统大规模特征工程与FEDB的
Spark
基于LLVM优化
今天给大家分享第四范式在推荐系统大规模特征工程与
Spark
基于LLVM优化方面的实践,主要包括以下四个主题。
第四范式开发者社区
·
2023-12-03 18:06
Spark
python
hadoop
spark
大数据
flink
基于hadoop的商品推荐系统_推荐系统大规模特征工程与FEDB的
Spark
基于LLVM优化
今天给大家分享第四范式在推荐系统大规模特征工程与
Spark
基于LLVM优化方面的实践,主要包括以下四个主题。
weixin_39541212
·
2023-12-03 18:05
基于hadoop的商品推荐系统
Javalin:一个轻量的Web Framework
Javalin最初是
Spark
Java的一个分支,后来受到JavaScript框架koa.js的
Java精选
·
2023-12-03 18:23
python
开发语言
ApacheCN 数据科学译文集 20210313 更新
数据科学和机器学习实践指南零、前言一、入门二、统计和概率回顾和Python实践三、Matplotlib和高级概率概念四、预测模型五、Python机器学习六、推荐系统七、更多数据挖掘和机器学习技术八、处理真实数据九、Apache
Spark
布客飞龙
·
2023-12-03 14:48
基于Python和
Spark
的大数据音乐推荐系统的设计与实现
基于Python和
Spark
的大数据音乐推荐系统的设计与实现摘要随着科学技术的发展,人们对服务的要求也越来越高。为了能提高管理者的管理效能,现在的音乐推荐管理必须要脱离复杂的手工管理方式。
程序设计123
·
2023-12-03 13:55
python
大数据
python
spark
IDEA -source 1.5 中不支持 lambda 表达式解决方法
一直在用scala编写
Spark
或者Flink代码,对于Java的lambda表达式一直认为没有前者一直点(".")下去方便,偶然用后者写代码中间出现一些小的设置问题,记录一下:示例代码finalLocalEnvironmentenv
架构师联盟
·
2023-12-03 12:29
2023_
Spark
_实验二十三:Kafka的安装与基本操作
Kafka的安装与基本操作一、前提工作二、Kafka安装三、Kafka基本操作一、前提工作必须安装了zookeeper单机可参考:zookeeper单机安装与配置集群可参考:zookeeper的集群安装二、Kafka安装上传kafka_2.11-2.4.1.tgz到/tools目录下解压安装到/opt/soft_installed/目录下tar-zvxfkafka_2.11-2.4.1.tgz-C
pblh123
·
2023-12-03 12:17
Spark实验
spark
kafka
大数据
Spark
经典案例分享
Spark
经典案例链接操作案例二次排序案例链接操作案例案例需求数据介绍代码如下:packagebase.charpter7importorg.apache.hadoop.conf.Configurationimportorg.apache.hadoop.fs
pblh123
·
2023-12-03 12:45
Spark
spark
element-ui 文件上传组件添加 MD5编码参数
md5编码使用的依赖为
spark
-md5.js参考了csdn上的一篇文章:基于vue框架下使用Element-UI获取文件MD5值并上传。
十万个维他奶
·
2023-12-03 11:31
【
Spark
基础】-- RDD、DataFrame 和 Dataset 的对比
目录一、简要介绍RDD、DataFrame和DataSet1、RDD1.1什么是RDD?1.2RDD的五大特性是什么?
high2011
·
2023-12-03 09:38
Spark
spark
大数据
分布式
【数据中台】开源项目(5)-Amoro
AmoroisaLakehousemanagementsystembuiltonopendatalakeformats.WorkingwithcomputeenginesincludingFlink,
Spark
码农丁丁
·
2023-12-03 08:05
#
大数据
#
数据中台
开源
数据中台
Amoro
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他