E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据处理Spark
当发送“Hello,World”时,channel发生了什么?
Cassandra-nosql数据库
Spark
-大数据分布式计算框架Hadoop-大数据
仙草不加料
·
2023-12-05 22:53
netty
java
网络编程
Java
大数据处理
框架推荐:处理大数据的工具推荐
随着互联网的快速发展和数据的爆炸增长,
大数据处理
成为了当今时代的一个重要课题。对于企业来说,如何高效地处理和分析海量数据,成为了提升竞争力和业务发展的关键。
C红毛丹
·
2023-12-05 22:12
java
大数据
开发语言
Flink快速入门
1、
大数据处理
框架发展史大数据-3v-tpezy-分而治之批处理流处理-微信运动、信用卡月度账单、国家季度GDP增速MPI-节点间数据通信-c和pythonMR-2004谷歌提出的编程范式-hadoop
WaiSaa
·
2023-12-05 21:30
Java
大数据
flink
大数据
基于Docker搭建
Spark
集群
介绍在MacOS下使用Docker搭建
Spark
集群,进行学习。
_吹灭读书灯_
·
2023-12-05 19:39
Spark
中cache和persist区别
cache和persist的区别基于
Spark
1.4.1的源码,可以看到/**PersistthisRDDwiththedefaultstoragelevel(`MEMORY_ONLY`).
西二旗老司机
·
2023-12-05 18:51
Spark
-03:
Spark
SQL 基础编程
目录1.
Spark
SQL简介2.
Spark
Session3.
Spark
SQL数据的读写3.1读写TXT文件3.2读写CSV文件3.3读写JSON文件3.4读写Parquet文件3.5读写ORC文件3.6
m0_37559973
·
2023-12-05 18:17
Spark
spark
深度探索大数据分析:挖掘价值与洞察力
目录写在开头1.导论1.1大数据的定义与特征1.2大数据对业务和决策的影响1.3大数据分析的基本原则2.大数据技术与工具2.1分布式计算框架2.2数据存储与管理2.3
大数据处理
与分析工具3.数据采集与清洗
theskylife
·
2023-12-05 17:39
数据挖掘
数据分析
数据挖掘
python
大数据
数据可视化
Spark
的五种JOIN策略
JOIN操作是非常常见的数据处理操作,
Spark
作为一个统一的
大数据处理
引擎,提供了非常丰富的JOIN场景。
大数据学习
·
2023-12-05 16:25
spark
mllib和
spark
ml机器学习基础知识
spark
机器学习
Spark
MLib完整基础入门教程-y-z-f-博客园(cnblogs.com)参考
spark
机器学习简介机械学习是一门人工智能的科学,用于研究人工智能,强调算法,经验,性能开发者任务
厨 神
·
2023-12-05 16:50
大数据
python
spark
黑马一站制造数仓实战1
1.项目目标一站制造企业中项目开发的落地:代码开发代码开发:SQL【DSL+SQL】
Spark
Core
Spark
SQL数仓的一些实际应用:分层体系、建模实现2.内容目标项目业务介绍:背景、需求项目技术架构
ZhaoXiangmoStu
·
2023-12-05 15:20
Python
制造
大数据
spark
无法执行pi_如何验证
spark
搭建完毕
在配置yarn环境下的
spark
时,执行尚硅谷的以下命令发现报错,找不到这个也找不到那个,尚硅谷的代码是bin/
spark
-submit\--classorg.apache.
spark
.examples.
Spark
Pi
Guff_hys
·
2023-12-05 10:57
大数据开发学习
spark
大数据
分布式
spark
sql基于RBO的优化
讲解RBO之前必须对
spark
sql的执行计划做一个简单的介绍。
!@123
·
2023-12-05 10:57
大数据
spark
sql
大数据
【
Spark
基础】-- 理解
Spark
shuffle
目录前言1、什么是
Spark
shuffle?2、
Spark
的三种shuffle实现3、参考前言以前,
Spark
有3种不同类型的shuffle实现。每种实现方式都有他们自己的优缺点。
high2011
·
2023-12-05 10:24
Spark
spark
大数据
分布式
Apache
Spark
Apache
Spark
是一个快速、可扩展、开源的
大数据处理
框架,采用内存计算,具有比HadoopMapReduce更高的性能和更好的扩展性。
m0_64180190
·
2023-12-05 10:24
付费
javascript
html5
开发语言
腾讯式“游戏科技”:理解硬核技术、去游戏化和数字解决方案
在刚刚结束的“
SPARK
2022”腾讯游戏发布会上,腾讯结结实实地秀了一把肌肉。
谈游言戏研究所
·
2023-12-05 10:23
spark
c程序idea调试提示内存不足
Exceptioninthread"main"java.lang.IllegalArgumentException:Systemmemory259522560mustbeatleast471859200.Pleaseincreaseheapsizeusingthe--driver-memoryoptionor
spark
.driver.memoryin
Spark
configuration
超超超超子
·
2023-12-05 09:52
spark
java
Spark
SQL中RDD和DF之间相互转换
packagecom.huc.
spark
Sqlimportorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.sql.
huchao7
·
2023-12-05 06:55
笔记
spark
sql
scala
AI创作ChatGPT网站系统源码保姆级搭建部署教程+支持GPT-4图片对话能力
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-05 05:46
人工智能
ChatGPT
教程
chatgpt
人工智能
midjourney
prompt
ai绘画Midjourney绘画提示词Prompt教程
一、Midjourney绘画工具
Spark
Ai【无需魔法使用】:
Spark
Ai是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT?
白云如幻
·
2023-12-05 05:07
人工智能
教程
AI作画
midjourney
prompt
Flink-Flink及主流流框架比较
是不是听起来很像
spark
?没错,两者都希望提供一个统一功能的计算平台给用户。虽然目标非常类似,但是flink在实现上和
spark
存在着很大的区别,flink是一个面向
lisery_nj
·
2023-12-05 05:19
Flink
大数据开发:Hive on
Spark
设计原则及架构
在
Spark
越来越受到主流市场青睐的大背景下,Hive作为Hadoop生态当中的数仓组件工具,在于
Spark
生态的配合当中,开始有了Hiveon
Spark
的思路,那么具体是怎么实现的呢?
成都加米谷大数据
·
2023-12-05 01:44
从 MapReduce 的运行机制看它为什么比
Spark
慢
在Hadoop1中,MapReduce计算框架即负责集群资源的调度,还负责MapReduce程序的运行。一,MapReduce组成MapReduce的运行过程有三个关键进程:1,大数据应用进程。这是用户启动的MapReduce程序进程,主要是指定Map和Reduce类、输入输出文件路径等,并提交作业给Hadoop集群的JobTracker进程。2,JobTracker进程。这是Hadoop集群的常
stone_zhu
·
2023-12-05 00:36
Spark
读写Oracle性能深度调优
Spark
作为一个分布式计算框架,可以很好的适用于Hadoop。那么
Spark
是否可以与关系型数据库较好的进行兼容呢?以
Spark
作为计算,以关系型数据库(例如Oracle)作为存储?
weixin_43370502
·
2023-12-04 21:16
spark
oracle
数据库
如何理解
Spark
SQL中的partitionColumn, lowerBound, upperBound, numPartitions
如何理解
Spark
SQL中的partitionColumn,lowerBound,upperBound,numPartitions在
Spark
SQL中,读取数据的时候可以分块读取。
肿么肥四啊哈
·
2023-12-04 20:43
Spark
spark
大数据的技术栈-逐步完善
分布式文件系统b.Yarn集群资源管理器c.MapReducesql引擎d.Impalasql引擎e.工具概观2.数据仓库知识a.Hive数据库1)HiveSql2)数据库结构b.Doris数据库3.混合处理框架
SPARK
a.
Spark
b
刘文钊1
·
2023-12-04 20:12
大数据
Spark
- 输出parqute文件
pom.xml4.0.0org.springframework.bootspring-boot-starter-parent2.2.5.RELEASEcom.sp
spark
0.0.1-SNAPSHOT
spark
spark
1.8
是个吃不饱的人
·
2023-12-04 20:39
spark
ajax
大数据
hive sql&
spark
优化
在数据抽取中常用到从其他数据库抽取数据后数据灌入到hive数据库的情况。大体逻辑是,连接源数据库,抽取数据,缓存转换,数据插入到hive数据库(或者直接覆盖db文件)。中间源数据库的效率和代码质量、抽取数据的服务器资源、数据转换的效率、hive数据的插入sql效率等都是限制数据抽取效率的瓶颈,如何在保证系统稳定的情况下,效的优化各阶段的运行速度,从而整体提高数据抽取的效率,是一个比较大的课题。从三
刘文钊1
·
2023-12-04 20:08
#
混合处理框架spark
hive
sql
spark
spark
源码之shuffleManager
shufflemanager的实现类:sortshufflemanager
Spark
0.8及以前HashBasedShuffle在ShuffleWrite过程按照Hash的方式重组Partition的数据
cclucc
·
2023-12-04 18:01
Spark
Spark
ListenerEventprotectedoverridedefdoPostEvent(listener:
Spark
ListenerInterface,event:
Spark
ListenerEvent
zhixingheyi_tian
·
2023-12-04 16:00
spark
javascript
前端
HDFS和MapReduce综合实训:构建
大数据处理
应用
摘要:本文将介绍如何使用Hadoop分布式文件系统(HDFS)和MapReduce框架来构建
大数据处理
应用。
IbtnLisp
·
2023-12-04 15:09
hdfs
mapreduce
hadoop
推荐一本Python数据分析的书:《Python数据科学应用从入门到精通》(张甜 杨维忠 著 2023年11月新书 清华大学出版社)
1.Python是堪与Office办公软件比肩的职场人士必备技能Python作为一门简单、易学、易读、易维护、用途广泛、速度快、免费、开源的主流编程语言,广泛应用于Web开发、
大数据处理
、人工智能、云计算
数据科学作家
·
2023-12-04 15:56
python
开发语言
机器学习
人工智能
数据挖掘
数据分析
大数据
2023最新AI创作系统ChatGPT网站源码+Midjourney绘画+支持GPT-4-Turbo模型+即将支持TSS语音对话功能模块
一、AI创作系统
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-04 13:10
人工智能
AIGC
ChatGPT
chatgpt
人工智能
midjourney
大数据分析与应用实验任务十
大数据分析与应用实验任务十实验目的:通过实验掌握
spark
SQL的基本编程方法;熟悉RDD到DataFrame的转化方法;通过实验熟悉
spark
SQL管理不同数据源的方法。
陈希瑞
·
2023-12-04 12:00
数据分析
spark
Kafka 的起源和背景
ApacheKafka是一个分布式流处理平台,被广泛用于构建实时数据流应用程序和
大数据处理
系统。本文将深入探讨Kafka的起源、设计原则以及它在大数据领域中的重要作用。
晓之以理的喵~~
·
2023-12-04 07:54
KafKa
kafka
linq
分布式
数据领域建设的五大方向
1.数据技术的发力点数据汇聚技术包括5G高速光纤ipv6下一代互联网、卫星互联网、叠加互联网、区块链、标识、编码和解析等;数据处理技术包括云计算、边缘计算、分布式计算、
大数据处理
、AI分析、绿色低碳、数据空间
AIGC方案
·
2023-12-04 07:54
大数据
spark
的reduceByKey
在进行
Spark
开发算法时,最有用的一个函数就是reduceByKey。
zxfBdd
·
2023-12-04 06:24
大数据
spark
Spark
Streaming反压机制介绍
1.反压机制原理
Spark
Streaming中的反压机制是
Spark
1.5.0推出的新特性,可以根据处理效率动态调整摄入速率。
zxfBdd
·
2023-12-04 06:24
大数据
spark
大数据
分布式
内存垃圾回收
尽管您无法直接在方法调用完成后手动释放内存,但您可以通过一些
Spark
实践来帮助垃圾恢复器更及时地恢复一些不再需要的对象。以下是建
北执南念
·
2023-12-04 05:06
Java基础
java
window环境下 Error response from daemon: Get https://index.docker.io/v1/search?q=openjdk..... timeout
q=
spark
&n=25:dialtcp:lookupindex.docker.ioon192.168.65.1:53:readudp192.168.65.2:4
森森之火
·
2023-12-04 04:20
环境搭建
docker
Hudi-集成
Spark
之
spark
-sql方式
Hudi集成
Spark
之
spark
-sql方式启动
spark
-sql#启动
spark
-sql之前需要先启动Hive的Metastorenohuphive--servicemetastore针对
Spark
3.2
spark
-sql
迷雾总会解
·
2023-12-04 02:01
大数据
数据库
spark
sql
大数据
hudi
flink学习之sql-client之踩坑记录
flink/bin目录下会看到这个脚本,最开始以为是和
spark
-shell差不多的。结果自行摸索无果,网上查的文章也写的很垃圾,自己查官网看下吧。SQL客户端|ApacheFlink直接.
cclovezbf
·
2023-12-04 02:00
flink
flink
学习
大数据
spark
-sql 指定metastore地址、读取mysql
spark
-sql-hive
spark
-sql--databasesrc--hiveconfhive.metastore.uris=thrift://hdp02:2083-e"select*fromsrc_db2
qzWsong
·
2023-12-04 02:00
spark
spark
sql
hive
【
Spark
九十四】
spark
-sql工具的使用
spark
-sql是
Spark
bin目录下的一个可执行脚本,它的目的是通过这个脚本执行Hive的命令,即原来通过hive>输入的指令可以通过
spark
-sql>输入的指令来完成。
axxbc123
·
2023-12-04 02:59
Spark
大数据
数据库
基于
Spark
、NoSQL的实时数据处理实践
本文基于TalkingData张学敏在公司内部KOL的分享主题《基于
Spark
、NoSQL实时数据处理实践》的整理,同时也在DTCC大会上做了同主题的分享。
TalkingData
·
2023-12-04 01:10
【数据中台】开源项目(3)-Linkis
通过使用Linkis提供的REST/WebSocket/JDBC等标准接口,上层应用可以方便地连接访问MySQL/
Spark
/Hive/Presto/Flink等底层引擎,同时实现统一变量、脚本、用户定义函数和资源文件等用户资源的跨上层应用互通
码农丁丁
·
2023-12-03 23:42
#
数据中台
#
大数据
开源
数据中台
Linkis
产品迭代更新 | 阿列夫科技基于Linkis+DataSphere Studio的单机安装部署实战
作者:萧寒GitHubID:hx23840阿列夫科技原来的技术平台是基于Hadoop,
Spark
平台搭建的,为了充分的满足业务需求,做了大量接口封装。
微众开源
·
2023-12-03 23:12
开源
微众开源
大数据
科技
hadoop
大数据
推荐系统大规模特征工程与FEDB的
Spark
基于LLVM优化
今天给大家分享第四范式在推荐系统大规模特征工程与
Spark
基于LLVM优化方面的实践,主要包括以下四个主题。
第四范式开发者社区
·
2023-12-03 18:06
Spark
python
hadoop
spark
大数据
flink
基于hadoop的商品推荐系统_推荐系统大规模特征工程与FEDB的
Spark
基于LLVM优化
今天给大家分享第四范式在推荐系统大规模特征工程与
Spark
基于LLVM优化方面的实践,主要包括以下四个主题。
weixin_39541212
·
2023-12-03 18:05
基于hadoop的商品推荐系统
Javalin:一个轻量的Web Framework
Javalin最初是
Spark
Java的一个分支,后来受到JavaScript框架koa.js的
Java精选
·
2023-12-03 18:23
python
开发语言
ApacheCN 数据科学译文集 20210313 更新
数据科学和机器学习实践指南零、前言一、入门二、统计和概率回顾和Python实践三、Matplotlib和高级概率概念四、预测模型五、Python机器学习六、推荐系统七、更多数据挖掘和机器学习技术八、处理真实数据九、Apache
Spark
布客飞龙
·
2023-12-03 14:48
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他