E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark技术篇
大文件分片上传、断点续传、秒传
小文件上传后端:SpringBoot+JDK17前端:JavaScript+
spark
+md5.min.js一、依赖org.springframework.bootspring-boot-starter-parent3.1.2com.exampleuploadDemo0.0.1
A尘埃
·
2023-11-18 22:33
文件分片上传
断点续传
秒传
JDK1.8 新特性(二)【Stream 流】
今天再来学习一个新的特性,Stream流,光是看名字就觉得和大数据能扯上关系,我们的
Spark
、Flink当中不就都是这种流的概念嘛。
让线程再跑一会
·
2023-11-18 21:30
JavaSE
java
SaprkStreaming广告日志分析实时数仓
一、系统简介参考尚硅谷的
spark
教程中的需求,参考相关思路,详细化各种代码,以及中间很多逻辑的实现方案采用更加符合项目开发的方案,而不是练习,包括整体的流程也有很大的差别,主要是参考需求描述和部分代码功能实现
是阿威啊
·
2023-11-18 21:50
scala
spark
mysql
kafka
zookeeper
SPARK
-SQL - RDD/Dataset/DataFrame的互相转换
转换用到的方法如下rdd(),as(),toDF()代码示例importorg.apache.
spark
.api.java.JavaRDD;importorg.apache.
spark
.api.java.Java
Spark
Context
小哇666
·
2023-11-18 21:50
#
spark
spark
Spark
SQL中的自定义函数-UDF&UDAF
一、UDF(User-Defined-Function)用户自定义函数1、注册UDFudf对象=
spark
.udf.register(参数1,参数2,参数3)参数1:UDF名称,可用于SQL风格参数2:
是阿威啊
·
2023-11-18 21:49
spark基础知识学习和练习
scala
spark
Spark
(三)--
Spark
SQL(三) -- Dataset和DataFrame
目录4.Dataset的特点4.1Dataset是什么?4.2即使使用Dataset的命令式API,执行计划也依然会被优化4.3Dataset的底层是什么?4.4可以获取Dataset对应的RDD表示5.DataFrame的作用和常见操作5.1DataFrame是什么?5.2通过隐式转换创建DataFrame5.3通过外部集合创建DataFrame5.4在DataFrame上可以使用的常规操作5.
HelloWorld闯天涯
·
2023-11-18 21:17
Spark
Spark
(第五节) RDD、DataFrame、DataSet的介绍与比较,创建DataFrame和DataSet,三者之间互相转换,scala代码创建和使用DataFram
基本介绍Dataframe基本概述Dataset基本概述三者的共性三者的区别创建DataFrame读取文本文件创建DataFrame第一种方式:通过RDD配合caseclass进行转换DF第二种方式:通过
spark
Session
hwq317622817
·
2023-11-18 21:43
spark
Spark
SQL 之 DataFrame&DataSet
对象2.从RDD转换成DataFrame对象3.读取Hive中的表,返回DataFrame对象4.调用createDataFrame方法,返回DataFrame对象一、DataFrame的创建1、准备
Spark
Session
是阿威啊
·
2023-11-18 21:31
spark基础知识学习和练习
spark
大数据
Flink原理与实现:详解Flink中的状态管理
硬刚大数据系列文章链接:2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之
Spark
SQL篇2021
王知无(import_bigdata)
·
2023-11-18 19:59
大数据成神之路
flink
big
data
spark
数据处理生产环境_
Spark
根据给定的轨迹编号生成随机16进制颜色
需求根据给定的轨迹编号在这一列后面生成随机颜色_16代码packagetestimportorg.apache.
spark
.sql.
Spark
Sessionimportorg.apache.
spark
.sql.functions
Matrix70
·
2023-11-17 15:56
Spark
数据分析与处理
spark
大数据
分布式
运行示例
spark
Pi计算圆周率(1.1)
1启动
spark
(1)启动hadoop启动成功master节点进程:Slave节点进程:(2)启动
spark
(注意路径)启动成功:Slave1和slave2的进程如下:2将
spark
Pi.scala添加进工程
探索者tl
·
2023-11-17 14:04
云计算
sparkPi
最新AI创作系统ChatGPT系统运营源码/支持最新GPT-4-Turbo模型/支持DALL-E3文生图
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-17 12:57
人工智能
chatgpt
系统源码
chatgpt
人工智能
源码软件
AI作画
数据分析工具Polars实现CSV读写、排序、应用函数、lazy API
适合中、小型数据处理,大型数据建议用
Spark
。安装pipinstallpolarsDataFrame读取CSV读取CSV并设置列名。
小龙在山东
·
2023-11-17 12:29
python
polars
Spark
~~
Spark
性能调优
文章目录第1章
Spark
性能调优1.1常规性能调优1.1.1常规性能调优一:最优资源配置1.1.2常规性能调优二:RDD优化1.1.3常规性能调优三:并行度调节1.1.4常规性能调优四:广播大变量1.1.5
几窗花鸢
·
2023-11-17 10:41
Spark
spark
大数据
分布式
极客时间
Spark
性能调优实战-学习笔记(1)
通用性能调优(一)一、应用开发三原则原则一:使用
spark
自身的调优机制充分利用
Spark
为我们提供的“性能红利”,如钨丝计划、AQE、SQLfunctions等等。钨丝计划的优势?
我不认识CBW
·
2023-11-17 10:40
spark
big
data
大数据
Spark
调优 |
Spark
性能优化实战手册
本文分为四个部分,基本涵盖了所有
Spark
优化的点,面试和实际工作中必备。
大数据技术架构
·
2023-11-17 10:39
大数据
hadoop
spark
java
面试
Spark
性能调优
1常规性能调优1.1常规性能调优一:最优资源配置
Spark
性能调优的第一步,就是为任务分配更多的资源,在一定范围内,增加资源的分配与性能的提升是成正比的,实现了最优的资源配置后,在此基础上再考虑进行后面论述的性能调优策略
高个子男孩
·
2023-11-17 10:09
Spark
spark
大数据
scala
Spark
性能调优总结
分配更多资源写完了一个复杂的
spark
作业之后,进行性能调优的时候,首先第一步,我觉得,就是要来调节最优的资源配置;在这个基础之上,如果说你的
spark
作业,能够分配的资源达到了你的能力范围的顶端之后,
星空下的那个人影
·
2023-11-17 10:09
大数据面试
spark
Spark
性能优化四 内存
性能优化分析内容怎么被消耗的如何预估程序会消耗多少内存呢(二)性能优化方案1)高性能序列化类库2)持久化或者checkpoint3)JVM垃圾回收调优4)提高并行度5)数据本地化(一)性能优化分析一个计算任务的执行主要依赖于CPU、内存、带宽
Spark
小崔的技术博客
·
2023-11-17 10:38
大数据学习
spark
性能优化
java
[
Spark
]二
Spark
性能调优|
Spark
任务监控|程序调优|资源调优
二.
spark
性能调优1.
Spark
任务监控对
Spark
性能的调优离不开对任务的监控,只有在运行过程中,通过监控手段发现问题,才能迅速定位问题所在。
胖胖学编程
·
2023-11-17 10:37
spark
spark
大数据
分布式
1024程序员节
spark
-调优-性能调优&内存管理
前置主要涉及6个参数,从3个方面:executor、core、内存的大小,并行度,内存管理进行调优优化的方案资源分配num-executors:
spark
使用多少个executorsexecutor-cores
zdkdchao
·
2023-11-17 10:36
spark
spark
big
data
大数据
spark
性能调优(二):内存
Memory一、
spark
内存简介二、堆内内存or堆外内存?三、如何用好RDDCache?四、OOM怎么办?
我爱夜来香A
·
2023-11-17 10:05
Spark
spark
jvm
大数据
Spark
优化 (一) ---------
Spark
性能调优
Kryo序列化6.调节本地化等待时长二、算子调优1.mapPartitions2.foreachPartition优化数据库操作3.filter与coalesce的配合使用4.repartition解决
Spark
SQL
在森林中麋了鹿
·
2023-11-17 10:34
Spark
spark
大数据
分布式
Scala |
Spark
性能优化 | 资源调优 | 代码调优 | 数据本地化 | 内存调优 |
Spark
Shuffle调优 | 数据倾斜 |
Spark
故障解决
map-side预聚合的shuffle操作5.尽量使用高性能的算子6.使用广播变量7.使用Kryo优化序列化性能8.优化数据结构9.使用高性能的库fastutil四、数据本地化1.数据本地化的级别2.
Spark
幼稚的人呐
·
2023-11-17 10:04
Spark
spark
scala
性能优化
spark
性能调优 | 内存优化
目录我们先了解一下有哪些内存温馨提示RDD示范(
spark
版本2.1.1)RDD进行优化Df和Ds进行示范我们先了解一下有哪些内存1.storage内存存储数据,缓存可预估2.shuffle内存计算joingroupby
Knight_AL
·
2023-11-17 10:00
Spark优化
spark
大数据
分布式
AI创作系统ChatGPT网站源码+详细搭建部署教程+支持DALL-E3文生图/支持最新GPT-4-Turbo-With-Vision-128K多模态模型
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-17 10:25
人工智能
软件源码
ChatGPT
人工智能
chatgpt
AI作画
AIGC
Scala-满足
spark
的学习需求
Scala变量和数据类型注释和java一样变量和常量varname:String="jx"//变量valname:String="jx"//常量因为scala函数式编程的要素,所以能用常量就不要用变量声明变量时,类型可以省略,编译器可以自动推导静态类型,类型经过给顶或推导就不能更改变量和常量声明时,必须有初始值变量可变,常量不可变引用类型常量,不能改变常量指向的对象,可以改变对象的字段不以;作为语
健鑫.
·
2023-11-17 09:10
scala
scala
java
开发语言
【Scala-
spark
.mlib】稠密矩阵和稀疏矩阵的创建及操作
mlib中的稠密矩阵和稀疏矩阵1.矩阵 1.1.mlib中的矩阵特质(Matrix) 1.1.Matrix定义的基本方法2.稠密矩阵 1.1.mlib中的稠密矩阵(DenseMatrix) 1.1.1.Matrices类中的稠密矩阵构造 1.2.DenseMatrix相关方法 1.2.1.构造方法 1.2.2.成员方法3.稀疏矩阵 2.1.mlib中的稀疏矩阵(SparseMatrix)
JimmyShis
·
2023-11-17 09:08
scala
spark
大数据
ml
01.Scala编程基础 ---没看
Scala编程1.课程目标21.1.目标1:(初级)熟练使用scala编写
Spark
程序21.2.目标2:(中级)动手编写一个简易
Spark
通信框架31.3.目标3:(高级)为阅读
Spark
内核源码做准备
okbin1991
·
2023-11-17 09:32
scala
开发语言
后端
spark
大数据
终于有人把
Spark
大数据分析与挖掘讲明白了
当我们每天面对扑面而来的海量数据时,是战斗还是退却,是去挖掘其中蕴含的无限资源,还是让它们自生自灭?我们的答案是:“一切都取决于你自己”。对于海量而庞大的数据来说,在不同人眼里,既可以是一座亟待销毁的垃圾场,也可以是一个埋藏有无限珍宝的金银岛,这一切都取决于操控者的眼界与能力。本书的目的就是希望所有的大数据技术人员都有这种挖掘金矿的能力!大数据时代什么是“大数据”?一篇名为“互联网上一天”的文章告
风度78
·
2023-11-17 09:46
编程语言
算法
人工智能
大数据
数据挖掘
Spark
数据倾斜_产生原因及定位处理办法_生产环境
在最近的项目中,历史和实时数据进行关联平滑时出现了数据倾斜,产生了笛卡尔积,具体现象如下:运行内存175GB,核数64,运行代码时,查看
Spark
UI界面的activejobs,数据输入是1G,成功的stage
Matrix70
·
2023-11-17 07:51
Spark
数据分析与处理
spark
大数据
分布式
Spark
与SQL之间NB的转换_withClumn,split及SubString
睡觉_2,吃饭_3,这是我的第一个需求;随后我想保留的是dataframe表table1中的字段d1中的数据比如学习_1,睡觉_2,吃饭_3,中的数据中_前后的数据分别作为两列e1,f1,该怎么写这个
spark
Matrix70
·
2023-11-17 06:13
数据分析与处理
Spark
SQL
spark
sql
大数据
nebula graph 3.0.x 导入数据
nebulaconsolejavaclientNebulaImporter适用场景优势前提条件操作步骤启动命令配置文件说明NebulaExchange版本系列适用场景产品优点数据源使用限制Nebula
Spark
Connector
大怀特
·
2023-11-17 06:07
database
graph
nebulagraph
大数据毕业设计选题推荐-机房信息大数据平台-Hadoop-
Spark
-Hive
✨作者主页:IT研究室✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、代码参考五、论文参考六、系统视频结语一、前言随着信息技术的飞速发展,机
IT研究室
·
2023-11-17 06:59
大数据项目
大数据
hadoop
课程设计
C && C++ && git && tcpip
blog.csdn.net/aobai219/article/details/1596964C语言添加宏开关https://www.cnblogs.com/zht-blog/p/4036935.htmlPython+
Spark
2.0
happylzs2008
·
2023-11-17 05:21
Nginx
离线集群平台搭建-HDP
一.背景大数据相关的所有建设依托于大数据的基础设施.基础设施一定包含了集群平台的搭建.目前市场上常用的有三种方式做集群平台的搭建;第一种为使用原生的apache(hadoop,hive,
spark
)等相关大数据软件构建集群平台
会飞的boy
·
2023-11-17 03:53
ambari
hadoop
大数据
大数据
hadoop
centos
以太坊(ethereum)技术开发相关资料
以太坊智能合约入门概念理解区块链区块链关键要点讲解(一)简单易懂地介绍什么是区块链比特币区块链关键词讲解(二)简单易懂地介绍什么是区块链(
技术篇
)比特币区块链技术图解一文看懂区块链架构设计从技术分层解构架构
落叶无声9
·
2023-11-17 01:31
以太坊开发
智能合约
java
以太坊教程
以太坊智能合约
以太坊
区块链
智能合约
技术资料
python使用Stream Load方式写入doris
0.doris支持的多种数据写入方式如:导入总览|ApacheDoris
Spark
Load通过
Spark
导入外部数据BrokerLoad通过Broker导入外部存储数据StreamLoad流式导入数据(
菜鸟001号
·
2023-11-17 01:19
doris
Python
数据仓库
大数据
python
hive
Spark
+Flink+DW+DB
6.
Spark
面试题(约9.8w字)1.介绍下
Spark
Spark
是一个快速、通用、可扩展的大数据处理和分析引擎。
我是Sol啊
·
2023-11-17 00:31
大数据
面试
你的数据倾斜了吗?一文帮你数据处理再均衡
前言此篇主要总结到Hive,Flink,
Spark
出现数据倾斜的表现,原因和解决办法。首先会让大家认识到不同框架或者计算引擎处理倾斜的方案。最后你会发现计算框架只是“异曲”,文末总结才是“同工之妙”。
大数据左右手
·
2023-11-16 21:41
面试
大数据
Flink
大数据
Flink
Hive
Spark
探究Presto SQL引擎(1)-巧用Antlr
从Hadoop生态的Hive,
Spark
,Presto,Kylin,Druid到非Hadoop生态的Clic
vivo互联网技术
·
2023-11-16 20:27
技术干货
sql
大数据
antlr
presto
大数据应用开发线上班(学徒班)课程大纲
泰迪智能科技大数据应用开发线上班课程使用当下流行的Hadoop+
Spark
大数据框架,全面、深入地探讨了大数据开发、大数据分析、数据仓库等技术。
泰迪智能科技
·
2023-11-16 19:23
大数据
项目实战
大数据
人工智能
python
《Flink原理、实战与性能优化》(Flink知识梳理一)
Flink原名StratosphereFlink是基于事件驱动的,而
Spark
Streaming微批模型,生成微小的数据批次
Spark
的弱点:
Spark
基于批处理原理,对流式计算相对较弱(本质上是对Hadoop
无影风Victorz
·
2023-11-16 18:40
Java
知识梳理
Flink
flink
大数据
spark
与scala的对应版本查看
仓库地址https://mvnrepository.com/artifact/org.apache.
spark
/
spark
-core总结
spark
3.0以后,不再支持scala2.11
spark
3.0以后
Knight_AL
·
2023-11-16 07:43
spark
Scala
spark
scala
大数据
AI创作系统ChatGPT源码+AI绘画系统+支持OpenAI DALL-E3文生图,可直接对话文生图
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-16 06:11
人工智能
ChatGPT
软件源码
人工智能
chatgpt
AI作画
DALL-E3
智能AI系统ChatGPT网站源码+支持OpenAI DALL-E3文生图+支持ai绘画(Midjourney)/支持OpenAI GPT全模型+国内AI全模型
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-16 06:07
人工智能
chatgpt
aigc
人工智能
chatgpt
AI作画
源码软件
智能AI系统ChatGPT网站源码+支持OpenAI DALL-E3文生图+支持ai绘画(Midjourney)/支持GPT全模型+国内AI全模型
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-16 06:07
人工智能
程序源码
工具
chatgpt
人工智能
AI作画
源码软件
midjourney
AI创作系统ChatGPT网站源码+支持最新GPT-Turbo模型+支持DALL-E3文生图/AI绘画源码
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-16 06:06
人工智能
AIGC
ChatGPT
人工智能
chatgpt
AI作画
ai
Spark
SQL项目实战
1准备数据我们这次
Spark
-sql操作所有的数据均来自Hive,首先在Hive中创建表,并导入数据。一共有3张表:1张用户行为表,1张城市表,1张产品表。
shangjg3
·
2023-11-16 06:47
Spark
spark
大数据
sql
MySQL、HiveSQL、
Spark
SQL的区别
1、用途角度1)MySQL是一种关系型数据库,主要用于存储和管理结构化数据2)HiveSQL是用于Hadoop平台上的一种SQL-like语言,主要用于对大数据进行查询和分析3)
Spark
SQL是一种基于
BaoZi969
·
2023-11-16 03:13
mysql
hive
hadoop
上一页
45
46
47
48
49
50
51
52
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他