E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark性能调优
大数据毕业设计选题推荐-设备环境监测平台-Hadoop-
Spark
-Hive
✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、部分代码设计五、论文参考六、系统视频结语一、前言随着工业4.0和物
IT毕设梦工厂
·
2023-11-06 18:03
大数据项目
大数据
hadoop
spark
hive
毕业设计
YARN实战学习笔记
所以YARN可以实现HADOOP集群的资源共享,不仅仅可以跑MapRedcue,还可以跑
Spark
、Flink。YARN架构分析YARN主
小崔的技术博客
·
2023-11-06 18:16
学习
笔记
java
(2)
spark
streaming滚动窗口和滑动窗口演示
1.png在
spark
streaming中,滚动窗口需要设置窗口大小和滑动间隔,窗口大小和滑动间隔都是StreamingContex
NBI大数据可视化分析
·
2023-11-06 17:13
Spark
(Scala)-示例程序
1.版本system:windows10jdk:1.8.0_141scala:2.10.5
spark
:
spark
-2.0.2-bin-hadoop2.6IntelliJ:15.0.62.基本环境安装下载安装
陪你一起debug
·
2023-11-06 17:47
mysql数据库简介ppt,100%好评!
二、六大
性能调优
技术(JVM调优+网络调优+数据库调优+LINUX内核调优+中间件底层探索+容器环境调优)手绘板(脑图)1、JVM调优JVM调优必备理论知识-GcCOLLECTOR-三色标记垃圾回收算法串讲
前端陈萨龙
·
2023-11-06 16:19
程序员
java
经验分享
面试
jvm深度学习(2): jvm的内存区域
前言:JVM能涉及非常庞大的一块知识体系,比如内存结构、垃圾回收、类加载、
性能调优
、JVM自身优化技术、执行引擎、类文件结构、监控工具等。但是在所有的知识体系中,都或多或少跟内存结构有一定的关系。
TofuCai
·
2023-11-06 15:15
jvm
jvm
spark
课程大纲
Spark
环境搭建Centos
Spark
单机版伪分布式模式
Spark
单机版intelij开发(maven)
Spark
完全分布式集群搭建
Spark
historyserver配置使用二种方法实现
Spark
计算
张明洋_4b13
·
2023-11-06 15:41
7.
spark
sql编程
概述
spark
版本为3.2.4,注意RDD转DataFrame的代码出现的问题及解决方案本文目标如下:RDD,Datasets,DataFrames之间的区别入门
Spark
Session创建DataFramesDataFrame
流月up
·
2023-11-06 10:10
spark
spark
sql
大数据
spark
sql
RDD转DataFrame
数据倾斜解决实例【适用于reduceByKey】
packagecom.imooc;importorg.apache.
spark
.
Spark
Conf;importorg.apache.
spark
.api.java.JavaPairRDD;importorg.apache.
spark
.api.java.JavaRDD
Aluha_f289
·
2023-11-06 09:34
【py
spark
】expected zero arguments for construction of ClassDict
记录一次py
spark
数据插入到hive表里net.razorvine.pickle.PickleException:expectedzeroargumentsforconstructionofClassDict
sdbhewfoqi
·
2023-11-06 09:01
Hive
&
Sql
&
Spark
spark
spark
sql根据某个数字字段进行排序失效问题
举个例子,我的一个dataframe表里有uid,day,cnt三个字段,如果我要根据cnt进行倒序排列,首先要确保cnt的类型是integer,否则
spark
sql的orderbycnt是不会生效的。
机灵鬼鬼
·
2023-11-06 07:51
Android
Spark
lingWater 水气泡、水波纹、水浪冒泡特效。Bessel曲线实现锅炉、水箱、热水沸腾、水下气泡上升。仿360、迅雷进度条
Spark
lingWater气泡水1、效果展示锅炉特效file_boiler.gif水浪特效file_bubble.gif附上Github地址:https://github.com/Victory-Over
VictoryOver
·
2023-11-06 06:40
mysql
性能调优
_MySQL性能优化的最佳12条经验
数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显。关于数据库的性能,这并不只是DBA才需要担心的事,而这更是我们程序员需要去关注的事情。当我们去设计数据库表结构,对操作数据库时(尤其是查表时的SQL语句),我们都需要注意数据操作的性能。这里,我们不会讲过多的SQL语句的优化,而只是针对MySQL这一Web应用最多的数据库。希望下面的这些优化技巧对你有用。1.为查询缓存优化你的
周鸟
·
2023-11-06 05:46
mysql性能调优
《MySQL管理之道:
性能调优
、高可用与监控》迷你书
《MySQL管理之道:
性能调优
、高可用与监控》迷你书51CTO技术博客之星、资深MySQL技术专家多年工作经验结晶,指导MySQLDBA进阶修炼的最佳实践之作。
拟声的主扬
·
2023-11-06 05:13
专题
管理
性能
mysql
性能优化
经验
计算机大数据毕设选题推荐Hadoop项目,
Spark
,Hive,Flink
3、基于
Spark
的医疗保险欺诈检测:使用
Spark
进行医疗保险数据分析,以检测欺诈索赔、虚假医疗账单和保险欺诈行为。4、基于Hadoop和Hive的政府数据透明
大数据毕设辅导员
·
2023-11-06 05:52
hadoop
大数据
spark
hive
flink
大数据毕业设计选题推荐-无线网络大数据平台-Hadoop-
Spark
-Hive
✨作者主页:IT毕设梦工厂✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、部分代码设计五、论文参考六、系统视频结语一、前言随着无线通信技术的
IT毕设梦工厂
·
2023-11-06 05:51
大数据项目
大数据
hadoop
spark
hive
毕业设计
VM虚拟机
大数据毕业设计选题推荐-智慧小区大数据平台-Hadoop-
Spark
-Hive
✨作者主页:IT研究室✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、代码参考五、论文参考六、系统视频结语一、前言随着信息技术的快速发展,智
IT研究室
·
2023-11-06 04:50
大数据项目
大数据
hadoop
spark
hive
毕业设计
VM虚拟机
kylin版本_如何在 Kylin 中优雅地使用
Spark
前言Kylin用户在使用
Spark
的过程中,经常会遇到任务提交缓慢、构建节点不稳定的问题。为了更方便地向
Spark
提交、管理和监控任务,有些用户会使用Livy作为
Spark
的交互接口。
weixin_39995943
·
2023-11-06 04:45
kylin版本
spark
to()
spark
while
使用pb90引入已有应用
Spark
任务常见错误以及解决方案
目前一直在做大数据平台的开发,所以有机会看到全公司的小伙伴们提交
spark
任务的时候,常见的错误。
小小小黄鸡
·
2023-11-06 04:43
spark
开发
调试
spark
大数据
一、
Spark
2.4.0 源码编译
1.环境准备JAVAjava的话,直接安装个1.8就行了,配置好环境变量和JAVA_HOME,在cmd当中java一下,确认java安装好即可。scalascala安装和java类似,把Scala安装包解压,然后配置好Windows环境变量中的path当中还有SCALA_HOME,这里根据你想要阅读的源码,选择合适的scala版本,我用的是scala2.11版本,然后scala-version一下
小小小黄鸡
·
2023-11-06 04:12
spark
spark
二、用IDEA导入
spark
源码,并在本地运行standlone
2遇到的问题1.导入到idea当中,
spark
-p
小小小黄鸡
·
2023-11-06 04:12
spark
spark
Python大数据处理库 Py
Spark
实战 总结一
Python大数据处理库Py
Spark
实战大数据时代分析工具
Spark
核心组件重要概念部署模式基本操作这是《Python大数据处理库Py
Spark
实战》一书的总结归纳大数据时代大数据的特点:大量、高速、
jialun0116
·
2023-11-06 04:42
大数据
Python大数据处理库
PySpark实战
分布式
大数据
hadoop
Py
Spark
优雅的解决依赖包管理
背景平台所有的
Spark
任务都是采用
Spark
onyarncluster的模式进行任务提交的,driver和executor随机分配在集群的各个节点,py
Spark
由于python语言的性质,所以py
Spark
小小小黄鸡
·
2023-11-06 04:09
spark
on
yarn
spark
spark
pySpark
Spark
的作业调度机制
简介
Spark
调度机制可以理解为两个层面的调度。
lei_charles
·
2023-11-06 02:47
JVM
性能调优
参数详解 JVM启动参数详解 进阶月薪5w之路
JVM启动参数JVM启动参数-Xmx4096m设置JVM最大可用内存为4096m。-Xms4096m设置JVM促使内存为4096m。此值可以设置与-Xmx相同,以避免每次垃圾回收完成后JVM重新分配内存。-Xmn2048m设置年轻代大小为2048M。整个堆大小=年轻代大小+年老代大小+持久代大小。持久代一般固定大小为64m,所以增大年轻代后,将会减小年老代大小。此值对系统性能影响较大,Sun官方推
冰忆往昔
·
2023-11-06 01:22
后端
jvm
java
算法
开发语言
学习
Pandas 2.0来了~
随着现在数据量越来越多,pandas的局限性也日渐凸显,在处理大数据时非常恼火,从而选择更加合适的工具,如py
spark
等大数据处理框架。
菜鸟学Python
·
2023-11-06 00:17
pandas
python
数据分析
numpy
开发语言
Spark
系列—
spark
简介
最近比较空,总结一下
spark
相关的知识。一、
Spark
简介
spark
是一种大规模数据处理的统一分析引擎,且基于内存计算的大数据并行计算框架。
数据小白的进阶之路
·
2023-11-05 23:19
Spark
spark
大数据
大数据之
spark
_
spark
简介
什么是
Spark
Spark
是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010年开源,2013年6月成为Apache孵化项目,2014年2月成为Apache
普罗米修斯之火
·
2023-11-05 23:42
spark
spark
第一章 Iceberg入门介绍
应用场景①面向大表:单表包含数十个PB的数据②分布式引擎非必要:不需要分布式SQL引擎来读取或查找文件③高级过滤:使用表元数据,使用分区和列级统计信息修建数据文件1.2、集成方式:通过Lib与Flink、
Spark
随缘清风殇
·
2023-11-05 23:41
#
Iceberg专题
java
大数据
开发语言
数据湖Iceberg介绍和使用(集成Hive、
Spark
SQL、FlinkSQL)
文章目录简介概述作用特性数据存储、计算引擎插件化实时流批一体数据表演化(TableEvolution)模式演化(SchemaEvolution)分区演化(PartitionEvolution)列顺序演化(SortOrderEvolution)隐藏分区(HiddenPartition)镜像数据查询(TimeTravel)支持事务(ACID)基于乐观锁的并发支持文件级数据剪裁其他数据湖框架的对比存储结
迷雾总会解
·
2023-11-05 22:25
大数据
数据库
hive
数据仓库
数据湖
lceberg
Spark
学习之路——9.
Spark
ML
一、简介基于RDD的API
spark
.mllib已进入维护模式。
Nelson_hehe
·
2023-11-05 22:40
Spark
Spark
ML
分布式快照算法: Chandy-Lamport
0.引言上一篇文章最后说到
Spark
的StructuredStreaming的ContinuousProcessingMode的容错处理使用了分布式快照(DistributedSnapshot)算法Chandy-Lamport
weixin_33924220
·
2023-11-05 21:12
大数据
系统架构
分布式快照算法: Chandy-Lamport 算法
0.引言
Spark
的StructuredStreaming的ContinuousProcessingMode的容错处理使用了分布式快照(DistributedSnapshot)算法Chandy-Lamport
王知无(import_bigdata)
·
2023-11-05 21:11
Flink 的checkpoint 基于Chandy-lamport算法
Spark
的StructuredStreaming的ContinuousProcessingMode的容错处理使用了分布式快照(DistributedSnapshot)算法Chandy-Lamport算法
黑头人
·
2023-11-05 21:06
Flink
Flink
checkpoint
Spark
SQL
1、
Spark
简介2、
Spark
-Core核心算子3、
Spark
-Core4、
Spark
SQL文章目录一、概述1、简介2、DataFrame、DataSet3、
Spark
SQL特点二、
Spark
SQL编程
ha_lydms
·
2023-11-05 21:11
大数据
scala
spark
sparksql
大数据
spark
中monotonically_increasing_id的坑
本来以为发现了一个非常好用的函数monotonically_increasing_id,再join回来就行了,直接可以实现为:importorg.apache.
spark
.sql.functions.monotonically_increasing_iduserdf
like_red
·
2023-11-05 19:58
日常记录
Geo
Spark
-[阶段性总结]
一、Geo
spark
安装:我采用的是gradle安装,安装环境是
Spark
3.0.3+Scala.2.12.3plugins{id'java'id'scala'}group'org.example'version
一个懒散的人
·
2023-11-05 19:37
tez 使用问题
见图看现象是终端没有退出.如果终端退出了.yarn上的app也会消亡.终端退出后,yarn上显示FINISHED状态为SUCCEEDED..最终结论:DAGApplicationMaster占用yarn中的资源.类似
Spark
Session
wangliang938
·
2023-11-05 16:25
大数据开发笔记(四):Hive分区详解
大数据开发面试知识点总结_GoAI的博客-CSDN博客_大数据开发面试本文详细介绍大数据hadoop生态圈各部分知识,包括不限于hdfs、yarn、mapreduce、hive、sqoop、kafka、flume、
spark
GoAI
·
2023-11-05 16:08
#
Hive
大数据笔记
分区表
大数据
hive
黑猴子的家:
Spark
SQL 的背景故事
1、
Spark
SQL的前身是Shark。
黑猴子的家
·
2023-11-05 12:08
java java.lang.NoClassDefFoundError: Could not initialize class XXX
cluster模式提交StartUp(shade)包到
spark
集群执行:首先报错:java.lang.NoClassDefFoundError:CouldnotinitializeclassXXX在类的初始化的时候出了问题
Thomas_Vader
·
2023-11-05 11:45
Spark
RDD转DataFrame的两种方式
Spark
RDD转DataFrame映射的方式packagecom.gofun.
spark
Sqlimportorg.apache.log4j.
gofun
·
2023-11-05 10:19
最新Ai系统ChatGPT程序源码+以图生图+Dall-E2绘画+支持GPT4+Midjourney绘画
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-05 09:24
人工智能
程序源码
chatgpt
人工智能
chatgpt
midjourney
使用
Spark
跨集群同步HDFS数据
{Level,Logger}importorg.apache.
spark
.
lei_charles
·
2023-11-05 09:09
创意计划|日更挑战1
毕业去了互联网公司选择了广告运营的工作目的是希望能在这份工作中学到广告世界的冰山一角或是创意或是策划或是剪辑幸运的是三者皆有不幸的是许是互联网流水线使然所学知识不过是尚足果腹尔尔希望我能坚持每日记忆我的
spark
ling
ee373095db42
·
2023-11-05 09:54
spark
2.1写入mysql
spark
2.1 write to mysql
先说说
spark
2.1的
Spark
Session,原来的
Spark
Context已经并入
Spark
Session,所以需要这样开始:importorg.apache.
spark
.sql.
Spark
Sessionvalsc
z_star
·
2023-11-05 08:01
Android 绘制性能优化
接下来就可以正式的
性能调优
了。第一个学习的就是绘制优化,因为绘制和界面流畅度有关,这个优化的效果是最直观的。
RikkaTheWorld
·
2023-11-05 07:28
Android性能优化
CDH命令行部署
Spark
History Server
翻译:https://www.cloudera.com/documentation/enterprise/latest/topics/admin_
spark
_history_server.html#
spark
_history_server_cmdline
金刚_30bf
·
2023-11-05 05:54
The root scratch dir: /tmp/hive on HDFS should be writable.(已解决)
在进行Py
Spark
开发的时候出现了一个小小的异常,鉴于网络内容较为繁杂,作为解决后的内容记录一下。
Han_Lin_
·
2023-11-05 03:21
pyspark
Spark
Hive
大数据
py
Spark
ModuleNotFoundError: No module named ‘XXX‘
命名已经安装了jieba分词库了,但是无论是pycharm还是jupyter都无法找到,后来经过和同事的不断尝试发现了一个解决方案:在代码的开始部分添加相应的环境变脸并将指定的变量指向这个变量:解决方案:PY
SPARK
_PYTHON
Han_Lin_
·
2023-11-05 03:21
pyspark
Spark
spark
大数据
python
上一页
60
61
62
63
64
65
66
67
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他