E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
Spark
-之自定义wordCount累加器
Spark
-之自定义wordCount累加器
Spark
Core中的3种数据类型:累加器(只写)RDD广播变量(只读)累加器在多个action算子触发的job中重复累加,且需要action算子才能触发累加器操作
稳哥的哥
·
2024-01-14 09:01
Spark
spark
scala
big
data
Spark
-累加器
Spark
-累加器第一张图和java中的引用传递,和值传递很像你能改变内容,内存地址无法改变.你传你的,我传我的,没有把值给返回去双端对列当发送错误的时候要放回到要来头部对列一般是先进先出,要是发送错误
疯子@123
·
2024-01-14 09:00
大数据
Java操作
spark
-自定义累加器
Java操作
spark
-自定义累加器
spark
的累加器自定义累加器实现wordCount
spark
的累加器背景:如果我们在Driver端定义一个变量,然后将该变量发送Executor端进行累加赋值操作,
卡卡东~
·
2024-01-14 09:00
spark
spark
java
big
data
Spark
-自定义分区器以及累加器
自定义分区器:valrdd=sc.makeRDD(List(("nba","xxxx"),("cba","xxxx"),("cba","xxxx"),("cba","xxxx"),("nba","xxxx"),("wnba","xxxx"),),3)valrdd1:RDD[(String,String)]=rdd.partitionBy(newMyPartitioner())rdd1.saveAs
_Ordinary丶
·
2024-01-14 09:00
spark
spark
-submit 与
spark
-shell 介绍
一、
spark
-submit介绍1、
spark
-submit介绍程序一旦打包好,就可以使用bin/
spark
-submit脚本启动应用了。
火成哥哥
·
2024-01-14 09:59
spark
hadoop
spark
java
大数据
linux
Spark
入门-累加器和广播变量
累加器
Spark
中累加器用来解决一些特殊的需求。
汪巡
·
2024-01-14 09:59
Spark系列
spark
scala
big
data
Spark
--累加器
累加器累加器1.实现原理2.系统累加器3.自定义累加器累加器
Spark
计算框架为了能够进行高并发和高吞吐的数据处理,封装了三大数据结构,用于处理不同的应用场景。
小陈菜奈-
·
2024-01-14 09:59
Scala&Spark
spark
scala
big
data
Spark
-core----累加器
一、原理累加器用来把Executor端变量信息聚合到Driver端。在Driver程序中定义的变量,在Executor端的每个Task都会得到这个变量的一份新的副本,每个task更新这些副本的值后,传回Driver端进行merge。二、基础编程2.1系统累加器valrdd=sc.makeRDD(List(1,2,3,4,5))//声明累加器varsum=sc.longAccumulator("su
梦痕长情
·
2024-01-14 09:28
spark
Spark
-- 累加器和广播变量
Spark
–累加器和广播变量文章目录
Spark
--累加器和广播变量一.累加器1.系统累加器2.自定义累加器二.广播变量
spark
有三大数据结构:RDD:分布式弹性数据集累加器:分布式只写数据集广播变量:
Keep hunger
·
2024-01-14 09:58
Spark
spark
Spark
---累加器
//建立与
Spark
框架的连接valwordCount=new
Spark
Conf().setMaster("local").setAppName("WordC
肥大毛
·
2024-01-14 09:27
大数据
scala
spark
spark
大数据
scala
记csv、parquet数据预览一个bug的解决
文章目录一、概述二、实现过程1.业务流程如图:2.业务逻辑3.运行结果三、bug现象1.单元测试2.运行结果三、流程梳理1.方向一2.方向二一、概述工作中遇到通过
spark
session解析csv、parquet
爱码少年
·
2024-01-14 08:49
雕虫小技
Java
java
spark
数据结构
物理机本地和集群部署
Spark
一、单机本地部署1)官网地址:http://
spark
.apache.org/2)文档查看地址:https://
spark
.apache.org/docs/3.1.3/3)下载地址:https://
spark
.apache.org
DIY……
·
2024-01-14 07:43
spark
大数据
分布式
通义灵码 - 免费的阿里云 VS code Jetbrains AI 编码辅助工具
是阿里云出品的一款基于通义大模型的智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云SDK/OpenAPI的使用场景
调优
kuan_li_lyg
·
2024-01-14 06:01
人工智能
python
c++
vscode
开发语言
阿里云
java
JVM——GC
调优
JVM——GC
调优
预备知识:需要掌握GC相关的VM参数,会基本的空间调整,这是最基本的东西。JVM
调优
是一个不断调整的过程,不能指望着一蹴而就。要不断调整相关参数,观察结果进行对比分析。
真真最可爱
·
2024-01-14 06:46
JVM
jvm
java
垃圾回收
【JVM内存管理专题】——Java参数
调优
JVM参数
调优
——日志开启-XX:+PrintGC每次触发GC的时候打印相关日志-XX:+PrintGCDetails更详细的GC日志JVM参数
调优
——总体限制-Xms20m堆初始值-Xmx5m堆最大可用值
GodSchool
·
2024-01-14 06:45
JVM内存管理专题
jvm
java
JVM——垃圾回收器与
调优
文章目录1.JVM
调优
——垃圾回收器1.1分类1.2GC性能指标1.3详解1.3.1串行垃圾回收器1.3.1.1Serial垃圾回收器1.3.1.2SerialOld垃圾回收器1.3.2并行垃圾回收器1.3.2.1ParNew
ManbaBryant
·
2024-01-14 06:44
#
JVM
jvm
java
java jstat m ccs_学习笔记——JVM性能
调优
之 jstat
JVM性能
调优
小工具——Jstatjstatjstat(JVMstatisticsMonitoring)是用于监视虚拟机运行时状态信息的命令,它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据
付沛
·
2024-01-14 06:14
java
jstat
m
ccs
jvm系列——5.JVM
调优
(建议按目录看)
S1.JVM
调优
前文笔者通过四篇文章,包括内存结构,类加载器,执行引擎,垃圾回收器,具体讲解了JVM的基本知识。而这些知识的真正用途,笔者相信大多数人都不是为了去实现自己的JVM。
青蛙QQ
·
2024-01-14 06:14
JVM系列讲解
jvm
java
算法
java性能
调优
指令_JVM性能
调优
—— 性能
调优
工具
一、JDK工具先来看看有哪些常用的工具可以辅助我们进行性能
调优
和问题排查,后面再通过一个具体的示例结合工具来分析
调优
。
莫魔墨
·
2024-01-14 06:14
java性能调优指令
JVM系列——垃圾回收
调优
,类加载和字节码技术day2-1
JVM系列——垃圾回收
调优
,类加载和字节码技术day2-1垃圾回收
调优
如何确定自己使用了哪些垃圾回收器垃圾回收
调优
涉及目标新生代
调优
新生代特点设置新生代的空间大小新生代中的幸存区老年代
调优
类加载类文件结构编译查看字节码文件分析
简明编程
·
2024-01-14 06:43
JVM
笔记
Java学习
jvm
java
算法
JVM基础(12)——G1
调优
作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬学习必须往深处挖,挖的越深,基础越扎实!阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析阶段5、深入jvm源码解析一、简介本章和下一章,我们将通过一个实际案例来讲解如何针对G1进行JVM
smart哥
·
2024-01-14 06:43
jvm专题
jvm
JVM
调优
——3、JVM
调优
命令及工具
JVM
调优
命令及工具写在前面的话:一、
调优
时基础命令1.1Jmap(java内存信息、实例个数以及占用内存大小)(1)命令:jmap-histo2272>.
Pang Yu
·
2024-01-14 06:43
Java
jvm
java
JVM性能——JVM
调优
参数列表
JVM性能——JVM
调优
参数列表下面内容是介绍在进行JVMGC优化的时候可能用到的参数关于JVM的其他文章JVM性能——垃圾回收器的优化策略JVM性能——垃圾回收器的介绍JVM性能——开启回收日志和实时查看
大·风
·
2024-01-14 06:13
#
JVM
JAVA
jvm
java
算法
JVM性能
调优
——GC优化
即便如此,GC
调优
也不是无章可循,仍然有一些通用的思考方法。一、如何开启GC日志1、在Tomcat的安装路径下,找到bin/catalina.sh加上下面的配置,具体参数
程序员卡卡西
·
2024-01-14 06:12
JVM
JVM——8.
调优
工具1(jstat)
文章目录1.使用背景2.jstat的介绍及使用2.1jstat-gcPID介绍2.2其他的jstat命令2.3jstat-gcPID使用3.关注指标及计算分析3.1关注指标3.2计算分析1.使用背景一般来说,中大型公司都会有自己的应用监控系统,比如开源的Zabbix、Open-Falcon、Prometheus等,也可能一些公司自己实现了监控或者告警系统;这些系统可以监控所有在线上的各种应用的运行
你想要怎样的未来
·
2024-01-14 06:12
jvm
jvm实战
java
java
jvm
jvm.gc
java虚拟机
JVM性能
调优
(4)——性能
调优
工具
目录一、JDK工具1、JDK工具2、利用jps找出进程3、利用jstat查看VM统计信息4、利用jmap查看对象分布情况5、利用jstack分析线程栈二、Linux命令行工具1、top命令2、vmstat命令3、pidstat命令三、可视化工具1、jvisualvm—JVM监控3、GCViewer—离线分析GC日志4、GCeasy—在线分析GC日志5、FastThread—分析线程栈6、MAT—分
java领域
·
2024-01-14 06:42
spark
big
data
大数据
面试
经验分享
深入理解JVM(六)——JVM性能
调优
实战
http://blog.csdn.net/u010425776/article/details/51232463如何在高性能服务器上进行JVM
调优
?
crazykiller
·
2024-01-14 06:42
Jvm虚拟机
JVM虚拟机——JVM
调优
和性能优化
JVM
调优
,并不能显著的提高系统性能,JVM
调优
主要调的是稳定。如果系统出现了频繁的垃圾回收,这个时候系统是不稳定的,所以需要JVM
调优
。
YouAreMyLove995
·
2024-01-14 06:41
JVM虚拟机
JVM
性能优化
GC调优
虚拟机
系统分析
JVM基础(10)——老年代
调优
作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬学习必须往深处挖,挖的越深,基础越扎实!阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析阶段5、深入jvm源码解析一、简介上一章中,我们通过一个实际案例讲解了如何进行新生代的JVM参数调
smart哥
·
2024-01-14 06:41
jvm专题
jvm
Java - jmx远程
调优
java远程
调优
可采用两种方式进行连接,jmx与jstatd,此文演示如何配置jmx进行连接
调优
。
kikiki5
·
2024-01-14 05:04
一款国内研发的PCB设计软件-立创EDA
我们先来看下官方的一些样板工程和原理图PCB布好线的效果3D预览效果原理图简单的聊聊PCB设计软件:像当前免费的PCB设计软件还有KiCAD、Design
Spark
(发烧友网)也是不错的,当然我们绝大部分人在学校接触最多的要属
想啥做啥
·
2024-01-14 05:38
SPARK
--cache(缓存)和checkpoint检查点机制
SPARK
–cache(缓存)和checkpoint检查点机制rdd的特性缓存和checkpoint作用都是进行容错rdd在计算是会有多个依赖,为了避免计算错误是从头开始计算,可以将中间*依赖rdd进行缓存或
中长跑路上crush
·
2024-01-14 04:58
Spark阶段
spark
缓存
大数据
Spark
-RDD的依赖
RDD的依赖rdd之间是有依赖关系窄依赖每个父RDD的一个Partition最多被子RDD的一个Partition所使用父rdd和子rdd的分区是一对一mapflatMapfliter宽依赖父RDD的Partition会被多个子RDD的Partition所使用父rdd和子rdd的分区是一对多grouBy()grouByKey()sortBy()sortByKey()reduceBykey()dis
中长跑路上crush
·
2024-01-14 04:58
spark
大数据
分布式
Spark
算子(RDD)超细致讲解
SPARK
算子(RDD)超细致讲解map,flatmap,sortBykey,reduceBykey,groupBykey,Mapvalues,filter,distinct,sortBy,groupBy
中长跑路上crush
·
2024-01-14 04:57
Spark阶段
spark
大数据
分布式
2023年AI发展展望
这款聊天机器人是根据该公司GPT-3模型的一个更流通、更
调优
的版本,GPT-3在2020年开启了一股神秘的人类语言
海森大数据
·
2024-01-14 04:50
人工智能
spark
入门教程(3)--
Spark
核心API开发
本教程源于2016年3月出版书籍《
Spark
原理、机制及应用》,在此以知识共享为初衷公开部分内容,如有兴趣,请支持正版书籍。
xwc35047
·
2024-01-14 04:45
Spark入门教程
spark
分布式
大数据
教程
应用
Elasticsearch性能
调优
之磁盘读写性能优化
优化磁盘空间的占用,减少磁盘空间的占用,更多的数据可以进入filesystemcache比如说你原来,磁盘空间占用一共是1T,内存只有512G,现在优化了磁盘空间占用之后,减少了数据量,可能数据量就只有512G了,那么就可以全部进入内存1、禁用不需要的功能聚合,搜索,评分,近似匹配聚合:docvalues搜索:倒排索引,index评分:norms近似匹配:index_options(freqs)任
Shaw_Young
·
2024-01-14 00:04
基于
Spark
2.x新闻网大数据实时分析可视化系统项目
课程大纲第一章:案例需求分析与设计1.全套课程内容概述2.案例需求分析3.系统架构设计4.系统数据流程设计5.集群资源规划设计第二章:linux环境准备与设置1.Linux系统常规设置2.克隆虚拟机并进行相关的配置3.对集群中的机器进行基本配置第三章:Hadoop2.X分布式集群部署1.Hadoop2.X版本下载及安装2.Hadoop2.X分布式集群配置3.分发到其他各个机器节点4.HDFS启动集
飞雪雪团队
·
2024-01-13 23:30
spark
中Rdd依赖和
Spark
SQL介绍--学习笔记
1,RDD的依赖1.1概念rdd的特性之一相邻rdd之间存在依赖关系(因果关系)窄依赖每个父RDD的一个Partition最多被子RDD的一个Partition所使用父rdd和子rdd的分区是一对一(多对一)触发窄依赖的算子map(),flatMap(),filter()宽依赖父RDD的一个partition会被子rdd的多个Partition所使用父rdd和子rdd的分区是一对多触发宽依赖的算子
祈愿lucky
·
2024-01-13 23:17
大数据
spark
学习
笔记
不用索引怎么优化百亿数据? | MySQL性能优化篇
文章目录数据库
调优
一、数据库
调优
原理1.1为什么要进行MySQL数据库
调优
?1.2什么影响数据库性能?1.3数据库
调优
到底调什么?二、数据库压力测试2.1什么是压测?
扑天鹰
·
2024-01-13 21:59
MySQL
mysql
性能优化
数据库
【面试】数据库优化、索引
目录数据库
调优
的目标索引覆盖是什么?最左缀原则是什么?哪些因素可能会造成Mysql性能问题?如果sql语句需要使用联表查询我们如何进行优化呢?Mysql常见优化手段你从哪些方面去优化你的数据库?
吴金金5
·
2024-01-13 20:11
Interview
sql
数据库
java
MySQL性能测试及
调优
中的死锁处理方法
以下从死锁检测、死锁避免、死锁解决3个方面来探讨如何对MySQL死锁问题进行性能
调优
。
测试界的世清
·
2024-01-13 18:08
自动化测试
软件测试
技术分享
mysql
数据库
工作经验谈
我的成就感来自如下三个方面:解决线上的疑难问题(性能
调优
、复杂问题排查)等等;完成一段代码的重构、一个模块的重构以及一块业务概念的重构工作的成功对业务方或客户有用在工作沟通中需要学会说不在工作中,可能会涉及到谈判
程序熊大
·
2024-01-13 16:51
菜鸟的开发之路2--数据库设计
数据库的设计与
调优
主键策略先说结果,项目最后采用了BIGINT类型的自增Id方式。思路:考虑到对事务的支持和主键索引效率(聚集索引),采用默认的InnoDB引擎。
太年轻z
·
2024-01-13 16:22
JVM分析工具
JVM在运行过程中,我们可以利用各种工具对JVM进行分析,这是性能
调优
的利器。可以通过各种工具了解在系统运行过程中,在JVM底层到底发生了什么。
sunny_daily
·
2024-01-13 15:18
jvm
java
jvm
运维
性能
【模型评估 06】超参数
调优
对于很多算法工程师来说,超参数
调优
是一件非常头疼的事情。除了根据经验设定所谓的“合理值”之外,一般很难找到合理的方法去寻找超参数的最优取值。而与此同时,超参数对于模型效果的影响又至关重要。
一碗姜汤
·
2024-01-13 14:02
机器学习
人工智能
机器学习
Web性能压力测试工具之ApacheBench(ab)详解
PS:网站性能压力测试是性能
调优
过程中必不可少的一环。只有让服务器处在高压情况下才能真正体现出各种设置所暴露的问题。
唐大帅
·
2024-01-13 14:27
服务器管理
AB性能测试
接口性能测试
ApacheBench使用方法
压力测试工具、Web性能压力测试工具ApacheBench(ab)详解
网站性能压力测试是性能
调优
过程中必不可少的一环。只有让服务器处在高压情况下才能真正体现出各种设置所暴露的问题。
NPException
·
2024-01-13 14:25
Linux
python字典转数据框,将标准python键值字典列表转换为py
spark
数据框
Considerihavealistofpythondictionarykeyvaluepairs,wherekeycorrespondtocolumnnameofatable,soforbelowlisthowtoconvertitintoapy
spark
dataframewithtwocolsarg1arg2
恶少恶言
·
2024-01-13 13:45
python字典转数据框
Spark
调试
编写代码//pom.xml4.0.0org.learn.example
spark
-example1.0-SNAPSHOTorg.apache.
spark
spark
-core_2.112.2.0providedorg.apache.
spark
spark
-sql
Jorvi
·
2024-01-13 12:51
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他