E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark调优
深入理解 Java 线程池
深入理解Java线程池包括线程池的创建、工作原理、
调优
策略等方面。2.线程池的创建Java提供了多种创建线程池的方式:2.1使用Executors工厂方法ExecutorS
hymua
·
2024-02-06 10:13
java
开发语言
决胜大数据时代:Hadoop&Yarn&
Spark
企业级最佳实践(8天完整版脱产式培训版本)...
Hadoop、Yarn、
Spark
是企业构建生产环境下大数据中心的关键技术,也是大数据处理的核心技术,是每个云计算大数据工程师必修课。
weixin_30273931
·
2024-02-06 09:08
java
人工智能
移动开发
Spark
视频第5期:
Spark
SQL架构和案例深入实战
Spark
SQL架构和案例深入实战视频下载:http://pan.baidu.com/share/link?
Rocky_wangjialin
·
2024-02-06 09:35
Spark培训
Spark企业内训
Spark公开课
Spark视频
王家林
RDD 依赖关系
packagecom.atguigu.bigdata.
spark
.core.rdd.depimportorg.apache.
spark
.
zmx_messi
·
2024-02-06 09:08
大数据
spark
转换算子小案例
2)需求描述统计出每一个省份每个广告被点击数量排行的Top33)需求分析4)功能实现整体思路代码实现packagecom.atguigu.bigdata.
spark
.core.rdd.operator.transformimportorg.apache.
spark
zmx_messi
·
2024-02-06 09:37
spark
大数据
Spark
SQL
调优
实战
1、新添参数说明//Driver和Executor内存和CPU资源相关配置--是否开启executor动态分配,开启时
spark
.executor.instances不生效
spark
.dynamicAllocation.enabled
sighting_info
·
2024-02-06 09:06
spark
sql
大数据
Python学习路线 - Python高阶技巧 - Py
Spark
案例实战
Python学习路线-Python高阶技巧-Py
Spark
案例实战前言介绍
Spark
是什么PythonOn
Spark
Py
Spark
WhyPy
Spark
基础准备Py
Spark
库的安装构建Py
Spark
执行环境入口对象
mry6
·
2024-02-06 09:34
Python
python
《linux性能及
调优
指南》 3.5 网络瓶颈
3.5NetworkbottlenecksAperformanceprobleminthenetworksubsystemcanbethecauseofmanyproblems,suchasakernelpanic.Toanalyzetheseanomaliestodetectnetworkbottlenecks,eachLinuxdistributionincludestrafficanalyz
weixin_30568591
·
2024-02-06 09:21
运维
网络
java
linux cpu内存99,Linux内存和CPU
调优
CPU和内存
调优
Monitor:Process:一个独立运行单位系统资源:CPU时间,存储空间Process:一个独立运行单位OS:VMCPU:时间:切片缓存:缓存当前程序数据进程切换:保存现场、恢复现场内存
Spin.LT
·
2024-02-06 09:21
linux
cpu内存99
Linux 性能
调优
之文件系统
调优
(Tuning file system utilization)
写在前面考试整理相关笔记博文内容涉及,文件系统常见
调优
手段不同文件系统格式适用场景分析,格式化选项,挂载日志策略调整日志和数据分离配置fstrim空间回收理解不足小伙伴帮忙指正不必太纠结于当下,也不必太忧虑未来
山河已无恙
·
2024-02-06 08:47
Linux
性能调优
linux
运维
服务器
日志结构的存储引擎
我们往往需要从众多的存储引擎中选择一个对自己应用来说适合的,针对特定的工作负载而对数据库
调优
,这需要对存储引擎的底层机制有一个大概的了解。
Dakini_Wind
·
2024-02-06 08:50
FlinkCDC-Hudi:Mysql数据实时入湖全攻略五:FlinkSQL同时输出到kafka与hudi的几种实现
前序:FlinkCDC-Hudi系列文章:FlinkCDC-Hudi:Mysql数据实时入湖全攻略一:初试风云FlinkCDC-Hudi:Mysql数据实时入湖全攻略二:Hudi与
Spark
整合时所遇异常与解决方案
大数据点灯人
·
2024-02-06 08:25
Flink
Kafka
Hudi
kafka
mysql
spark
【Flink入门修炼】1-1 为什么要学习 Flink?
一、批处理和流处理早些年,大数据处理还主要为批处理,一般按天或小时定时处理数据,代表性的框架为MapReduce、Hive、
Spark
等。
大数据王小皮
·
2024-02-06 07:29
Flink
入门修炼
flink
学习
大数据
MSR架构:推动数据中台进入2.0时代
语义层基于业务对象视图面向业务端用户提供语义化的业务逻辑表达式,支持业务端用户自助开发业务逻辑,业务端的开发者只关注于业务逻辑本身,不需要考虑后台是何种数据计算处理框架(MR、
SPARK
、FLINK、SQL
Trident敏捷数据开发平台
·
2024-02-06 07:54
架构
大数据
数据仓库
数据库开发
PiflowX新增Apache Beam引擎支持
参考资料:ApacheBeam架构原理及应用实践-腾讯云开发者社区-腾讯云(tencent.com)在之前的文章中有介绍过,PiflowX是支持
spark
和flink计算引擎,其架构图如下所示:在piflow
PiflowX
·
2024-02-06 07:54
flink
大数据
GC原理与
调优
GC原理与
调优
GC主要就是在JAVA堆中进行的。
逍遥天扬
·
2024-02-06 07:57
Spark
大数据分析与实战笔记(第二章
Spark
基础-06)
文章目录每日一句正能量2.6IDEA开发WordCount程序2.6.1本地模式执行
Spark
程序2.6.2集群模式执行
Spark
程序每日一句正能量我们全都要从前辈和同辈学习到一些东西。
想你依然心痛
·
2024-02-06 07:38
#
Spark大数据分析与实战
spark
数据分析
笔记
想学大数据?先看完这几本书再说
除了这些技术领域,还有一些特定的技术和语言需要你继续研究:Hadoop,
Spark
,Python,和R等等,还有无数实现自动化的工具等等,这些工具几乎每天都会用到,这就需要你不断的学习。
yoku酱
·
2024-02-06 06:55
JVM 性能
调优
- JVM 参数基础(2)
查看JDK版本$java-versionjavaversion"1.8.0_151"Java(TM)SERuntimeEnvironment(build1.8.0_151-b12)JavaHotSpot(TM)64-BitServerVM(build25.151-b12,mixedmode)查看Java帮助文档$java-help用法:java[-options]class[args...](执行
magic_kid_2010
·
2024-02-06 06:46
jvm性能调优
jvm基础参数
jvm调优
java
JVM 性能
调优
- JVM参数
调优
(3)
查看JVM内存的占用情况编写代码packagecom.test;publicclassPrintMemoryDemo{publicstaticvoidmain(String[]args){//堆内存总量longtotalMemory=Runtime.getRuntime().totalMemory();//jvm试图使用的最大堆内存longmaxMemory=Runtime.getRuntime(
magic_kid_2010
·
2024-02-06 06:46
jvm性能调优
jvm调优
java
JVM 性能
调优
- Java 虚拟机内存体系(1)
Java虚拟机我们简称为JVM(JavaVirtualMachine)。Java虚拟机在执行Java程序的过程中,会管理几个不同的数据区域。如下图所示:下面我会介绍这几个数据区的特点。堆堆区的几个特点:线程共享。启动时创建堆这个区。基本上所有的对象实例都在这个区分配。物理上不连接(大对象除外)。逻辑上不连接。内存分为新生代和老年代。新生代分为eden区和两个大小一样的survivor区。内存细分:
magic_kid_2010
·
2024-02-06 06:15
jvm性能调优
jvm
java
性能优化
橘子学linux
调优
之工具包的安装
今天在公司无聊的弄服务器,想着有些常用的工具包安装一下,这里就简单记录一下。一、sysstat的安装和使用1、安装我是通过源码的方式安装的,这样的好处在于可以自由选择你的版本,很直观。直接去github上找到sysstat的地址,选择对应的tag即可。我这里选择的是12.6.0,这个版本不是最新的,但是功能是完备的。1,1、源码下载https://github.com/sysstat/syssta
橘子在努力
·
2024-02-06 06:45
408
linux
JVM 性能
调优
- Java 中的四种引用(4)
为什么会有四种引用我们先回顾下在Java虚拟机内存体系(1)中提到了的垃圾回收算法1、引用计数法原理:给对象添加一个引用计数器,每当有一个地方引用它,计数器的值就加一。每当有一个引用失效,计数器的值就减一。当计数器值为零时,这个对象被认为没有其他对象引用,可当作垃圾回收。缺点:需要维护引用计数器,有一定的消耗。且较难处理循环引用的问题。(现在基本没有地方使用这种算法了,了解即可)。2、可达性分析算
magic_kid_2010
·
2024-02-06 06:11
jvm性能调优
java
jvm调优
java中的四种引用
Spark
SQL on K8s 在网易传媒的落地实践
网易传媒在2021年成功将
Spark
SQL部署到了K8s集群,并实现与部分在线业务的混合部署,到目前已经稳定运行了一年多。
wangyishufan
·
2024-02-06 06:02
kubernetes
大数据
数据分析
MySQL探险-6、
调优
文章目录一、性能分析: MySQLQueryOptimizer MySQL常见瓶颈 MySQL常见性能分析手段 性能瓶颈定位 Explain(执行计划) 使用方法: 慢查询日志 查看开启状态 开启慢查询日志 分析工具 实际使用情况 ShowProfile分析查询二、性能优化: 索引优化 一般性建议 查询优化
NarutoConanKing
·
2024-02-06 06:57
数据库
Py
Spark
(四)Py
Spark
SQL、Catalyst优化器、
Spark
SQL的执行流程
目录Py
Spark
SQL基础
Spark
Session对象DataFrame入门DataFrame构建DataFrame代码风格DSLSQL
Spark
SQLShuffle分区数目DataFrame数据写出
独憩
·
2024-02-06 03:14
PySpark
sql
数据库
python
spark
Spark
Shuffle模块详解
Shuffle,具有某种共同特征的一类数据需要最终汇聚(aggregate)到一个计算节点上进行计算。这些数据分布在各个存储节点上并且由不同节点的计算单元处理。以最简单的WordCount为例,其中数据保存在Node1、Node2和Node3;经过处理后,这些数据最终会汇聚到Nodea、Nodeb处理。这个数据重新打乱然后汇聚到不同节点的过程就是Shuffle。但是实际上,Shuffle过程可能会
晓之以理的喵~~
·
2024-02-06 03:14
大数据
Hadoop
Spark
spark
大数据
hadoop
Py
Spark
(三)RDD持久化、共享变量、
Spark
内核制度,
Spark
Shuffle
目录RDD持久化RDD的数据是过程数据RDD缓存RDDCheckPoint共享变量广播变量累加器
Spark
内核调度DAGDAG的宽窄依赖和阶段划分内存迭代计算
Spark
是怎么做内存计算的?
独憩
·
2024-02-06 03:43
PySpark
大数据
python
分布式
spark
python-sql-
spark
常用操作
2.尽量使用
spark
.sql,而不是rdd。sql处理groupby会快很多。基本上10min的rdd,sql只需2min。所以基本除了复杂函数,都用sql解决。
竹竹竹~
·
2024-02-06 03:32
MySQL
python学习
数据处理
python
sql
spark
Spark
On Yarn 运行模式
在
Spark
中,支持4种运行模式:1)Local:开发时使用2)Standalone:是
Spark
自带的,如果一个集群是Standalone的话,那么就需要在多台机器上同时部署
Spark
环境3)YARN
bandi4506
·
2024-02-06 03:02
大数据
java
关于
Spark
/Hadoop中Master/Slave IP不正确的问题
在配置
Spark
StandAloneMode的时候,我遇到了Slave无法向正确的MasterIP发送数据的问题。通常这类问题都来源于没有正确配置.
ecce
·
2024-02-06 02:37
nextcloud 优化扩展
ONLYOFFICE'allow_local_remote_servers'=>true,#应用商店加速'appstoreenabled'=>true,'appstoreurl'=>'https://www.orcy.net/ncapps/v2/',#nginx配置
调优
ordersyhack
·
2024-02-06 00:38
安全配置
解决方案
应用扩展
前端
服务器
linux
Java设计模式(GOF)-23中设计模式-更新中
推荐:关注IT技术馆原文阅读馆长准备了很多学习资料,其中包含java方面,jvm
调优
,spring/springboot/springcloud,微服务,分布式,前端,js书籍资料,视频资料,以及各类常用软件工具
艾利克斯冰
·
2024-02-06 00:06
java
设计模式
开发语言
机器学习逻辑回归模型训练与超参数
调优
##3
文章目录@[TOC]基于Kaggle电信用户流失案例数据(可在官网进行下载)逻辑回归模型训练逻辑回归的超参数
调优
基于Kaggle电信用户流失案例数据(可在官网进行下载)数据预处理部分可见:机器学习数据预处理方法
恒c
·
2024-02-05 22:41
机器学习
逻辑回归
人工智能
Spark
Sql---用户自定义函数UDF&&UDAF
文章目录1.UDF2.UDAF2.1UDF函数实现原理2.2需求:计算用户平均年龄2.2.1使用RDD实现2.2.2使用UDAF弱类型实现2.2.3使用UDAF强类型实现1.UDF用户可以通过
spark
.udf
肥大毛
·
2024-02-05 20:08
scala
大数据
spark
spark
大数据
分布式
Spark
Sql---RDD DataFrame DataSet
文章目录1.DataFrame2.DataSet3.RDD、DataFrame、DataSet三者的关系4.使用SQL操作DataFrame类型的数据4.1DSL语法4.2RDD转换为DataFrame4.3DataFrame转换为RDD5.使用SQL操作DataSet的数据5.1使用样例类序列创建DataSet5.2DataSet转换为RDD5.3DataSet和DataFrame相互转换1.D
肥大毛
·
2024-02-05 20:38
大数据
json
sql
hive
hadoop
spark
Spark
Streaming---DStream
3.1.1Transformations3.1.2join3.2有状态转换操作3.2.1UpdateStateByKey3.2.2WindowOperations4.DStream输出1.DStream是什么参考博文
Spark
Streaming
肥大毛
·
2024-02-05 20:06
scala
大数据
spark
spark
scala
sql
Oracle分析SQL执行
调优
--步骤一执行分析EXPLAINPLANFOR'需要分析的sql语句';--步骤二查看结果SELECT*FROMTABLE(DBMS_XPLAN.DISPLAY);说明信息:ID(OperationID):意义:操作的唯一标识符,用于指定执行计划中每个操作的顺序。示例:1,2,3,...Operation(操作):意义:描述执行计划中每个操作的类型。INDEXUNIQUESCAN:通过唯一索引直接
weirdo_world
·
2024-02-05 20:56
oracle
sql
数据库
CPU异常排查和JVM性能
调优
背景项目中,经常会发现系统运行一段时间后会很慢,经简单排查发现系统的CPU满负荷运行。以下是总结排查过程服务器问题排查线程问题排查在服务器上查看cpu异常的具体线程,通过打印线程栈信息确定问题发生点,以此来排查问题。参考文献:https://blog.csdn.net/gufenchen/article/details/99877714具体步骤如下:找其它几个线程,使用同样的方法发现,这些线程主要
日月星城2
·
2024-02-05 18:56
jvm
hadoop
调优
-HDFS集群数据不均衡处理hdfs balancer
查看当前的数据分布情况:hdfsdfsadmin-report现象一:集群上经常会增添新的DataNode节点,或者人为干预将数据的副本数降低或者增加。会造成datanode数据存储不均衡,一个datanode使用了70%,而有一个只使用了30%.解决:通过执行hadoop提供的balancer,来进行datanode之间数据balance。步骤:1、命令行设置宽带(如果在启动Hadoop集群前已
不会吐丝的蜘蛛侠。
·
2024-02-05 16:08
Hadoop
hadoop
hdfs
big
data
解析UE动画系统——核心实现
【U
Spark
le专栏】如果你深怀绝技,爱“搞点研究”,乐于分享也博采众长,我们期待你的加入,让智慧的火花碰撞交织,让知识的传递生生不息!
UWA
·
2024-02-05 16:36
U
Sparkle
精华来稿
动画
unreal
engine
游戏动画
Hudi学习6:安装和基本操作
目录1编译Hudi1.1第一步、Maven安装1.2第二步、下载源码包1.3第三步、添加Maven镜像1.4第四步、执行编译命令1.5第五步、HudiCLI测试2环境准备2.1安装HDFS2.2安装
Spark
3
hzp666
·
2024-02-05 14:59
Hudi
学习
hudi
Hudi学习 6:Hudi使用
准备工作:1.安装hdfshttps://mp.csdn.net/mp_blog/creation/editor/1096891432.安装
spark
spark
学习4:
spark
安装_hzp666的博客
hzp666
·
2024-02-05 14:58
Hudi
hudi
数据湖
湖仓一体
湖仓融合
实时数仓
spark
学习4:
spark
安装
1.下载
spark
安装包2.配置环境1.cd/bigdata/
spark
-3.0.1-bin-hadoop3.2/conf/2.4.添加动态库在hadoop-3.2.2/bin目录下添加hadoop.dll
hzp666
·
2024-02-05 14:58
spark
spark
大数据
PHP 及Laravel 上线优化
调优
的PHP就像是定做的套装,完全匹配你的尺寸。不过,需要注意的是,
调优
PHP只是提升PHP性能和效率的举措,对拙劣的代码和无响应的API调用无计可施。
师娘哪里去了
·
2024-02-05 14:24
计算机毕业设计hadoop+
spark
+hive小说数据分析可视化大屏 小说推荐系统 小说爬虫 小说大数据 机器学习 知识图谱 小说网站 大数据毕业设计
mapreduce对mysql中的小说数据集进行数据清洗,转为.csv文件上传至hdfs文件系统;3.根据.csv文件结构,使用hive建库建表;4.一半分析指标使用hive_sql完成,一半分析指标使用
Spark
-Scala
计算机毕业设计大神
·
2024-02-05 14:48
C++面试:数据库的连接池管理
目录基本概念工作原理核心组件实现机制优点缺点实践建议实例场景描述解决方案:引入数据库连接池配置数据库连接池使用连接池监控和
调优
效果结论数据库连接池管理是一个在软件开发中常见的优化策略,特别是在需要频繁访问数据库的场景中
Thomas_Lbw
·
2024-02-05 13:16
c++
数据库
面试
Exception in thread “main“ java.lang.NoSuchMethodError: com.google.comon.base.Preconditions.checkArg
hadoop-3.1.3hbase-2.2.2-bin一、问题描述:在学习林子雨老师编写的《
Spark
编程基础》时使用如下命令运行jar包读取HBase时出现如下错误:Exceptioninthread
学习BigData
·
2024-02-05 13:01
关于Hadoop的学习笔记
java
hadoop
hive
【
Spark
ML实践7】特征选择器FeatureSelector
本节介绍了用于处理特征的算法,大致可以分为以下几组:提取(Extraction):从“原始”数据中提取特征。转换(Transformation):缩放、转换或修改特征。选择(Selection):从更大的特征集中选择一个子集。局部敏感哈希(LocalitySensitiveHashing,LSH):这类算法结合了特征转换的方面与其他算法。FeatureSelectorsVectorSlicerVe
周润发的弟弟
·
2024-02-05 12:41
Spark机器学习
spark-ml
Spark
依赖包加载方式
1
Spark
依赖包来源我们知道
Spark
application运行加载依赖有三个地方:systemClasspath:
Spark
安装时候提供的依赖包,${
SPARK
_HOME}/jars下的包。
大数据AI
·
2024-02-05 12:11
大数据从入门到精通
spark
大数据
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他