E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark调优
【转】idea设置JVM运行参数
对JVM运行参数进行修改是JVM性能
调优
的重要手段,下面介绍在应用程序开发过程中JVM参数设置的几种方式。
全栈测试笔记
·
2023-12-28 23:56
测试基础(含环境搭建)
java
python
linux
jvm
tomcat
Hbase BulkLoad用法
要导入大量数据,Hbase的BulkLoad是必不可少的,在导入历史数据的时候,我们一般会选择使用BulkLoad方式,我们还可以借助
Spark
的计算能力将数据快速地导入。
kikiki2
·
2023-12-28 23:55
系列十四、SpringBoot + JVM参数配置实战
调优
一、SpringBoot+JVM参数配置实战
调优
1.1、概述前面的系列文章大篇幅的讲述了JVM的内存结构以及各种参数,今天就使用SpringBoot项目实战演示一下,如何进行JVM参数
调优
,如果没有阅读过前面系列文章的朋友
YYAugenstern
·
2023-12-28 23:20
JVM系列
JVM
SpringBoot
【已解决】TypeError: __init__() got an unexpected keyword argument ‘min_impurity_split‘
在此不加
调优
的指定随机森林的相关超参数防止过拟合:参数n_estimators:指定随机森林中决策树的数量为100;参数max_depth:指定决策树的最大深度为5;参数min_samples_leaf
ZERWW
·
2023-12-28 21:14
python
随机森林
新特性解读 | binlog 压缩
作者:王福祥爱可生DBA团队成员,负责客户的数据库故障处理以及
调优
。擅长故障排查及性能优化。对数据库相关技术有浓厚的兴趣,喜欢分析各种逻辑。
爱可生开源社区
·
2023-12-28 21:25
Java开发框架和中间件面试题(10)
113.如何进行JVM性能
调优
?115.GC
调优
策略有哪些?116.介绍下单点登
龙贝子
·
2023-12-28 19:04
面试题
java
开发语言
中间件
ClickHouse 单机安装及基础知识与
Spark
应用
什么是ClickHouse?ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。在传统的行式数据库系统中,数据按如下顺序存储:处于同一行中的数据总是被物理的存储在一起。常见的行式数据库系统有:MySQL、Postgres等。在列式数据库系统中,数据按如下的顺序存储:这些示例只显示了数据的排列顺序。来自不同列的值被单独存储,来自同一列的数据被存储在一起。不同的数据存储
月亮给我抄代码
·
2023-12-28 18:36
clickhouse
spark
数据库
【大数据】Hudi HMS Catalog 完全使用指南
HudiHMSCatalog完全使用指南1.HudiHMSCatalog基本介绍2.在Flink中写入数据3.在FlinkSQL中查看数据4.在
Spark
中查看数据5.在Hive中查看数据1.HudiHMSCatalog
G皮T
·
2023-12-28 18:24
#
Hudi
大数据
hudi
数据湖
hive
flink
spark
metastore
spark
应用编写时5个最需要避免的错误
https://www.slideshare.net/cloudera/top-5-mistakes-to-avoid-when-writing-apache-
spark
-applications
Bitson
·
2023-12-28 18:24
Actor模型与Akka Actor体系基础总结
前言最近用业余时间把Flink的RPC基础设施翻了个底朝天,又与之前分析过的
Spark
RPC机制做了一些对比,越发觉得Actor模型甚为精妙,值得简单记录一下,顺便也可作为日后解析FlinkRPC机制的基础入门
LittleMagic
·
2023-12-28 17:51
Dbeaver,Hudi,Hive,
Spark
,Presto应用问题及解决措施梳理
问题1:基于Dbeaver工具,新建的Hudi表无法进行更新(即表结构,新增字段等);解决措施:在Dbeaver中集成
spark
的包,通过
spark
SQL的方式进行Hudi表的新建,解决表无法更新问题。
p1i2n3g4
·
2023-12-28 17:31
大数据
hive
spark
hadoop
阿里中间件团队4面真题(60W):线程锁+分布式锁+Kafka等
synchronized和ReentrantLock相关的底层实现线程池的底层实现以及常见的参数数据结构基本都问了一遍:链表、队列等Java内存模型:常问的JVM分代模型,以及JDK1.8后的区别,最后还问了JVM相关的
调优
参数分布式锁的实现比较技术一面题目
AI乔治
·
2023-12-28 17:53
PingCAP 被评为 Translytical Data Platforms 2023 全球技术领导者
近日,PingCAP在全球化商业咨询公司QuadrantKnowledgeSolutions公布的
SPARK
MatrixforTranslyticalDataPlatforms中,被评为2023年全球TranslyticalDataPlatforms
TiDB_PingCAP
·
2023-12-28 16:40
tidb
TiDB
数据库
macOS hadoop+
spark
+scala安装教程
macOShadoop+
spark
+scala安装教程环境搭建操作系统:macOS10.13.6JDK:1.8.0_201hadoop:2.8.5
Spark
:2.4.3Scala:2.13.0一、文件准备
飞翔客栈
·
2023-12-28 15:43
Flink 在有赞实时计算的实践
在这个部分,主要是Flink与
Spark
的structuredstreaming的一些对比和选择Flink的原因。第三个就是比较重点的内容,Flink在有赞的实践。
有赞技术团队
·
2023-12-28 15:11
Spark
- 动态注册UDF
昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki2
·
2023-12-28 14:18
2023 云原生编程挑战赛收官:1.8 万人报名,冠军花落北京邮电大学、电子科技大学、旷识科技
大赛专家评审团认为,三大赛道的冠军团队,方案思路清晰,提出的技术优化点具有可落地性,在多个常见问题以及性能
调优
中的解决思路具有很高的借鉴意义,能深入到
阿里云云原生
·
2023-12-28 12:56
云原生
科技
探究Presto SQL引擎(1)-巧用Antlr
从Hadoop生态的Hive,
Spark
,Presto,Kylin,Druid到非Hadoop生态的Clic
vivo互联网技术
·
2023-12-28 12:14
Hadoop安装笔记_单机/伪分布式配置_Hadoop3.1.3——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理
将下发的ds_db01.sql数据库文件放置mysql中12、编写Scala代码,使用
Spark
将MySQL的ds_db01库中表user_info的全量数据抽取到Hive的ods库中表user_info
Stitch .
·
2023-12-28 12:32
我的大学笔记
Hadoop
分布式
大数据
hadoop
笔记
hadoop hive
spark
flink 安装
下载地址Indexof/distubuntu安装hadoop集群准备IP地址主机名称192.168.1.21node1192.168.1.22node2192.168.1.23node3上传hadoop-3.3.5.tar.gz、jdk-8u391-linux-x64.tar.gzJDK环境node1、node2、node3三个节点解压tar-zxvfjdk-8u391-linux-x64.tar
nsa65223
·
2023-12-28 11:59
hadoop
hive
spark
【头歌实训】Py
Spark
Streaming 数据源
文章目录第1关:MySQL数据源任务描述相关知识Py
Spark
JDBC概述Py
Spark
JDBCPy
Spark
StreamingJDBC编程要求测试说明答案代码第2关:Kafka数据源任务描述相关知识Kafka
撕得失败的标签
·
2023-12-28 11:24
【头歌实训】
pyspark
streaming
Kafka
mysql
kafka
头歌实训
[
spark
] RDD, DataFrame和DataSet是什么?如何相互转化
文章目录是什么如何转化是什么在Apache
Spark
中,RDD(ResilientDistributedDataset)、DataFrame和Dataset是三个不同的数据抽象层,各自有不同的特点和用途
言之。
·
2023-12-28 11:53
spark
大数据
分布式
[
spark
] SaveMode
https://
spark
.apache.org/docs/latest/api/java/index.html?
言之。
·
2023-12-28 11:53
spark
大数据
分布式
hql、数据仓库、sql
调优
、hive sql、python
SQL/HQLHQL(HibernateQueryLanguage)是面向对象的查询语言SQL的操作对象是数据列、表等数据库数据;而HQL操作的是类、实例、属性#FROMStringhql="fromcom.demo.bean.User"="select*fromuser"#WHERE"formUseruwhereu.id=1"="select*formuserwhereid=1"#查询出一个St
许一世流年 绝不嵩手 cium
·
2023-12-28 11:46
数据仓库
sql
hive
Linux系统性能的四个指标:CPU、内存、磁盘、网络
Linux系统
调优
时需要用到一些工具来查看和分析CPU/内存/磁盘/网络的情况,先根据四个方面对接的工具进行介绍。
运维仙人
·
2023-12-28 10:53
运维
Spark
从入门到精通23:
Spark
SQL简介
Spark
SQL是
Spark
专门用来处理结构化数据的一个模块,它提供了一个名为DataFrame的编程抽象,并且可以作为分布式SQL查询引擎来使用。本节就来介绍一下
Spark
SQL的相关知识。
金字塔下的小蜗牛
·
2023-12-28 09:20
JVM 性能
调优
——HotSpot VM
调优
记录
宿主机硬件:8核/16G内存/50G磁盘,系统:CentOS7.7,Docker单实例。1.JDK默认启动参数硬件:4核/8G内存/256G磁盘,系统:Windows7。查看JDK1.8默认启动参数命令:#java-XX:+PrintCommandLineFlags-version返回:-XX:InitialHeapSize=126504256//等价于-Xms1g,JVM堆初始大小(新生代+老年
一叶知秋V
·
2023-12-28 08:22
JVM
java
jmap
dump
mat
内存分析
java进程无故消失的原因分析
先不考虑jvm关于young/old的相关
调优
。排除由jvm引发的进程猝死。free命令查看机器内存既然不是jvm的问
酱君挺怎样
·
2023-12-28 06:24
数据存储与数据库性能
调优
:原理与实践
1.背景介绍随着数据的增长和复杂性,数据库性能
调优
成为了一个重要的话题。数据库性能
调优
可以帮助我们更有效地存储和查询数据,从而提高系统的性能和可用性。
一枚可爱的程序女孩
·
2023-12-28 05:14
React入门实战
Java入门实战
Python
Java
React
最新AI系统ChatGPT网站H5系统源码,支持Midjourney绘画,GPT语音对话+ChatFile文档对话总结+DALL-E3文生图
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-28 05:05
人工智能
ChatGPT
AIGC
人工智能
chatgpt
AI作画
语音识别
midjourney
Oracle统计信息的魔力
Oracle统计信息的概述二、统计信息主要包括以下内容三、收集统计信息的方法使用dbms_stats程序包手动收集收集的是系统统计信息四、案例一、Oracle统计信息的概述Oracle统计信息是数据库性能
调优
的关键组成部分
无情白
·
2023-12-28 04:48
Oracle
OCP
oracle
数据库
Spark
- SQL查询文件数据
那么我们可以利用
spark
-sql直接操作文件的特性处理这类的需求,姐姐再也不用担心我不会
spark
了,因为我就只会sql。##使用方法csv```
spark
.sql("select*fromcsv.
kikiki4
·
2023-12-28 03:49
Hadoop集成对象存储和HDFS磁盘文件存储
1.环境配置1.1版本说明组件版本是否必须其他事项Hadoop3.3.0+是hadoop3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用
spark
sql,使用hive
tuoluzhe8521
·
2023-12-28 02:38
Hadoop
hadoop
hdfs
大数据
阿里云
Mysql深度讲解 – Join语句
更多Mysql
调优
内容请点击【Mysql优化-深度讲解系列目录】。Join语法简单来说Join一共有三种连接形式:内连接、左连接和右连接,其中左连接和右连接可以合并称为外连接。
Smallc0de
·
2023-12-28 02:00
Mysql
数据结构
spark
开发笔记(三、
Spark
SQL笔记)
基本概念Shark、
Spark
SQL和Hive之间的关系:Shark借用了Hive大部分的组件,包括词法分析、语法分析和逻辑分析阶段,只是在最后将逻辑执行计划转化为物理执行计划这一步,将底层的实现从MapReduce
眼君
·
2023-12-27 22:27
EFCore
调优
EFCore
调优
篇一.DBFirst1.引入程序包Install-PackageMicrosoft.EntityFrameworkCore.SqlServerInstall-PackageMicrosoft.EntityFrameworkCore.ToolsInstall-PackageMicrosoft.EntityFrameworkCore.SqlServer.Design
kalvin_y_liu
·
2023-12-27 21:00
DDD
C#
中级知识汇总
.NET
CORE
数据库
sqlserver
【头歌实训】
Spark
MLlib ( Python 版 )
文章目录第1关:基本统计编程要求测试说明答案代码第2关:回归编程要求测试说明参考资料答案代码第3关:分类编程要求测试说明参考资料答案代码第4关:协同过滤编程要求测试说明参考资料答案代码第5关:聚类编程要求测试说明参考资料答案代码第6关:降维编程要求测试说明参考资料答案代码第7关:特征提取与转化编程要求测试说明答案代码第8关:频繁模式挖掘编程要求测试说明参考资料答案代码第9关:评估指标编程要求测试说
撕得失败的标签
·
2023-12-27 20:26
【头歌实训】
spark-ml
python
开发语言
头歌实训
【头歌实训】
Spark
完全分布式的安装和部署
文章目录第1关:Standalone分布式集群搭建任务描述相关知识课程视频
Spark
分布式安装模式示例集群信息配置免密登录准备
Spark
安装包配置环境变量修改
spark
-env.sh配置文件修改slaves
撕得失败的标签
·
2023-12-27 20:56
【头歌实训】
分布式
spark
大数据
头歌实训
【头歌实训】
Spark
完全分布式的安装和部署(新)
文章目录第1关:Standalone分布式集群搭建任务描述相关知识课程视频
Spark
分布式安装模式主机映射免密登录准备
Spark
安装包配置环境变量修改
spark
-env.sh配置文件修改slaves文件分发安装包启动
撕得失败的标签
·
2023-12-27 20:56
【头歌实训】
分布式
spark
wpf
头歌实训
【头歌实训】Py
Spark
Streaming 入门
文章目录第1关:
Spark
Streaming基础与套接字流任务描述相关知识
Spark
Streaming简介Python与
Spark
StreamingPython
Spark
StreamingAPI
Spark
Streaming
撕得失败的标签
·
2023-12-27 20:54
【头歌实训】
pyspark
streaming
头歌实训
【知乎大数据技术】用Flink取代
Spark
Streaming!知乎实时数仓架构演进
“数据智能”(DataIntelligence)有一个必须且基础的环节,就是数据仓库的建设,同时,数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务。从智能商业的角度来讲,数据的结果代表了用户的反馈,获取结果的及时性就显得尤为重要,快速的获取数据反馈能够帮助公司更快的做出决策,更好的进行产品迭代,实时数仓在这一过程中起到了不可替代的作用。本文主要讲述知乎的实时数仓实践以及架构的演进,这包
yoku酱
·
2023-12-27 19:34
Impala 基于hive的交互式实时分析工具(一) 概念及原理介绍
技术背景impala是参照谷歌的新三篇论文(caffeine-网络搜索引擎,pregel-图形数据库,dremel-瞬时类sql查询)当中的dremel而来,号称是当前大数据领域最快的sql查询工具,比
spark
sql
章云邰
·
2023-12-27 19:59
Spark
与Py
Spark
(1.概述、框架、模块)
目录1.
Spark
概念2.Hadoop和
Spark
的对比3.
Spark
特点3.1运行速度快3.2简单易用3.3通用性强3.4可以允许运行在很多地方4.
Spark
框架模块4.1
Spark
Core4.2
Spark
SQL4.3
Spark
Streaming4.4MLlib4.5GraphX5
还是那个同伟伟
·
2023-12-27 18:06
Spark
spark
大数据
分布式
python
hive总结06_企业级
调优
目录本地模式表的优化小表、大表Join大表Join大表MapJoinGroupByCount(Distinct)去重统计笛卡尔积行列过滤动态分区调整分桶分区数据倾斜合理设置Map数小文件进行合并复杂文件增加Map数合理设置Reduce数并行执行严格模式JVM重用推测执行压缩执行计划(Explain)Fetch抓取Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如
自由地带
·
2023-12-27 18:21
hive
hive
优化
Hive 执行计划 & 性能
调优
一、执行计划explain,查看基本信息explaindependency,查看依赖信息explainauthorization,查看权限信息1.explain用法--explain+执行语句例如:explainselects2.s_id,avg(s2.s_score)asavg_scorefromedu.studentsjoinedu.scores2ons.s_id=s2.s_idwheres.
巷子里的猫X
·
2023-12-27 18:51
数据分析
hive
java
mysql
【Hive】性能
调优
- Map JOIN
Hive版本:hive-3.1.3map-sideJOIN和MapJOIN的区别map-sideJOIN就是预聚合,在map阶段先聚合一下,这样数据到了reduce有可能就不倾斜了MapJOIN就是缓存小表,没有shuffle,没有reduce概述如果表关联时,有一张表很小,那么可以在大表通过mapper时将小表完全加载到内存中,Hive可以在map端完成关联过程,这就是所谓的map-sideJO
青云游子
·
2023-12-27 18:21
Hive
hive
大数据
hadoop
大数据篇--Hive
调优
文章目录一、表设计层面1.关闭动态分区:2.开启分桶:3.采用合适的存储格式:二、参数
调优
1.严格模式:2.FetchTask功能:3.reduce个数控制:4.mapjoin:5.skewjoin方案
小强签名设计
·
2023-12-27 18:20
大数据面试
hive
调优
Hive优化-SQL
调优
Hive优化-SQL
调优
此博客参考了其他博客:hivesqlhttps://www.cnblogs.com/fnlingnzb-learner/p/13087976.html后续还会继续更新和优化优化的根本思想
ShyGlow
·
2023-12-27 18:20
大数据
#
Hive
hive
大数据
Hive 在工作中的
调优
总结
总结了一下在以往工作中,对于HiveSQL
调优
的一些实际应用,是日常积累的一些优化技巧,如有出入,欢迎在评论区留言探讨~一、EXPLAIN查看执行计划二、建表优化2.1分区分区表基本操作,partitioned
fx67ll
·
2023-12-27 18:50
大数据开发文档
hive
大数据
hadoop
大数据之hive_hive的企业级
调优
简单
调优
:1.测试数据可以本地模式运行2.select字段时禁止使用*还可以加上where进行行列过滤3.selectfromajoinb时避免直接join,因为会产生笛卡尔积,建议加上on进行过滤,减少数据量
普罗米修斯之火
·
2023-12-27 18:50
hive
大数据
上一页
40
41
42
43
44
45
46
47
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他