E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
zookeeper调优
一文成为MySQL
调优
老鸟
一文成为MySQL
调优
老鸟一定位性能低的SQL1查看是否开启了慢查询日志showvariableslike'slow_query_log';默认是OFF,不开启,可以手动开启2开启慢查询日志setglobalslow_query_log
NIIMP
·
2023-10-03 05:41
面试题
mysql
mysql
数据库
Spark SQL 与 Hive 的小文件
调优
文章目录小文件危害表的缓存shuffle分区数调整SparkSQL客户端设置合并Hive客户端处理小文件合并动态分区
调优
小文件归档小文件危害小文件会造成nn处理压力变大,大大降低了读取性能,整个HDFS
月亮给我抄代码
·
2023-10-03 03:51
spark
hive
sql
大数据
Spark3.0核心
调优
参数小总结
点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜本文已经加入「大数据成神之路PDF版」中提供下载。你可以关注公众号,后台回复:「PDF」即可获取。更多PDF下载可以参考:《重磅,大数据成神之路PDF可以分类下载啦!》Spark重点难点系列:《【Spark重点难点01】你从未深入理解的RDD和关键角色》《【Spark重点难点02】你以为的Shuffle和真正的Shuffle》《【Spark
王知无(import_bigdata)
·
2023-10-03 03:21
大数据
spark
python
java
数据分析
spark-sql
调优
技巧
sparkSQL概述sparkSQL的前世今生==Shark是专门针对于spark的构建大规模数据仓库系统的一个框架==Shark与Hive兼容、同时也依赖于Spark版本Hivesql底层把sql解析成了mapreduce程序,Shark是把sql语句解析成了Spark任务随着性能优化的上限,以及集成SQL的一些复杂的分析功能,发现Hive的MapReduce思想限制了Shark的发展。最后Da
柱子z
·
2023-10-03 03:21
spark-sql
大数据
hadoop
spark
Spark性能
调优
--资源参数
调优
、算子
调优
、Shuffle参数
调优
、Spark 数据倾斜
调优
一、资源参数
调优
了解完了Spark作业运行的基本原理之后,对资源相关的参数就容易理解了。
四月天03
·
2023-10-03 03:20
Spark
spark
big
data
scala
Spark 任务如何
调优
spark性能
调优
a.分配更多资源——第一步要做的比如增加executor个数(num_executor)、增加executor的cpu核数(executor_cores)、增加executor的内存量
星空下的那个人影
·
2023-10-03 03:50
大数据面试
spark
spark
spark 任务
调优
参数及问题整理
1.数据倾斜:最简单的做法:在sql中使用随机数distributebyrand()在sql末尾加select*fromaleftjoinbona.xx=b.xxdistributebyrand()在进行的join中如果关联字段出现大量的null值的时候,也会出现数据倾斜,这种情况,最好过掉null值,再关联。2.spark.dynamicAllocation.enabled=true开启动态资源
小小小小小小小小小小码农
·
2023-10-03 03:50
大数据
spark
spark SQL 参数
调优
1.spark.sql.codegen默认值为false,当它设置为true时,SparkSQL会把每条查询的语句在运行时编译为java的二进制代码。这有什么作用呢?它可以提高大型查询的性能,但是如果进行小规模的查询的时候反而会变慢,就是说直接用查询反而比将它编译成为java的二进制代码快。所以在优化这个选项的时候要视情况而定。2spark.sql.inMemoryColumnStorage.co
爱学习的小肥猪
·
2023-10-03 03:20
spark
Spark on Yarn资源
调优
前言Spark是专为大规模数据处理而设计的快速通用的计算引擎,具有速度快、支持多语言、移植性高的特点。而移植性高的体现就在于Spark的部署方式有多种模式,如:本地local、Standalone、ApacheMesos、HadoopYARN、EC2、Mesos、K8S等等。背景一般公司的大数据项目基础设施都是建立在hdfs之上,所以在大部分的公司里,Spark都是跑在Yarn之上,yarn作为一
chimchim66
·
2023-10-03 02:50
Hadoop
spark
big
data
hadoop
Spark
调优
— 资源
调优
&参数
调优
spark-submit参数具体如下:spark-submit\--queue${1}\#指定资源队列,否则默认default--masteryarn--deploy-mode${2}\#clientorcluster:选择客户端模式或者集群模式提交:决定driver是在本地还是集群内节点:cluster模式能够降低本地压力,发挥集群服务器优势--num-executors${3}\#启动的exe
daoxu_hjl
·
2023-10-03 02:50
Spark
Spark性能
调优
文章目录一、概述二、资源参数
调优
1参数
调优
①num-executors②executor-memory③executor-core④driver-memory⑤Spark.default.parallelism⑥Spark.storage.memoryFraction⑦Spark.Shuffle.memoryFraction
爱小可爱的IT白
·
2023-10-03 02:49
spark
大数据
分布式
用户画像5:开发性能及作业调度
本章主要总结开发性能
调优
及作业调度相关的产品知识,性能
调优
主要是减少性能消耗和提高ETL作业时间,常见的
调优
就会数据倾斜
调优
、合并小文件、缓存中间数据、开发中间表等方式。
一只森林鹿Luluzeng
·
2023-10-03 02:49
jvm
调优
常用工具
1、jps查看进程2、jmap查看内存信息,实例个数以及占用内存大小jmap-histo14660jmap-heap14660jmap-dump:format=b,file=eureka.hprof14660(可以设置内存溢出自动导出dump文件-XX:+HeapDumpOnOutOfMemoryError-XX:HeapDumpPath=./)用jvisualvm命令工具导入该dump文件分析3
回眸。等待
·
2023-10-02 22:52
jvm
Zookepper===>动物管理员系统
我们将多个服务器看成不同的动物,而
Zookeeper
就是一个管理员,用来观察这些动物的状态,而我们客户端每次在进行观赏动物之前,都要跟管理员交互,一旦管理员发现有死亡动物,便会通知想观赏该动物的客户。
梵高的猪v
·
2023-10-02 21:39
Spring
Zookeeper
Linux环境下
zookeeper
的安装教程(超详细!!)
1.什么是
zookeeper
2.为什么要使用
zookeeper
3.
zookeeper
的安装与配置3.1.环境准备3.2.下载安装3.3配置3.3.启动测试3.4.退出1.什么是
zookeeper
zooKeeper
啊陈晓
·
2023-10-02 21:38
zookeeper
java
linux
java-zookeeper
zookeeper
从其它环境转移到Nacos的方法-NacosSync
理解NacosSync组件启动NacosSync服务通过一个简单的例子,演示如何将注册到
Zookeeper
的Dubbo客户端迁移到Nacos。
Doker 多克 技术人的数码品牌
·
2023-10-02 20:28
#
nacos
nacos
kafka简易搭建(windows环境)
1,下载ApacheKafka查找kafka_2.13-3.2.1.tgz2,java版本需要17以上3,配置server.properties的log.dirs目录、
zookeeper
.properties
阿杰技术
·
2023-10-02 20:40
Java
kafka
分布式
搭建金融信贷风控中的机器学习模型-(6)模型验证、监控与
调优
1.模型的区分度评分模型的作用是通过分数将好坏样本进行区分。理想情况下,所有非违约人群的分数均高于违约人群的分数。因此我们需要某些统计量来衡量好坏样本的分数差异性,即评分模型的区分能力。评分指标需要满足一定的性质:与区分能力单调相关,即指标越高,区分能力越强;与好坏样本的占比不相干,即好坏样本分层抽样后,衡量指标不会明显改变。好坏样本分布的差异性:KSks=max(TPR-FPR),KS值越大,区
GQRstar
·
2023-10-02 18:19
简单整合:
zookeeper
+dubbo
原因:dubbo建议使用
zookeeper
作为服务注册中心。
zookeeper
:是用来做负载均衡和注册中心,那一个服务由哪一个机器来提供必需要让调用者知道,简单来说就是ip地址和服务名称的对应关系。
栋哥0228
·
2023-10-02 18:28
Leader选举算法
7.6.1Leader选举算法概述在paxos到
zookeeper
这本书里对Leader选举并没有详细的介绍,只是轻描带过,上一节讲到Leader选举算法的设计思路:很简单,找所有机器中拥有最大ZXID
流川_38c7
·
2023-10-02 16:50
MySQL进阶_3.性能分析工具的使用
文章目录第一节、数据库服务器的优化步骤第二节、查看系统性能参数第三节、慢查询日志第四节、查看SQL执行成本第五节、分析查询语句:EXPLAIN第一节、数据库服务器的优化步骤当我们遇到数据库
调优
问题的时候
珍珠是蚌的眼泪
·
2023-10-02 15:44
MySQL
mysql
数据库
java
intellij-idea
2019-08-16大魔王
Netflix在设计EureKa时遵循着AP原则,它基于REST的服务,用于定位服务,以实现云端中间层服务发现和故障转移,功能类似于Dubbo的注册中心
Zookeeper
。
少年_2ddb
·
2023-10-02 13:48
(10)QJ_黑电平&AWB&CCM校正步骤&raw数据抓取
1,设备准备:待校正主控+SENSOR+镜头+镜头盖(可抓raw版本)2,环境准备:图像室灯箱环境,24色卡,照度计3,说明书准备:《HiISP颜色
调优
说明》、《图像质量调试工具使用指南》4,工具准备:
Nik_TellYou
·
2023-10-02 07:47
Linux嵌入式
IP-Camera开发
java后端面试不知道多少家重庆的公司得来的题目总结
是如何生成微服务链路检测泛型的实现cglib的实现有哪些开发规范你对雪崩效应的看法看过哪些源代码熔断器的使用高并发场景mybatis一级缓存,二级缓存docker(k8s)docker-composeJVM
调优
NuiiQK
·
2023-10-02 06:47
资料
java
java
Zookeeper
学习笔记01
一、zk_开篇_课程介绍一、课程升级的重点内容1、
Zookeeper
分布式锁案例2、Paxos算法3、ZAB协议4、CAP5、源码(zk服务端初始化源码、服务器端加载数据源码、选举算法、状态同步算法、Leader
突然好想你之路在脚下
·
2023-10-02 06:08
zookeeper
学习
笔记
内外网结合的多服务发布架构
2)内网的图形工作站一台,实体机,可用于AIGC大模型的
调优
及服务。3)已备案的域名一个。3.部署方式1)梳理所有需要发布的web服务,根据业务区
James506
·
2023-10-02 06:55
Server
Linux
内网服务
多服务发布
Kafka之Docker部署Kafka kraft集群
最近趁着有空想复习一下Kafka原理,之前学的是Kafka1.9的版本,需要
Zookeeper
作为基础,专门存放Kafka的元数据使用,如Broker、Consumer、Topic等;但下载的时候发现Kafka
Genterator
·
2023-10-02 04:35
Kafka从入门到放弃
kafka
docker
Hbase 基础面试题
(1)Hbase一个分布式的基于列式存储的数据库,基于Hadoop的hdfs存储,
zookeeper
进行管理。
Tim在路上
·
2023-10-02 03:33
kafka与
zookeeper
的集群
systemctldisablefirewalldsetenforce0sed-i's/SELINUX=enforcing/SELINUX=disabled/'/etc/selinux/configvi/etc/hostsip1node1ip2node2ip3node3
zookeeper
查士丁尼·绵
·
2023-10-02 03:09
中间件
kafka
zookeeper
Spark
调优
之 -- Spark的并行度深入理解(别再让资源浪费了)
1.并行度理解 Spark作业中,各个stage的task的数量,代表Spark作业在各个阶段stage的并行度。分为资源并行度(物理并行度)和数据并行度(逻辑并行度)在SparkApplication运行时,并行度可以从两个方面理解:1、资源的并行度:由节点数(executor)和CPU数(core)决定2、数据的并行度:task数量和partition大小task又分为map时的task和re
erainm
·
2023-10-01 19:36
Spark
spark
spark SQL 任务参数
调优
1
1.背景要了解spark参数
调优
,首先需要清楚一部分背景资料SparkSQL的执行原理,方便理解各种参数对任务的具体影响。
浩海紫冰
·
2023-10-01 19:06
大数据
大数据
spark
hadoop技术内幕
mapreduce编程模型4、mapreducerpc框架解析5、作业提交与初始化过程分析6、jobtracker内部实现剖析7、tasktracker内部实现剖析8、task运行过程分析9、hadoop性能
调优
冥想者-定
·
2023-10-01 17:41
__Hadoop杂谈
geoserver
配色相关透明度设置安装配置Windowsjdk环境配置geoserver安装安装一体化包(基于jetty推荐)基于tomcat安装Linux(centos7.9)基于tomcat安装geoserver性能
调优
alun550
·
2023-10-01 16:59
geoserver
geoserver全记录
zookeeper
第一章:集群搭建
系列文章目录
zookeeper
第一章:集群搭建文章目录系列文章目录前言一、软件下载二、单机模式三、集群模式四、启动脚本总结前言
zookeeper
是apache基金会下的一个分布式管理框架,可以用来管理Hadoop
超哥--
·
2023-10-01 16:36
zookeeper
java-zookeeper
zookeeper
分布式
【
ZooKeeper
系列】2.用Java实现
ZooKeeper
API的调用
授之以鱼不如授之以渔的道理相信大家都明白,也希望通过猿人谷的这个
ZooKeeper
系列,让大家入门、到熟悉,举一反三后能精通
ZooKeeper
。
猿人谷
·
2023-10-01 16:23
Kafka集群架构设计原理详解
文章目录1、
zookeeper
整体数据2、ControllerBroker选举机制1、
zookeeper
整体数据Kafka将状态信息保存在
Zookeeper
中,这些状态信息记录了每个Kafka的Broker
Tacy0213
·
2023-10-01 14:33
MQ
kafka
分布式
数据库性能优化方案
数据库优化方案前言数据库性能优化方案SQL
调优
表结构优化硬件优化架构优化分库分表详解分库单应用单数据库多应用单数据库多应用多数据库分表水平拆分和垂直拆分单库内拆分和多库拆分分库分表带来的复杂性跨库关联查询分布式事务排序
Fong灵
·
2023-10-01 14:31
解决方案
数据库
数据库
性能优化
mysql
MYSQL高级——主从复制
作用能够查到到底哪些SQL需要进行
调优
如何使用?MySQL默认是关闭了这个功能的,因为会带来性能的影响,需要的话自己开启即可。具体使用见课件。
ZUCC1717
·
2023-10-01 13:59
MYSQL
数据库
mysql
java
StarRocks
调优
- Broker Load导入
BrokerLoad是StarRocks离线导入方式,用于将存储在HDFS、S3、OSS等外部存储的数据导入到StarRocks,支持CSV、ORCFile、Parquet等文件格式,适用于几十GB到上百GB的数据导入。Broker部署BrokerLoad通过Broker进程访问远端存储,因此使用BrokerLoad前需要搭建好Broker。Broker的搭建分为三步:1、切换到StarRocks
Asware
·
2023-10-01 12:39
数据仓库
数据仓库
zookeeper
理论学习(paxos和Zab协议)
为什么要使用
zookeeper
(chubby开源实现)—动物园管理员协调分布式环境下的服务解决分布式环境中的问题分布式环境下无法保证顺序执行分布式环境下无法明确执行结果(可能由于网络的波动,无法判断结果是否执行成功
qtshe
·
2023-10-01 12:06
zookeeper
安装说明
本次安装版本为3.4.6,部署在87、88和89上面,安装目录为/opt/
zookeeper
-3.4.6打开www.apache.org下载安装包执行解压命令tarxzf
zookeeper
-3.4.6.
weixin_42874480
·
2023-10-01 12:32
分布式
hadoop
大数据
zookeeper
linux
大数据之kafka集群部署
单机多broker一.在单独服务器部署
zookeeper
,kafka1.复制config/server.properties为server-1.propeties,并进行如下修改[root@centos6kafka
weixin_42874480
·
2023-10-01 12:02
大数据
kafka
分布式
大规模语言模型--LLaMA 家族
特别需要指出的是,指令
调优
LLaMA已成为一种主要开发定制
hanscalZheng
·
2023-10-01 11:56
大语言模型
语言模型
llama
人工智能
AutoML--参数自动搜索
最近有一个模型
调优
的事情,正好过年的时候看过automl里面有一个贝叶斯参数优化,尝试用了一下,感觉还比较有效。
吴祺育的笔记
·
2023-10-01 09:03
[Kafka] 基于 docker-compose 快速安装及使用 Kafka
1.配置yml文件创建docker-compose.yml文件,写入以下内容version:'3.8'services:
zookeeper
:container_name:
zookeeper
image:wurstmeister
風の唄を聴け
·
2023-10-01 05:42
Kafka
Docker
kafka
docker
kafka依赖_利用docker和docker-compose部署单机kafka
dockerrun-d--name
zookeeper
-p2181:2181wurstmeister/
zookeeper
d
weixin_39907526
·
2023-10-01 05:12
kafka依赖
单机
docker
部署fastfds
docker-compose安装kafka集群以及golang简单操作kafka
docker-compose本文搭建集群为无认证方式一:docker-compose搭建kafka集群1.创建kafka目录并进入此目录2.创建docker-compose.yamlversion:'2'services:
zookeeper
有理想lll
·
2023-10-01 05:41
docker
kafka
golang
Kafka(一)使用Docker Compose安装单机Kafka以及Kafka UI
文章目录Kafka中涉及到的术语Kafka镜像选择KafkaUI镜像选择DockerCompose文件Kafka配置项说明KRaftvs
Zookeeper
和KRaft有关的配置关于Controller和
JackSparrow414
·
2023-10-01 05:39
消息队列
kafka
docker
大数据
消息队列
事件流
Zookeeper
一致性协议
1、前言随着PC机性能的不断提升和网络技术的快速普及,很多企业开始放弃原来的大型主机,而改用小型机和普通PC服务器来搭建分布式的计算机系统。其中最为典型的就是阿里巴巴集团的"去IOE"运动。在以前集中式的应用,我们很容易的能够实现一套满足ACID特性的事务处理系统,来保证数据的严格一致性。但在分布式的应用中,数据分散在各台不同的机器上,要想保证数据的严格一致性就很难了。因此出现了CAP和BASE这
OverCoding
·
2023-10-01 03:55
ChatGPT 学习笔记 | 什么是 Prompt-tuning?
low-costwayofadaptinganAIfoundationmodeltonewdownstreamtaskswithoutretrainingthemodelandupdatingitsweights.提示
调优
叶庭云
·
2023-10-01 03:33
ChatGPT
实践
人工智能
ChatGPT
Prompt-tuning
微调
提示工程
上一页
98
99
100
101
102
103
104
105
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他