铁猴

ElasticSearch学习总结（七）：性能优化总结

本文主要总结Elasticsearch性能优化方面的相关内容

1. 概述

性能优化是个涉及面非常广的问题，不同的环境，不同的业务场景可能会存在不同的优化方案，本文只对一些相关的知识点做简单的总结，具体方案可以根据场景自行尝试。

1.1 性能测试

如果需要做性能调优，性能基准测试的工具必不可少，这里可以选择Rally

1.2 热点线程

当集群缓慢，使用大量的CPU资源时，可以使用热点线程API来查看资源都执行在了哪些地方，并可以查看资源消耗的情况。

可以通过已下方式查看热点线程
1. 全局的分析：/_nodes/hot_threads
2. 某个节点的分析：/_nodes/{nodesIds}/hot_threads

3. 常规配置

3.1 部署方案

当单机容纳不下数据时，考虑多分片
当查询性能不足时，考虑多副本。
对于一些高性能的服务器，可以考虑一台服务器上部署多个实例
通过awarenss的相关配置，阻止分片及其副本部署在同一台机器上。
尽量平均分配分片和副本。
当集群较大时，考虑设计每个节点的角色。例如节点只作为查询聚合节点，数据节点，或是主/候选主节点

3.2 避免内存交换

内存交换是指把内存页写入磁盘的过程,一般发生在物理内存不够或是某些情况下操作系统认为应该发生的时候发生。如果交换了的内存页再次被需要，操作系统会从交换区加载到内存，该过程相对于内存操作而言是是比较慢的。

为了保证ES的高效，在ES中应该避免内存交换的发生，如果达到此目的，需要进行如下配置：
1. 设置elasticserach.yml文件中的bootstrap.mlockall=true
2. 设置Xms与Xmx的值相同
3. 在/etc/security/limits.conf中添加elasticsearch -memlock unlimited
4. 在/etc/pam.d/common-session中添加session required pam_limits.so
5. 重启es

3.3 采用G1垃圾回收机制代替默认CMS

3.4 索引刷新频率（refresh_interval）

该参数基本遵循如下规律：
1. 刷新越快，数据更新越快，但是查询与索引的效率越低
2. 虽然增加该值，可以一定程度的提升效率，但是超过一定数值后，提升的效果将微乎其微。

3.5 线程池调优

如果你发现ES实例的资源没有100%饱和，但却受到了拒绝执行的错误，此时可能就需要调整ES的线程池了。可以尝试增加并发的线程数或是增加队列的长度。在调整的过程中需要注意的是，当并发线程数到一个很大的数值时，会产生大量的CPU上下文切换，进而导致性能下降。大量的队列也可能会出现队列大量积压的情况。

3.6 调整段合并过程

一般情况下，如果希望查询的速度更快，就需要更少的段。例如设置index.merge.policy.merge_factory低于默认值10，会导致更少的段，更低的RAM消耗，更快的查询执行速度但是会出现更慢的索引速度。如果设置的index.merge.policy.merge_factory较高则会出现相反的情况。

另外需要注意的是，默认情况下ES会限制合并的速度在20MB/s.如果使用的是固态硬盘或是I/O效率更高的设备，则可以适当的增加限制的速度。

4. 高查询频率下的优化

本章节主要针对高查询吞吐量场景的优化方案进行总结

4.1 查询缓存

分片查询缓存的主要目的是缓存聚合，提示词和命中数（不会缓存返回的文档）

如果想要开启mastering索引的查询缓存，可以执行类似下面的操作

PUT /mastering/_settings
{ "index.requests.cache.enable": true }

查询缓存默认使用节点堆栈的1%内存，可以通过下列方式对该值进行设置：

indices.requests.cache.size: 2%

4.2 使用doc_values优化查询

缓存有时候可以带来性能的显著提高，但是对于某些场景缓存可能不是万能的，例如：
1. 文档频繁更新
2. 查询具有唯一性，且不可重复性，例如带了时间或是id左右查询条件

对于缓存需要容纳全部数据的场景(例如，排序，聚合等操作时)，如果拥有大量的文档，很容易碰到OOM的问题，此时可以考虑使用doc_values的特性。

在 Elasticsearch 中，Doc Values 就是一种列式存储结构，默认情况下每个字段的 Doc Values 都是启用的，Doc Values 是在索引时创建的，当字段索引时，Elasticsearch 为了能够快速检索，会把字段的值加入倒排索引中，同时它也会存储该字段的 Doc Values。

Elasticsearch 中的 Doc Values 常被应用到以下场景：

对一个字段进行排序
对一个字段进行聚合
某些过滤，比如地理位置过滤
某些与字段相关的脚本计算
因为文档值被序列化到磁盘，我们可以依靠操作系统的帮助来快速访问。当 working set 远小于节点的可用内存，系统会自动将所有的文档值保存在内存中，使得其读写十分高速；当其远大于可用内存，操作系统会自动把 Doc Values 加载到系统的页缓存中，从而避免了 jvm 堆内存溢出异常。

因为 Doc Values 默认启用，你可以选择对你数据集里面的大多数字段进行聚合和排序操作。但是如果你知道你永远也不会对某些字段进行聚合、排序或是使用脚本操作,可以禁用特定字段的 Doc Values 。这样不仅节省磁盘空间，也许会提升索引的速度。例子如下：

PUT my_index
{
  "mappings": {
    "my_type": {
      "properties": {
        "session_id": {
          "type":       "string",
          "index":      "not_analyzed",
          "doc_values": false 
        }
      }
    }
  }
}

4.3 尽量使用过滤器

由于过滤器执行的过程中不会涉及评分的操作以及过滤器缓存的缘故，所以查询应该优先考虑使用过滤器（例如，对于静态的，不分词的字段尽量使用过滤器）。

尽量使用路由

有着相同路路由值的数据会被保存到相同的分片上，于是在查询时就可以将请求发送到指定的分片上，可以避免合并结果的开销。
因此应该尽量使用路由

4.4 字段数据缓存和断路

字段数据缓存主要用于在字段上排序或计算聚合时使用。它将所有字段值加载到内存中，以提供基于快速的基于这些值的操作。

Elasticsearch的字段数据缓存默认是没有大小限制的，尤其是当在很多字段上进行分组和排序的时候。如果这些字段的基础很高，很容易出现OOM.

为此可以采取以下措施：
1. 限制字段缓冲区的大小:indices.fielddata.cache.size
2. 使用断路器（ Field data circuit breaker）：配置断路器后可以在满足某些条件下抛出异常而不是OOM

如果查询大量使用了字段数据缓存(聚合和排序)，且频繁的存在内存的问题，可以考虑使用doc_values进行替换。

4.5 控制size和shard_size

size:参数定义最后聚合结果会返回多少组数据给客户端。
shard_size:和size类似，其主要作用在分片上

上述两个值的增加会让聚合结果更加精准，同事也会消耗过多的资源。降低这两个值会降低精准度，但是会减少资源损耗。

5. 写数据

5.1 批量索引

如果有大量数据需要索引，可以使用批量索引取代逐个文档的索引。

因为处理批量索引的时候是在批量数据处理线程池中执行的，所以批次的量也不能太大，否则会ES也会消耗过多的内存来处理这些数据。

5.2 doc_values 与索引速度的取舍

ES为了实现排序，聚合或是分组操作需要反转字段，需要巨大的内存，doc_values可以解决这些问题。

但是在索引是doc_values也会产生一些额外的消耗，因此：
1. 如果不涉及排序，聚合或是分组操作，且对索引的吞吐量较大，可以考虑关闭doc_values
2. 如果海量数据的涉及排序，聚合或是分组操作，doc_values或许必不可少。

5.3 控制文档的字段

文档的大小在一定程度上会影响索引的速度，可以采取如下方式对大小进行控制
1. _all字段在很多场景下可能不会被使用，可以选择性的对其进行关闭。
如果关闭了可以同时指定一个默认的查询字段

curl -XPUT 'localhost:9200/my_index?pretty' -H 'Content-Type: application/json' -d'
{
  "mappings": {
    "my_type": {
      "_all": {
        "enabled": false 
      },
      "properties": {
        "content": {
          "type": "text"
        }
      }
    }
  },
  "settings": {
    "index.query.default_field": "content" 
  }
}
'

尽量减少文档的大小和文本字段的数量。

5.4 考虑分片以及副本的数量

过多的副本会增加复制与传输的开销

5.5 控制refresh与flush

对于需要进行大批量数据写入，且在写入过程中不需要查询的场景，可以采取以下优化手段

修改translog的flush方式

默认情况下每次对索引的操作都会出发一次tranlog的flush操作，对于大批量数据写入的场景，可以先改成定期flush,下列配置会根据index.translog.sync_interval的配置进行定期flush，等导完数据后，再恢复正常值

PUT test_index/_settings
{
  "index":{
    "translog.durability":"async"
  }
}

修改refresh的时间

Searcher会更具refresh_interval的配置定期的更新索引，在大量数据导入的情况下，可以先将该值改为-1,等导完数据后，再恢复正常值

PUT test_index/_settings
{
  "index":{
    "refresh_interval":"-1"
  }
}

5.6 索引期间的内存缓存

增加节点的索引缓存大小(indices.memory.index_buffer_size，默认使用10%),也将有利于索引吞吐量的增加。

该配置主要是针对节点的，例如节点有20GB的内存，且有10十个分片,则每个分片大约分的200MB的内存作为索引缓存(20GB*10%/10=200MB)

Doris入门了解花开终为谢大数据 doris 大数据
微信公众号：大数据高性能计算大数据存储与分析入门学习文档：深入了解Doris大数据技术已成为现代数据处理的核心组成部分，为企业提供了更多洞察和决策支持。Doris（以前称为Palo）是一种用于大规模数据存储和分析的开源分布式数据仓库，它允许您高效地存储和查询大量数据，是大数据处理生态系统的一部分。本文档将为您提供关于Doris的入门学习指南，包括其基本概念、核心功能和如何开始使用它。目录什么是Do
在云原生时代，构建高效的大数据存储与分析平台程序员小侯大数据系列云原生大数据数据分析
文章目录1.**选择适当的数据存储技术：**2.**采用分布式架构：**3.**数据分区和索引：**4.**采用列式存储：**5.**数据压缩和编码：**6.**使用缓存技术：**7.**数据分片和复制：**8.**自动化运维和监控：**9.**数据安全和权限控制：**10.**实时处理和流式分析：**11.**数据质量和清洗：**12.**持续优化和改进：**个人主页：程序员小侯CSDN新晋作者
面向智能电网的电力大数据存储与分析应用唐名威
面向智能电网的电力大数据存储与分析应用崔立真1,史玉良1,刘磊1,赵卓峰2,毕艳冰31.山东大学计算机科学与技术学院，山东济南2501012.北方工业大学云计算研究中心，北京1000413.国网信息通信产业集团有限公司，北京102211摘要：阐述了智能电网面临的挑战以及大数据关键技术对电力行业的可持续发展和坚强智能电网建立的重要意义。分别从智能电网主数据管理、用电信息统一存储管理、电能质量分析、配
Hadoop学习-基础篇 I_李岩
Hadoop大数据平台与架构功能与优势Hadoop是大数据存储与分析的架构，是分布式存储和分布式计算平台两个核心组成HDFS：分布式文件系统，用于存储海量的数据MapReduce：并行处理框架，实现任务的分解和调度应用可用于搭建数据仓库，分析统计数据生态HIVE：SQL语句形式，转换为Hadoop任务去执行HBASE：存储结构化数据的分布式数据库zookeeper：服务注册、治理HDFS概念块（B
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb