小强签名设计

Elasticsearch遇到的坑

文章目录

一、内存不够不能启动
二、更新冲突
三、搜索term和terms的区别
四、聚合时提示illegal_argument_exception
五、elasticsearch 中的 ignore_above
六、maven中引入的Elasticsearch版本引发的问题

一、内存不够不能启动

Java HotSpot(TM) Server VM warning: INFO: os::commit_memory(0xcc000000, 469762048, 0) failed; error='Cannot allocate memory' (errno=12)
#
# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 469762048 bytes for committing reserved memory.
# An error report file with more information is saved as:
# /usr/local/elasticsearch/bin/hs_err_pid7598.log

解决：一开始我是把这两个参数往大了调还是不行，其实是应该往小了调，一开始是12g，我给调成了15g不行，调成8g就可以了。（物理硬盘内存小而jvm的内存分配过大所导致）

# vi /usr/local/elasticsearch/config/jvm.options
-Xms8g
-Xmx8g

二、更新冲突

问题描述：手机APP端两个用户同时评论一篇文章该篇文章的评论量只增加了1。

问题代码：

XContentBuilder updateSource = XContentFactory.jsonBuilder().startObject()
		.field("atdCnt", atdCnt + 1).endObject();
updateResponse = getTransportClient()
		.prepareUpdate(esProperties.getES_Index(), esProperties.getES_Type(), docID)
		.setRouting(esProperties.getES_Routing()).setDoc(updateSource).get();

解决：

UpdateRequest updateRequest = new UpdateRequest();  
updateRequest.index(esProperties.getES_Index());  
updateRequest.type(esProperties.getES_Type());  
updateRequest.id(docID);
updateRequest.routing(esProperties.getES_Routing());
updateRequest.script(new Script("ctx._source.cmtCnt++")).retryOnConflict(2);
updateResponse = getTransportClient().update(updateRequest).get();

参考：
https://blog.csdn.net/qq_35431789/article/details/78653554

三、搜索term和terms的区别

GET xiaoqiang-2019-1-28/News/_search
{
    "query": {
        "terms":{
            "mediaTname":"APP"
        }
    }
}

报错：

{
  "error": {
    "root_cause": [
      {
        "type": "parsing_exception",
        "reason": "[terms] query does not support [mediaTname]",
        "line": 4,
        "col": 42
      }
    ],
    "type": "parsing_exception",
    "reason": "[terms] query does not support [mediaTname]",
    "line": 4,
    "col": 42
  },
  "status": 400
}

在查询的字段只有一个值的时候，应该使用term而不是terms，在查询字段包含多个的时候才使用terms，使用terms语法，JSON中必须包含数组。
正确的写法：

第一种(单个值,term)：
GET xiaoqiang-2019-1-28/News/_search
{
    "query": {
        "term":{
            "mediaTname":"APP"
        }
    }
}

第二种(数组形式,terms)：
GET xiaoqiang-2019-1-28/News/_search
{
    "query": {
        "terms":{
            "mediaTname":["APP","新闻"]
        }
    }
}

四、聚合时提示illegal_argument_exception

GET xiao-2018-4-1/Socials/_search
{
    "size" : 0,    //取出前几条数据
    "query" : {    //可以先使用query查询得到需要的数据集
        "term" : {
            "website" : "微信"
        }
    },
    "aggs" : {
        "single_sum": {    //这个名字随便起
            "sum" : { "field" : "flwCnt" }    //这个必须是number类型字段，flwCnt字段为关注量
        }
    }
}

注意：在执行上面命令的时候遇到了illegal_argument_exception报错，报错信息如下

{
  "error": {
    "root_cause": [
      {
        "type": "illegal_argument_exception",
        "reason": "Fielddata is disabled on text fields by default. Set fielddata=true on [website] in order to load fielddata in memory by uninverting the inverted index. Note that this can however use significant memory. Alternatively use a keyword field instead."
      }
    ],
    "type": "search_phase_execution_exception",
    "reason": "all shards failed",
    "phase": "query",
    "grouped": true,
    "failed_shards": [
      {
        "shard": 0,
        "index": "xiao-2018-4-1",
        "node": "Vux5eT5mTg2iiiiiiiiiii",
        "reason": {
          "type": "illegal_argument_exception",
          "reason": "Fielddata is disabled on text fields by default. Set fielddata=true on [website] in order to load fielddata in memory by uninverting the inverted index. Note that this can however use significant memory. Alternatively use a keyword field instead."
        }
      }
    ]
  },
  "status": 400
}

注：该website字段的mapping为（这种情况是在一开始创建mapping的时候并没有定义website字段，但在插入数据的时候有该字段，则es会默认自动创建下面的动态映射）

          "website": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          }

解决：
方法一：修改mapping，增加“预加载 fielddata”
在ElasticSearch中fielddata默认是false的，因为开启Text的fielddata后对内存的占用很高

方法二：（推荐使用该方法）在这个website字段后面加.keyword

补充：
随着ElasticSearch 5.0的到来, 同时也迎来了该版本的重大特性之一: 移除了string类型. 这个变动的根本原因是string类型会给我们带来很多困惑: 因为ElasticSearch对字符串拥有两种完全不同的搜索方式. 你可以按照整个文本进行匹配, 即关键词搜索(keyword search), 也可以按单个字符匹配, 即全文搜索(full-text search). 对ElasticSearch稍有了解的人都知道, 前者的字符串被称为not-analyzed字符, 而后者被称作analyzed字符串.

事实上, 同一种类型用于应对两种不同的使用场景是会让人崩溃的, 因为有些选项只对其一的场景设置有效.例如position_increment_gap对not-analyzed字符就不会起作用, 而像ignore_above对于analyzed字符串就很难区分它到底是对整个字符串的值有效还是对单独的每个分词有效(在这种场景, ignore_above确实只对整个字符串值有效, 而对单个分词的限制可以使用limit设置).

为了避免上述尴尬, string字段被拆分成两种新的数据类型: text用于全文搜索的, 而keyword用于关键词搜索.

做了这个类型分解之后, 我们对string字段的默认dynamic mappings 也做了改变. 在以前刚接触ElasticSearch时, 如果需要对某个字段的所有取值做聚合, 你不得不对这些数据重做索引. 假如你正在处理的文档中包含一个city字段. 对这个字段做聚合的话会分别给出new和york的总数, 而非我们通常期望的New York的总数.让人沮丧的是为了达到我们希望的结果, 我们必须对这个字段重新进行索引.

为了不让事情变得这么糟糕, ElasticSearch决定从Logstash中借取思路: 字符串将默认被同时映射成text和keyword类型. 例如对下面的文档进行索引后:

{
    "foo": "bar"
}

text类型：支持分词、全文检索，不支持聚合、排序操作。
适合大字段存储，如：文章详情、content字段等；

keyword类型：支持精确匹配，支持聚合、排序操作。
适合精准字段匹配，如：url、name、title等字段。
一般情况，text和keyword共存。

如ElasticSearch将会为你创建下面的动态映射(dynamic mappings):

{
    "foo": {
        "type": "text",
        "fields": {
            "keyword": {
                "type": "keyword",
                "ignore_above": 256
            }
        }
    }
}

当然, 基于这个映射你即可以在foo字段上进行全文搜索, 也可以通过foo.keyword字段实现关键词搜索及数据聚合.

禁用这个特性也很方便: 你只需要在定义mapping时显式声明字符串字段的类型或者使用一个动态模板(dynamic template)来匹配你所有的字符串字段即可. 例如通过下面的dynamic template就可以恢复到在ElasticSearch 2.x中使用的dynamic template的效果:

{
    "match_mapping_type": "string",
    "mapping": {
        "type": "text"
    }
}

如何迁移到新版本
通常, 迁移工作是非常容易的. 以前映射到analyzed的字符串的字段:

{
    "foo": {
        "type": "string",
        "index": "analyzed"
    }
}

如今只要映射为text即可:

{
    "foo": {
        "type": "text",
        "index": true
    }
}

以前被定义为not_analyzed的字符串字段:

{
    "foo": {
        "type": "string",
        "index": "not_analyzed"
    }
}

也只需要被定义为keyword即可:

{
    "foo": {
        "type": "keyword",
        "index": true
    }
}

如上所述, string字段被重新定义为text和keyword字段. 对于上面的index属性, 因为在新的定义中我们不需要三种状态(在以前的string定义中可以是analyzed, not_analyzed和no), 所以只简单的定义成了boolean值, 以告知ElasticSearch是否可在该字段上进行搜索.

向后兼容
因为大的版本升级本身就充满挑战, 因此我们尽力不让在在升级ElasticSearch过程中更新你的mapping字义. 首先, string字段可以继续在已定义的2.x版本的索引中继续使用, 而当创建新的索引时, ElasticSearch会做些处理以自动把string映射成等价的text或keyword. 如果在你已有的索引模板(index template)中定义有string字段, 这一点将非常有用, 因为这些模板无须改动即可使用到ElasticSearch 5.x中. 话说回来, 你还是需要着手做这些模板做些升级, 因为在ElasticSearch 6.0中我们可能会移除这个向后兼容的逻辑.

如在5.x版本中创建如下mapping：

index下面有三个选项：

"index": "no"   #不分词，不索引
"index": "analyze"    #分词,索引
"index": "not_analyzed" # 不去分词

查看mapping：

或java：

startObject("url").field("index", "not_analyzed").field("type", "string").field("store", "yes").endObject()

查看mapping：

          "url": {
            "type": "keyword",
            "store": true
          }

参考：https://segmentfault.com/a/1190000008897731

五、elasticsearch 中的 ignore_above

在业务系统中，遇到过两个问题：
问题1：设置为keyword类型的字段，插入很长的大段内容后，报字符超出异常，无法插入。
问题2：检索超过ignore_above设定长度的字段后，无法返回结果。

对超过 ignore_above 的字符串，analyzer 不会进行处理；所以就不会索引起来。导致的结果就是最终搜索引擎搜索不到了。这个选项主要对 not_analyzed 字段（5.x版本其实就是type类型为keyword的字段）有用，这些字段通常用来进行过滤、聚合和排序。而且这些字段都是结构化的，所以一般不会允许在这些字段中索引过长的项。

PUT my_index
{
  "mappings": {
    "my_type": {
      "properties": {
        "message": {
          "type": "string",
          "index": "not_analyzed",
          "ignore_above": 20
        }
      }
    }
  }
}

PUT my_index/my_type/1
{
  "message": "Syntax error"
}

PUT my_index/my_type/2
{
  "message": "Syntax error with some long stacktrace"
}

GET _search
{
  "aggs": {
    "messages": {
      "terms": {
        "field": "message"
      }
    }
  }
}

搜索结果：
{
  "took": 1,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 1,
    "hits": [
      {
        "_index": "my_index",
        "_type": "my_type",
        "_id": "2",
        "_score": 1,
        "_source": {
          "message": "Syntax error with some long stacktrace"
        }
      },
      {
        "_index": "my_index",
        "_type": "my_type",
        "_id": "1",
        "_score": 1,
        "_source": {
          "message": "Syntax error"
        }
      }
    ]
  },
  "aggregations": {
    "messages": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
        {
          "key": "Syntax error",
          "doc_count": 1
        }
      ]
    }
  }
}

(1) 这个字段忽略所有长度超过 20 的字符串
(2) 这个文档会被成功索引
(3) 这个文档会被索引，但是 message 字段却不会被索引
(4) 搜索会返回这两个问答是哪个，但是只有第一个会出现在项的聚合中

ignore_aboe 设置允许针对统一索引中的同样名称的字段设置不同的值。可以使用 PUT mapping API来更新已经存在的字段。

这个选项在保护 Lucene 的项的字节长度限制 32766 发挥作用。
如果超过32766则会报异常IllegalArgumentException:Document contains at least one immense term in field="message" (whose UTF8 encoding is longer than the max length 32766), all of which were skipped.

ignore_above 默认值是256，该参数的意思是，当字段文本的长度大于指定值时，不做倒排索引。
ignore_above 最大值是32766，但是要根据场景来设置，比如说中文最大值应该是设定在10922。

Elasticsearch中采用的是字符个数来定义igmore_above值, 而lucene是采用byte字节；那么每个象形文字在utf-8中占位是3,每个Literal字符在utf-8中占位是2, 每个ASCII字符在utf-8中占位是1.
象形文字字符(中文、韩文、日文): 10922 个字符(算法是: 32766 / 3).
Literal字符(印度文、俄文): 16383 个字符(算法是: 32766 / 2).
ASCII字符(a-zA-Z0-9以及~!@#$等特殊字符): 32766个字符(算法是: 32766).

参考：
https://www.elastic.co/guide/en/elasticsearch/reference/current/ignore-above.html
https://www.jianshu.com/p/133a0f49311a

六、maven中引入的Elasticsearch版本引发的问题

		
			org.elasticsearch.client
			x-pack-transport
			5.3.3
		
		
			org.elasticsearch
			elasticsearch
			5.3.3

遇到了个奇怪的问题，就是我们公司用的是阿里Elasticsearch版本是5.5.3，我在maven中引入的版本是5.4.2，在调client的时候有时会报下面的错，有时却不会，也是奇了怪了。后来我改为5.3.3就不会出现该问题

2019-02-12 17:11:00.500 ERROR 25480 --- [nio-8082-exec-1] o.a.c.c.C.[.[.[/].[dispatcherServlet]    : Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [Request processing failed; nested exception is NoNodeAvailableException[None of the configured nodes are available: [{#transport#-1}{qRGG2D_ABCaB8JPk79Jabc}{es-cn-v00000002000ab2vp.elasticsearch.aliyuncs.com}{192.168.0.1:9300}]]] with root cause

org.elasticsearch.client.transport.NoNodeAvailableException: None of the configured nodes are available: [{#transport#-1}{qRGG2D_ABCaB8JPk79Jabc}{es-cn-v00000002000ab2vp.elasticsearch.aliyuncs.com}{192.168.0.104:9300}]
        at org.elasticsearch.client.transport.TransportClientNodesService.ensureNodesAreAvailable(TransportClientNodesService.java:348) ~[elasticsearch-5.4.2.jar!/:5.4.2]
        at org.elasticsearch.client.transport.TransportClientNodesService.execute(TransportClientNodesService.java:246) ~[elasticsearch-5.4.2.jar!/:5.4.2]
        at org.elasticsearch.client.transport.TransportProxyClient.execute(TransportProxyClient.java:59) ~[elasticsearch-5.4.2.jar!/:5.4.2]
        at org.elasticsearch.client.transport.TransportClient.doExecute(TransportClient.java:366) ~[elasticsearch-5.4.2.jar!/:5.4.2]
        at org.elasticsearch.client.support.AbstractClient.execute(AbstractClient.java:408) ~[elasticsearch-5.4.2.jar!/:5.4.2]
        at org.elasticsearch.client.support.AbstractClient$IndicesAdmin.execute(AbstractClient.java:1256) ~[elasticsearch-5.4.2.jar!/:5.4.2]
        at org.elasticsearch.action.ActionRequestBuilder.execute(ActionRequestBuilder.java:80) ~[elasticsearch-5.4.2.jar!/:5.4.2]
        at org.elasticsearch.action.ActionRequestBuilder.execute(ActionRequestBuilder.java:54) ~[elasticsearch-5.4.2.jar!/:5.4.2]
        at com.automatic.dao.PublicSafetySearchDaoImpl.indexs(PublicSafetySearchDaoImpl.java:683) ~[AutomaticEsIndex.jar!/:0.0.1-SNAPSHOT]
        at com.automatic.controller.IndexController.xiao(IndexController.java:38) ~[AutomaticEsIndex.jar!/:0.0.1-SNAPSHOT]
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) ~[na:1.8.0_131]
。。。。。。

linux es后台启动命令,小白学ES 02-Linux中部署Elasticsearch单机服务热带汽水 linux es后台启动命令
目录@此部署过程以Elasticsearch-5.6.10版本为例,后续的学习和演示也用此版本.1前提:安装JDK学习使用ES的前提是成功安装JDK——很基础的一项步骤,这里省略.此处学习演示所用的JDK版本为:[root@host-10-0-20-50~]#java-versionjavaversion"1.8.0_151"Java(TM)SERuntimeEnvironment(build1.
在linux环境下启动es,linux上Elasticsearch 安装配置、网页访问 guo桀在linux环境下启动es
一、ElasticSearch简述ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTfulweb接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。我们建立一个网站或应用程序，并要添加搜索功能
Linux Docker 部署 Elasticsearch (ES) 集群详解教程努力的小T Linux 云计算运维基础 docker linux docker elasticsearch 运维服务器云计算大数据
1.安装Docker首先，确保你的Linux系统上已经安装了Docker。如果尚未安装，可以通过以下命令进行安装：sudoyuminstall-yyum-utilssudoyum-config-manager--add-repohttps://download.docker.com/linux/centos/docker-ce.reposudoyuminstalldocker-cedocker-c
elasticsearch8 linux版以服务的方式启动 zhangzeyuaaa elasticsearch Linux linux 运维服务器
1.创建系统服务文件对于使用systemd作为系统初始化系统的Linux发行版（如CentOS7及以上、Ubuntu16.04及以上），需要创建一个systemd服务文件。以root用户或具有sudo权限的用户身份执行以下操作：sudovim/etc/systemd/system/elasticsearch.service在打开的文件中输入以下内容：[Unit]Description=Elasti
【Elasticsearch】`nested`字段和`join`字段的区别 risc123456 Elasticsearch elasticsearch
`nested`字段和`join`字段都是Elasticsearch中用于处理复杂数据结构的高级数据类型，但它们在设计目标、使用场景和实现方式上存在显著差异。以下是它们的主要区别：---1.设计目标•`nested`字段：•目标：用于处理单个文档中的嵌套数组，将数组中的每个对象独立索引，使其可以独立于其他对象进行查询。•场景：适用于需要在数组中独立查询每个对象的场景，例如博客文章中的评论、订单中的
springboot + logback + filebeat + elk 实现分布式日志中心 imalvisc java spring linux 运维
前言：本文主要介绍docker搭建elk分布式日志平台，利用filebeat监听logback日志文件，传输到elk中，最终在kibana渲染展示。主要思路：filebeat监听日志文件的变化，传输到logstash，logstash通过分析提取，将日志信息推送到elasticsearch指定索引中，最终kibana从elasticsearch索引中查询并展示日志信息。一、docker搭建elk日
【动态路由】系统Web URL资源整合系列（后端技术实现）【apisix实现】飞火流星02027 URL整合 apisix反向代理 apisix网关 apisix实现web资源整合系统URL资源整合 apisix基于请求参数的路由 apisix基于请求头的路由 APISIXDashboard
需求说明软件功能需求：反向代理功能（描述：apollo、eureka控、apisix、sentinel、普米、kibana、timetask、grafana、hbase、skywalking-ui、pinpoint、cmak界面、kafka-map、nacos、gateway、elasticsearch、oa-portal业务应用等多个web资源等只能通过有限个代理地址访问），不考虑SSO。软件质
使用 Canal 实时从 MySql 向其它库同步数据 m0_74823239 面试学习路线阿里巴巴 mysql 数据库
目前绝大多数项目还是采用mysql作为数据存储，对于用户访问量较高的网站来说，mysql读写性能有限，我们通常会把mysql中的数据实时同步到Redis、mongodb、elasticsearch等中间件中，应对高并发访问场景，减轻mysql压力，防止数据库宕机。在项目开发中，为了不会原有代码进行侵入，采用canal中间件实现mysql向其它库的实时同步，是一种很不错的方案。canal译意为水道/
【Elasticsearch】keyword分析器 risc123456 Elasticsearch elasticsearch
Elasticsearch中的`keyword`分析器是一种非常特殊的分析器，它的行为与其他常见的分析器（如`standard`、`whitespace`等）截然不同。`keyword`分析器的核心功能是将整个输入字符串作为一个单一的标记（token）返回，而不会对其进行任何拆分或进一步处理。以下是对`keyword`分析器的详细描述，包括其工作原理、适用场景、配置方法以及与其他分析器的对比。1.
微服务es搜索关键词，实现关键词高亮，来自黑马头条的总结菜鸡且互啄69 elasticsearch 大数据搜索引擎 java
为了加快搜索效率从es数据库中查询实现的效果，要求从标题和内容中搜索关键词，然后让关键词高亮步骤ElasticSearch环境搭建索引库创建文章搜索多条件复合查询索引数据同步ElasticSearch环境搭建这些都是死步骤，直接cvik分词器下载地址：https://github.com/medcl/elasticsearch-analysis-ik下载完后，解压安装包到ElasticSearch
Elasticsearch-API命令行相关操作手册少儿频道 elasticsearch 中间件 elasticsearch 运维
系列文章目录第一章es集群搭建文章目录系列文章目录前言esApi操作总结前言通过第一章学习es集群搭建流程及es基本概念后，在本章内容中，我们主要对es的基本命令行操作进行一次基本学习,来源于工作中的整理。esApi操作1.查看没有配置密码的es集群节点curl-XGEThttp://ip:9200/_cat/nodes?v2.查看配置了密码的es集群节点(关于es集群配置认证密码将在下章讲)cu
Java查询es很慢怎么办_elasticsearch索引和搜索慢问题分析解决股票期货软件开发 Java查询es很慢怎么办
简述Elasticsearch是一个分布式的免费开源搜索和分析引擎，能够实现近实时的数据搜索。在使用的过程中，由于各种原因可能导致集群写入或者查询缓慢，本文主要讲述集中常见的原因和解决方法。写入拒绝或者慢现象当像索引(存储和使文档可被搜索)或者搜索数据的时候会出现类似如下429状态码的报错:"status":429,"error":{"type":"es_rejected_execution_ex
docker+es8+kibana单机及集群安装 qq_33935672 docker 容器运维 es elasticsearch
安装过程遇到很多坑，涉及云服务器连接、配置等，这里把过程记录一下。1.es及kibana的版本最好一致es:dockerpull docker.elastic.co/elasticsearch/elasticsearch:8.11.3kibana:dockerpull docker.elastic.co/elasticsearch/elasticsearch:8.11.32.放开防火墙9200,9
使用 Docker 查看 Elasticsearch 错误日志一勺菠萝丶 #ELK #SpringBoot docker elasticsearch jenkins
在使用Elasticsearch（简称ES）的过程中，我们可能会遇到各种问题。为了快速定位和解决这些问题，查看错误日志是关键。本文将介绍如何使用Docker查看Elasticsearch的错误日志，并提供一些实用技巧。1.安装Docker确保系统上已经安装Docker。可以通过以下命令验证Docker是否安装成功：dockerversion如果显示Docker的版本信息，则说明安装成功。2.下载并
Docker容器中Elasticsearch内存不足问题排查与解决方案一勺菠萝丶 #Linux #ELK 网络服务器 linux 运维
在使用Docker运行Elasticsearch（ES）时，可能会遇到内存不足的问题，导致ES无法启动。以下是一次完整的排查和解决过程。问题描述在启动ES时，日志提示如下错误：#Nativememoryallocation(mmap)failedtomap5368709120bytesforcommittingreservedmemory.#Thereisinsufficientmemoryfor
【Elasticsearch】分片与副本机制：优化数据存储与查询性能程风破～ Elasticsearch Elasticsearch实战 elasticsearch 大数据搜索引擎
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
集群与分片：深入理解及应用实践一休哥助手架构系统架构
目录引言什么是集群？集群的定义集群的类型什么是分片？分片的定义分片的类型集群与分片的关系集群的应用场景负载均衡高可用性分片的应用场景大数据处理数据库分片集群与分片的架构设计系统架构设计数据存储设计案例分析Hadoop集群Elasticsearch分片性能优化策略集群性能优化分片性能优化挑战和解决方案总结参考资料引言在现代计算系统中，处理大规模数据和提高系统的可靠性已经成为了基础需求。集群和分片是两
深入理解Elasticsearch集群与分片：原理及配置方案一勺菠萝丶 #ELK Java elasticsearch 大数据搜索引擎
一、Elasticsearch集群是什么想象一下，你有海量的数据，比如一个超大型图书馆的所有书籍信息，要是把这些数据都放在一台电脑里，不仅存不下，而且查询起来会超级慢。Elasticsearch集群就像是一个分布式的数据图书馆系统，它把数据分散存储在多台服务器（我们叫它们节点）上，这些节点协同工作，就像图书馆里不同区域的工作人员，一起完成数据的存储、管理和查询任务。二、分片是什么主分片：还是以图书
ELK - Hearthbeat实现服务监控如锋 Architect ELK DevOps ELK Hearthbeat 服务监控 Kibana Uptime
Hearthbeat，心跳，顾名思义，Hearthbeat可以用来定时探测服务是否正常运行。Hearthbeat支持ICMP、TCP和HTTP，也支持TLS、身份验证和代理。Hearthbeat能够与Logstash、Elasticsearch和Kibana无缝协作。安装Hearthbeat，添加需要监控的服务，配置好Elasticsearch和Kibana，即可将结果输出到Elasticsear
Elasticsearch&Kibana安装步骤五条仁和 elasticsearch 搜索引擎大数据
一、Elasticsearch1.上传es安装包pute:/software/elasticsearch-7.4.0-linux-x86_64.tar.gz2.将elasticsearch-7.4.0-linux-x86_64.tar.gz解压到opt文件夹下.-C大写tar-zxvfelasticsearch-7.4.0-linux-x86_64.tar.gz-C/opt3.创建普通用户user
Elasticsearch和Kibana的安装部署及服务器配置 TpCode elasticsearch 服务器大数据
Elasticsearch和Kibana是一对强大的工具，用于搜索、分析和可视化大规模数据集。Elasticsearch是一个开源的分布式搜索和分析引擎，而Kibana是一个用于数据可视化的开源工具。本文将详细介绍如何安装、部署和配置Elasticsearch和Kibana，并在服务器上运行它们。步骤1：安装JavaElasticsearch和Kibibana都需要Java来运行。确保您的服务器上
ElasticSearch和Kibana安装 D_GN ElasticSearch elasticsearch java 搜索引擎
ElasticSearch学习笔记安装安装环境时linuxx64安装eses的安装依赖于JDK，不过7.0及以上的版本自带了jdk，这里选择7.2的版本来安装eses下载#下载tar文件curl-L-Ohttps://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.2.1-linux-x86_64.tar.gz#解压tar-
HBASE面试技巧狮歌~资深攻城狮 hbase 大数据
准备HBase面试时，除了熟悉常见的面试题及其答案外，还需要掌握一些面试技巧，以更好地展示你的技能和知识。以下是一些有效的HBase面试技巧和策略：1.深入理解核心概念技术深度•倒排索引：虽然HBase本身不使用倒排索引（这是搜索引擎如Elasticsearch使用的），但理解这一概念有助于对比不同存储系统的特性。•列族设计：列族的设计对性能有很大影响，确保你能够解释如何选择合适的列族数量、块大小
如何学习Elasticsearch（ES）：从入门到精通的完整指南狮歌~资深攻城狮 jenkins 运维 elasticsearch 大数据
如何学习Elasticsearch（ES）：从入门到精通的完整指南嘿，小伙伴们！如果你对大数据搜索和分析感兴趣，并且想要掌握Elasticsearch这一强大的分布式搜索引擎，那么你来对地方了！本文将为你提供一个系统的学习路径，帮助你从零开始逐步深入理解Elasticsearch。1.基础知识准备1.1理解全文搜索在开始学习Elasticsearch之前，建议先了解一下全文搜索的基本概念。全文搜索
【Elasticsearch】词项中心（term-centric）和字段中心（field-centric） risc123456 Elasticsearch elasticsearch
在Elasticsearch的`multi_match`查询中，词项中心（term-centric）和字段中心（field-centric）是两种不同的查询处理方式，它们决定了查询词项如何在多个字段中进行匹配。这两种方式分别对应不同的`multi_match`查询类型，主要区别在于它们如何处理查询词项和字段之间的关系。---1.字段中心（Field-Centric）字段中心的查询方式主要关注单个字
Elasticsearch+Fluentd+Kibana 日志收集系统的搭建 Resean0223 devops elasticsearch docker
本次安装部署是在docker环境中进行，没有安装docker的，先安装docker环境，具体也可以参考我另一篇文章：[https://blog.csdn.net/qq_31366767/article/details/120880458]一、ElasticSearch安装配置1、首先先创建好安装目录，然後在改目录下创建docker-compse.yml文件version:'2'networks:e
ELK架构基础 skyQAQLinux linux elk
ELK知识点一、Elasticsearch（一）基本概念分布式搜索引擎基于Lucene的分布式、RESTful风格的搜索和分析引擎，能快速存储、搜索和分析海量数据。索引（Index）类似于传统数据库中的数据库，是文档的集合。一个Elasticsearch集群可包含多个索引。类型（Type）在Elasticsearch6.x之前，一个索引可包含多个类型，类似数据库中的表。从7.x开始，类型被废弃，一
【Elasticsearch】runtime_mappings搜索请求中定义运行时字段 risc123456 Elasticsearch elasticsearch
在Elasticsearch中，在搜索请求中定义运行时字段（RuntimeFields）是一种强大的功能，允许用户在查询时动态添加和计算字段，而无需预先在索引映射中定义这些字段。这种方式提供了极大的灵活性，尤其是在处理动态数据结构或需要临时计算字段值的场景中。运行时字段的核心概念运行时字段基于“读时模式（SchemaonRead）”的概念，允许用户在查询时定义字段的映射和计算逻辑。与传统的索引字段
【Elasticsearch】通过运行时字段在查询阶段动态覆盖索引字段 risc123456 Elasticsearch elasticsearch
在Elasticsearch中，`Overridefieldvaluesatquerytime`是指通过运行时字段（runtimefields）在查询阶段动态覆盖索引字段的值，而无需修改原始索引数据。这种功能特别适用于以下场景：1.动态修改字段值：在某些情况下，你可能希望根据查询条件动态修改字段值，而不是直接修改索引中的数据。例如，根据用户是否登录来隐藏产品价格。2.避免重新索引数据：当需要对已索
【Elasticsearch】运行时字段（Runtime Fields）索引时定义运行时字段 risc123456 Elasticsearch elasticsearch
在Elasticsearch中，运行时字段（RuntimeFields）是一种在查询时动态计算的字段，而不是在索引时预先存储的字段。运行时字段为数据处理提供了极大的灵活性，尤其是在处理结构不固定的日志数据或需要动态生成字段值的场景中。运行时字段的主要特点1.动态计算：•运行时字段的值是在查询时通过Painless脚本动态生成的，而不是在索引时存储的。•这种方式允许在不重新索引数据的情况下，向现有文
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR