微风中的一只小刺猬

ElasticSearch6.0.1 拼音搜索，并且高亮显示结果 —6.X版本

转自:https://blog.csdn.net/weixin_38822045/article/details/89306616

业务需求：公司项目需要搜索实现拼音搜索，中文搜索，并且需要支持拼音中文混合搜索，同时支持简拼搜索，并且高亮搜索字段的结果

在公司之前的业务需求下，发现的一个拼音和中文混合搜索的时候，实际使用拼音搜索并且返回结果进行高亮查询的时候，发现的一个问题，高亮标签无法使用，参考百度，CSDN，ElasticSerach中文社区，发现提出当前问题的人很多，基本没有一个好的解决方案，至此，我写了这一篇博客。希望能帮到大家

拼音搜索，中文搜索，拼音中文混合搜索，同时支持简拼搜索

详情见博客

中文拼音分词器，安装(简单使用) 详情见博客：https://blog.csdn.net/weixin_38822045/article/details/88970264

________________________________________实操开始，华丽分割线___________________________________________

第①步：上错误实例，问题实例！

https://blog.csdn.net/weixin_38822045/article/details/89138168

错误的索引settings

PUT http://192.168.1.200:9200/liuwunan

{
   "settings": {
       "index": {
           "max_result_window": 10000000
       },
       "refresh_interval": "5s",
       "number_of_shards": 1,
       "number_of_replicas": 1,
       "analysis": { #分析
           "filter": {
               "edge_ngram_filter": { #自动补全
                   "type": "edge_ngram",
                   "min_gram": 1,
                   "max_gram": 50
               },
               "pinyin_full_filter": { #拼音全拼
                   "type": "pinyin",
                   "keep_first_letter": false,
                   "keep_separate_first_letter": false,
                   "keep_full_pinyin": true,
                   "keep_original": false,
                   "limit_first_letter_length": 50,
                   "lowercase": true
               },
               "pinyin_simple_filter": { #拼音简拼
                   "type": "pinyin",
                   "keep_first_letter": true,
                   "keep_separate_first_letter": false,
                   "keep_full_pinyin": false,
                   "keep_original": false,
                   "limit_first_letter_length": 50,
                   "lowercase": true
               }
           },
           "analyzer": { #分析器
               "pinyiSimpleIndexAnalyzer": {
                   "type": "custom",
                   "tokenizer": "keyword",
                   "filter": ["pinyin_simple_filter","edge_ngram_filter","lowercase"]
               },
               "pinyiFullIndexAnalyzer": {
                   "type": "custom","tokenizer": "keyword",
                   "filter": ["pinyin_full_filter", "lowercase"]
               }
           }
       }
   }
}

ElasticSerach的错误Mapping的实例

PUT http://192.168.1.200:9200/liuwunan/_mapping/doc

{
   "dynamic_templates": [{
           "text": {
               "match_mapping_type": "text",
               "mapping": {
                   "analyzer": "ik_max_word",
                   "fields": {
                       "raw": {
                           "ignore_above": 256,
                           "type": "keyword"
                       }
                   },
                   "search_analyzer": "ik_max_word",
                   "type": "text"
               }
           }
       },
       {
           "integer": {
               "match_mapping_type": "long",
               "mapping": {
                   "fields": {
                       "raw": {
                           "type": "integer"
                       }
                   },
                   "type": "integer"
               }
           }
       }
   ],
   "properties": {
       "title": {
           "type": "keyword",
           "fields": {
               "fpy": { #针对Title 全拼
                   "type": "text",
                   "index": true,
                   "analyzer": "pinyiFullIndexAnalyzer"
               },
               "spy": { #针对Title 简拼
                   "type": "text",
                   "index": true,
                   "analyzer": "pinyiSimpleIndexAnalyzer"
               }
           }
       }
   }
}
第二步：添加测试数据

{
"took": 1,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 3,
"max_score": 1,
"hits": [
{
"_index": "liuwunan",
"_type": "doc",
"_id": "1",
"_score": 1,
"_source": {
"title": "小明你好"
}
},
{
"_index": "liuwunan",
"_type": "doc",
"_id": "2",
"_score": 1,
"_source": {
"title": "明天你好"
}
},
{
"_index": "liuwunan",
"_type": "doc",
"_id": "3",
"_score": 1,
"_source": {
"title": "中华人"
}
}
]
}
}
第三步：进行拼音，中文，中文拼音混合搜索测试

①：拼音全拼搜索

POST ： http://192.168.1.200:9200/liuwunan/doc/_search

{
  "query": {
    "match": {
      "title.fpy": "mingtian" #fpy 意为全拼缩写
    }
  }
}

返回结果如下：
{
"took": 1,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 2,
"max_score": 1.398811,
"hits": [
{
"_index": "liuwunan",
"_type": "doc",
"_id": "2",
"_score": 1.398811, #分数最高
"_source": {
"title": "明天你好"
}
},
{
"_index": "liuwunan",
"_type": "doc",
"_id": "1",
"_score": 0.45315093,
"_source": {
"title": "小明你好"
}
}
]
}
}
②：中文搜索

http://192.168.1.200:9200/liuwunan/doc/_search

{
"query": {
"match": {
"title.fpy": "明天"
}
}
}

返回结果
{
"took": 2,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 2,
"max_score": 1.398811,
"hits": [
{
"_index": "liuwunan",
"_type": "doc",
"_id": "2",
"_score": 1.398811, #分数第一
"_source": {
"title": "明天你好"
}
},
{
"_index": "liuwunan",
"_type": "doc",
"_id": "1",
"_score": 0.45315093,
"_source": {
"title": "小明你好"
}
}
]
}
}
③：中文拼音混合搜索

http://192.168.1.200:9200/liuwunan/doc/_search

{
"query": {
"match": {
"title.fpy": "明tian"
}
}
}

返回结果如下：
{
"took": 2,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 2,
"max_score": 1.398811,
"hits": [
{
"_index": "liuwunan",
"_type": "doc",
"_id": "2",
"_score": 1.398811, #分数第一
"_source": {
"title": "明天你好"
}
},
{
"_index": "liuwunan",
"_type": "doc",
"_id": "1",
"_score": 0.45315093,
"_source": {
"title": "小明你好"
}
}
]
}
}
④：简拼搜索

http://192.168.1.200:9200/liuwunan/doc/_search
{
"query": {
"match": {
"title.spy": "mt"
}
}
}

返回结果如下：
{
"took": 6,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 3.0916727,
"hits": [
{
"_index": "liuwunan",
"_type": "doc",
"_id": "2",
"_score": 3.0916727, #只有一条
"_source": {
"title": "明天你好"
}
}
]
}
}
由上述截图可知，一切需求感觉好像都满足了...........项目需求都解决了，突然，被同事告知，拼音查询，返回的结果，高亮标签打的有问题，一开始以为是同事使用的API语法写的有问题，后来我手动写JSON语法，进行Post请求提交。

http://192.168.1.200:9200/liuwunan/doc/_search
{
"query": {
"match": {
"title.spy": "小明"
}
},
"highlight" : {
"fields": {
"title.spy": {
}
}
}
}

返回结果如下:

{
"took": 112,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 1.6954334,
"hits": [
{
"_index": "liuwunan",
"_type": "doc",
"_id": "1",
"_score": 1.6954334,
"_source": {
"title": "小明你好"
},
"highlight": {
"title.spy": [
"小明你好" #高亮标签
]
}
}
]
}
}

有上述可知，高亮标签打的是title所有的数据，所以出错了！

实际需要效果为
{
"took": 112,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 1.6954334,
"hits": [
{
"_index": "liuwunan",
"_type": "doc",
"_id": "1",
"_score": 1.6954334,
"_source": {
"title": "小明你好"
},
"highlight": {
"title.spy": [
"小明你好" #高亮标签
]
}
}
]
}
}
查询百度，CSDN发现很多同学遇到了此问题，以ElasticSerach中文社区这文章为例，https://elasticsearch.cn/article/6166 相同的问题，解决方案类似，我在CSDN上也找了一篇2.X版本的ElasticSerach，按照他的,Setting和 ,Mapping 进行测试发现，在2.X版本的Es确实是按照上述博客所述，并不存在这个问题，

但是6.X的ElasticSerach 就完全不行，我按照2.X操作执行了一遍，完美的避开了正确的返回结果！一个高亮标签都咩有，见到这篇文章，发现确实是高版本，是有存在这个问题的！！！【填坑中】

经过大量的测试，Mapping的修改，Setting的设置，ElaticSerach测试分词器，发现

POST http://192.168.1.200:9200/liuwunan/_analyze

{
"field": "title.fpy"
, "text": ["环球"]
}

返回結果：
{
"tokens": [
{
"token": "huan",
"start_offset": 0,
"end_offset": 2,
"type": "word",
"position": 0
},
{
"token": "qiu",
"start_offset": 0,
"end_offset": 2,
"type": "word",
"position": 1
}
]
}

分词结果显示 "type": "word"，发现这完全就是按照英文的分词器的方法！非中文的分词方式

正确实例
POST http://192.168.1.245:9200/b_and_r/_analyze

{
   "field": "title.fpy",
   "text": ["环球"]
}

返回结果：
{
"tokens": [
{
"token": "huan",
"start_offset": 0,
"end_offset": 2,
"type": "CN_WORD",
"position": 0
},
{
"token": "huanqiu",
"start_offset": 0,
"end_offset": 2,
"type": "CN_WORD",
"position": 0
},
{
"token": "qiu",
"start_offset": 0,
"end_offset": 2,
"type": "CN_WORD",
"position": 1
}
]
}

正确的结果是 "type": "CN_WORD" 中文分词器!!! 由此可知，setting和Mapping 有问题！
       分析结果如下，在做拼音搜索的时候，如果按照上述的Setting和Mapping发送请求是按照英文分词器来的，并且是单个字母拆分，并且发送中文请求，会先将中文拆分问拼音，将数据进行拼音搜索匹配，返回的是拼音，就是中文，拿过去拆成拼音，然后去匹配，然后返回的是匹配拼音上打的标签，但是实际结果，返回的数据是中文，不是拼音，所以标签打不上！

解决方案：
是配混合过滤器，你中文，拿到后台，会分析成，中文和拼音，两种方式，返回的数据，就如果有拼音，就能匹配赛拼音，如果是中文，就能匹配上，中文.打上高亮的标签。

ElasticSerach 的Setting正确的配置方式：

PUT http://192.168.1.200:9200/test
{
   "settings": {
       "index": {
           "max_result_window": 10000000
       },
       "refresh_interval": "5s",
       "number_of_shards": 1,
       "number_of_replicas": 1,
       "analysis": {
           "filter": {
               "pinyin_full_filter": {
                   "keep_joined_full_pinyin": "true",
                   "lowercase": "true",
                   "keep_original": "false",
                   "keep_first_letter": "false",
                   "keep_separate_first_letter": "false",
                   "type": "pinyin",
                   "keep_none_chinese": "false",
                   "limit_first_letter_length": "50",
                   "keep_full_pinyin": "true"
               },
               "pinyin_simple_filter": {
                   "keep_joined_full_pinyin": "true",
                   "lowercase": "true",
                   "none_chinese_pinyin_tokenize": "false",
                   "padding_char": " ",
                   "keep_original": "true",
                   "keep_first_letter": "true",
                   "keep_separate_first_letter": "false",
                   "type": "pinyin",
                   "keep_full_pinyin": "false"
               }
           },
           "analyzer": {
               "pinyinFullIndexAnalyzer": {
                   "filter": ["asciifolding", "lowercase", "pinyin_full_filter"],
                   "type": "custom",
                   "tokenizer": "ik_max_word"
               },
               "ik_pinyin_analyzer": {
                   "filter": ["asciifolding", "lowercase", "pinyin_full_filter", "word_delimiter"],
                   "type": "custom",
                   "tokenizer": "ik_smart"
               },
               "ikIndexAnalyzer": {
                   "filter": ["asciifolding", "lowercase"],
                   "type": "custom",
                   "tokenizer": "ik_max_word"
               },
               "pinyiSimpleIndexAnalyzer": {
                   "type": "custom",
                   "tokenizer": "ik_max_word",
                   "filter": ["pinyin_simple_filter", "lowercase"]
               }
           }
       }
   }
}
ElasticSerach 的Mapping正确的配置方式：

PUT http://192.168.1.200:9200/test/_mapping/doc
{
   "dynamic_templates": [{
           "strings": {
               "match_mapping_type": "string",
               "mapping": {
                   "analyzer": "ik_max_word",
                   "fields": {
                       "raw": {
                           "ignore_above": 256,
                           "type": "keyword"
                       }
                   },
                   "search_analyzer": "ik_max_word",
                   "type": "text"
               }
           }
       },
       {
           "integer": {
               "match_mapping_type": "long",
               "mapping": {
                   "fields": {
                       "raw": {
                           "type": "integer"
                       }
                   },
                   "type": "integer"
               }
           }
       }
   ],
   "properties": {
       "title": {
           "type": "text",
           "fields": {
               "fpy": {
                   "type": "text",
                   "index": true,
                   "analyzer": "pinyinFullIndexAnalyzer"
               },
               "spy": {
                   "type": "text",
                   "index": true,
                   "analyzer": "pinyiSimpleIndexAnalyzer"
               }
           },
           "analyzer": "ikIndexAnalyzer"
       }
   }
}

重点为 ,"analyzer":"ik_max_word"
最后进行结果查询

①全拼搜索
POST http://192.168.1.200:9200/liuwunan/doc/_search
{
   "_source": [ "title"],
"query": {
"match": {
"title.spy": "huanqiu"
}
},
"highlight" : {
"fields": {
"title.spy": {
}
}
}
}

返回结果：

"hits": [
{
"_index": "b_and_r",
"_type": "doc",
"_id": "hubmH2oBGUgj470FD0s1",
"_score": 5.3819566,
"_source": {
"title": "cast公司与NBC环球公司啊"
},
"highlight": {
"title.spy": [
"cast公司与NBC环球公司啊"
]
}
}
}
]

可以实现项目需求。使用拼音搜索，返回中文数据标签打到了！然后标签没有出问题，现在测试简拼和混合搜索

②简拼搜索
POST http://192.168.1.200:9200/liuwunan/doc/_search

{
   "_source": [ "title"],

"query": {
"match": {
"title.spy": "hq"
}
},
"highlight" : {
"fields": {
"title.spy": {
}
}
}
}

返回结果：
"hits": [
{
"_index": "b_and_r",
"_type": "doc",
"_id": "hubmH2oBGUgj470FD0s1",
"_score": 4.294393,
"_source": {
"title": "cast公司与NBC环球公司啊"
},
"highlight": {
"title.spy": [
"cast公司与NBC环球公司啊"
]
}
}
]

③：中文搜索
POST http://192.168.1.200:9200/liuwunan/doc/_search

{
   "_source": [ "title"],
"query": {
"match": {
"title.fpy": "环球"
}
},
"highlight" : {
"fields": {
"title.fpy": {
}
}
}
}
=======================================================================
{
   "_source": [ "title"],
"query": {
"match": {
"title": "环球"
}
},
"highlight" : {
"fields": {
"title": {
}
}
}
}
两种方式皆可
==========================================================================

返回結果
"hits": [
{
"_index": "b_and_r",
"_type": "doc",
"_id": "hubmH2oBGUgj470FD0s1",
"_score": 3.652075,
"_source": {
"title": "cast公司与NBC环球公司啊"
},
"highlight": {
"title": [
"cast公司与NBC环球公司啊"
]
}
}
]
綜上所展示，所有需求都满足了！
至此，ElasticSerach 6.0.1版本的拼音搜索，和高亮查询，已经彻底解决了！   有需要的同学，直接复制我的配置文件即可。

详细配置请见博客 https://blog.csdn.net/weixin_38822045/article/details/89138168

ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
ElasticSearch查询超过10000条（1000页）时出现Result window is too large的问题王月亮17
问题当ES数据量较大，使用分页查询超过10000条（1000页）时，出现如下错误：Cannotexecutejestaction,responsecode:500,error:{"root_cause":[{"type":"query_phase_execution_exception","reason":"Resultwindowistoolarge,from+sizemustbelesstha
Elasticsearch7.7.0 配置用户名和密码 i0208 Elasticsearch
配置用户和密码需要在配置文件中开启x-pack验证,修改config目录下面的elasticsearch.yml文件，在里面添加如下内容,并重启ES[root@localhostesuser]#vim/opt/es/elasticsearch-7.7.0/config/elasticsearch.ymlxpack.security.enabled:truexpack.license.self_ge
elasticsearch数据迁移之elasticdump 迷茫运维路 elasticsearch 中间件 elasticsearch linux 运维
系列文章目录第一章es集群搭建第二章es集群基本操作命令第三章es基于search-guard插件实现加密认证第四章es常用插件文章目录系列文章目录前言一、elasticdump是什么？二、安装elasticdump工具1.离线安装2.在线安装三、elasticdump相关参数四、使用elasticdump进行数据备份五、使用elasticdump进行数据恢复前言在企业实际生产环境中,避免不了要对
在生产环境中部署Elasticsearch：最佳实践和故障排除技巧——聚合与搜索（三）不会编程的小孩子 elasticsearch 大数据搜索引擎
#在生产环境中部署Elasticsearch：最佳实践和故障排除技巧——聚合与搜索（三）前言文章目录前言-聚合和分析-执行聚合操作-1.使用JavaAPI执行聚合操作-2.使用CURL命令执行聚合操作-1.使用JavaAPI执行度量操作-2.使用CURL命令执行度量操作-使用缓存-调整分片大小和数量-使用搜索建议-结论-节点发现-负载均衡-故障转移-结论-访问控制-加密-身份验证-结论-RESTA
Elasticsearch Java API 的使用（22）—实现桶聚合迷途码界 Elasticsearch Java API 桶聚合
分组聚合使用terms实现分组集合publicclassEsTermsAggthrowsUnknownHostException{publicvoidTermsAgg(TransportClientclient){AggregationBuilderagg=AggregationBuilders.terms("terms").field("agg");SearchResponseresponse=
Elasticsearch之bool查询 cyt涛 java elasticsearch 大数据搜索引擎 bool 布尔查询全文检索
bool查询是Elasticsearch中最常用的复合查询类型，允许将多个查询组合在一起。它通过逻辑操作符（如must、should、must_not和filter）来构建复杂的查询条件，从而满足多条件匹配、逻辑与（AND）、或（OR）、非（NOT）的查询需求。bool查询主要由四个部分组成：must：必须满足的条件（类似于SQL中的AND）。should：应该匹配的条件（类似于SQL中的OR）。
Elasticsearch 安装哒哒-blog Elasticsearch elasticsearch jenkins 大数据
下载安装elasticsearch下载链接运行：bin\elasticsearch.bat设置密码：.\bin\elasticsearch-setup-passwordsinteractive这边设置密码遇到一个坑PSG:\elasticsearch-8.8.1>.\bin\elasticsearch-setup-passwordsinteractiveFailedtoauthenticateus
Docker启动Elasticsearch(挂载数据、配置文件、插件) 程序员迪迦项目实战 Java elasticsearch docker
Docker启动Elasticsearch拉取镜像dockerpullelasticsearch:7.4.2修改配置文件mkdir-p/mydata/elasticsearch/configmkdir-p/mydata/elasticsearch/data/mkdir-p/mydata/elasticsearch/pluginsecho"http.host:0.0.0.0">>/mydata/el
docker部署elasticsearch 大大陈· elasticsearch docker 大数据
docker部署es1.简单启动2.配置文件3.安装es步骤1.简单启动#"discovery.type=single-node"标识单机启动dockerrun-d--nameelasticsearch-p9200:9200-p9300:9300-e"discovery.type=single-node"elasticsearch:tag#如果没有上面的标识，是集群启动，不这样做会报错#但是这样启
Docker安装elasticsearch和kibana viego1999 elasticsearch docker 大数据
1、首先拉取elasticsearch镜像dockerpullelasticsearch:7.9.12、创建docker挂载的目录我这里将docker环境下挂在的目录统一放在了/dockerdata目录下mkdir-p/dockerdata/elasticsearch/configmkdir-p/dockerdata/elasticsearch/datamkdir-p/dockerdata/ela
Docker部署单点es Javaismymorning ES学习笔记 docker elasticsearch
前言该笔记是根据B站上黑马SpringCloud学习总结的一、ES是什么？Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性，能使数据在生产环境变得更有价值二、Docker部署ES步骤1.创建网络因为还要部署Kibana，实现es和Kibana关联，创建一个网络Kibana是为
MySQL同步数据到Elasticsearch 运维小雅 elasticsearch mysql 大数据
背景随着平台的业务日益增多，基于数据库的全文搜索查询速度较慢，已经无法满足需求。所以，决定基于Elasticsearch做一个全文搜索平台，支持业务相关的搜索需求。那么第一个问题就是：如何从MySQL同步数据到Elasticsearch？解决方案一：基于Logstash同步数据该方案上次有详细说明过，这里就简单描述一下。Logstash同步数据流程图：优点：1、组件少，只需要Logstash就可以
docker安装与使用小鱼做了就会开发框架及各种插件 docker java maven ubuntu linux
docker安装与使用一、docker安装二、容器三、镜像五、Docker部署ES5.1部署ES5.2配置跨域5.3重启容器5.4Docker部署ES-IK分词器5.5Docker部署ElasticSearch-Head5.6Docker快速安装kibana一、docker安装sudowget-qO-https://get.docker.com/|bash二、容器容器是由镜像实例化而来，这和我们学
ES(Elasticsearch)常用的函数遨游在知识的海洋里无法自拔 java
Elasticsearch（简称ES）是一个开源的搜索引擎，广泛用于全文搜索、分析和数据可视化。以下是一些常用的Elasticsearch函数和操作：索引操作创建索引PUT/index_name删除索引DELETE/index_name查看索引GET/index_name文档操作插入文档POST/index_name/_doc/{"field":"value"}获取文档GET/index_name
java实现es分页查询_elasticsearch high level rest api分页查询数据 weixin_42565971 java实现es分页查询
Transport方式查询数据，在今后的elasticsearch中将不在维护，官方推荐用用highlevelrestapi或者lowerlevelapi去操作elasticsearch中的数据。在elasticsearch的增删改查操作中，其实最复杂的也就是分页查询了，根据elasticsearch官方资料，做个简单的笔记.1.准备jar包,我用的elasticsearch7.3版本,各版本需要
python连接es_Elasticsearch --- 3. ik中文分词器, python操作es weixin_39962285 python连接es
一.IK中文分词器1.下载安装2.测试#显示结果{"tokens":[{"token":"上海","start_offset":0,"end_offset":2,"type":"CN_WORD","position":0},{"token":"自来水","start_offset":2,"end_offset":5,"type":"CN_WORD","position":1},{"token":"
python 写入es_python-elasticsearch从创建索引到写入数据夙砂酒 python 写入es
创建索引fromelasticsearchimportElasticsearches=Elasticsearch('192.168.1.1:9200')mappings={"mappings":{"type_doc_test":{#type_doc_test为doc_type"properties":{"id":{"type":"long","index":"false"},"serial":{"
使用Python的Elasticsearch客户端 elasticsearch-py 来完成删除现有索引、重新创建索引并测试分词的示例代码 Roc-xb Python python elasticsearch
以下是一个使用Python的Elasticsearch客户端elasticsearch-py来完成删除现有索引、重新创建索引并测试分词的示例代码一、安装依赖pipinstallelasticsearch二、运行效果三、程序代码fromelasticsearchimportElasticsearch,NotFoundError#连接到Elasticsearches=Elasticsearch(
springboot指定依赖jar版本 m0_67402235 java java 后端
项目是maven父子项目结构如下：有多个子项目，因为springboot版本采用的是1.5.所以默认导入的elasticsearch版本是1.2.，而我们的集群是6.*的版本，试了很多次最后解决问题如下：在父pom的dependencyManagement中添加指定版本就可以了因为！！！父pom中指定版本优先级最高，所以可以解决子依赖pom中的版本问题。子模块只需要引入就可以了
ElasticSearch-多边形范围查询(8.x) W_Meng_H #ElasticSearch #SpringBoot elasticsearch 大数据搜索引擎
目录一、字段设计二、数据录入三、查询语句四、Java代码实现开发版本详见：Elasticsearch-经纬度查询(8.x-半径查询)_es经纬度范围查询-CSDN博客一、字段设计PUT/aoi_points{"mappings":{"properties":{"location":{"type":"geo_shape"}}}}aoi_points是索引名称，location是字段名称，它将存储地理
Elasticsearch文档值知知之之 Elasticsearch elasticsearch 大数据搜索引擎
在Elasticsearch中，文档值（DocValues）是用于高效存储和检索数据的一种数据结构，特别是在处理聚合、排序和过滤操作时。文档值是Elasticsearch为每个字段生成的预先计算的格式化数据，目的是改善性能和降低内存使用。什么是文档值（DocValues）文档值是将字段的数据存储在磁盘上的一种方式，使得字段的值以列式结构存储。这种存储方式使得对字段的高效检索和聚合成为可能，尤其是在
弹性搜索引擎Elasticsearch：本地部署与远程访问指南猴哥是肖鸿人工智能技术指导专升本 jenkins 运维
在大数据时代，数据搜索和分析成为企业核心竞争力的关键因素。弹性搜索引擎Elasticsearch作为一种分布式、可扩展的搜索和分析引擎，受到广泛欢迎。本文将介绍Elasticsearch的本地部署与远程访问，帮助读者更好地利用这一强大的工具。一、本地部署环境准备在开始部署Elasticsearch之前，需要准备以下环境：操作系统：Elasticsearch支持多种操作系统，如Linux、Windo
elasticsearch 图灵农场 tl微服务专题
cluster：代表一个集群，集群中有多个节点，其中有一个为主节点，这个主节点是可以通过选举产生的，主从节点是对于集群内部来说的。es的一个概念就是去中心化，字面上理解就是无中心节点，这是对于集群外部来说的，因为从外部来看es集群，在逻辑上是个整体，你与任何一个节点的通信和与整个es集群通信是等价的。shards：代表索引分片，es可以把一个完整的索引分成多个分片，这样的好处是可以把一个大的索引拆
ELK架构介绍星河漫漫l elk elasticsearch 运维服务器
一、ELK简介ELK是由三个开源软件组成的，分别是：Elasticsearch、Logstash和Kibana，这三个软件各自在日志管理和数据分析领域发挥着重要作用。Elasticsearch提供分布式存储和搜索能力；Logstash负责数据收集和处理，而Kibana则提供数据可视化和分析界面。他们共同构成了一个完整的日志管理解决方案，帮助企业高效利用日志数据进行监控、分析和安全审计。1.Elas
JAVA使用es不分词_谈谈 Elasticsearch 分词和自定义分词 weixin_39966376 JAVA使用es不分词
初次接触Elasticsearch的同学经常会遇到分词相关的难题，比如如下这些场景：1、为什么命名有包含搜索关键词的文档，但结果里面就没有相关文档呢？2、我存进去的文档到底被分成哪些词(term)了？3、我得自定义分词规则，但感觉好麻烦呢，无从下手如果你遇到过类似的问题，希望本文可以解决你的疑惑。一、上手让我们从一个实例出发，如下创建一个文档：PUTtest/doc/1{"msg":"Eating
ElasticSearch 谈谈你对段合并的策略思想的认识用心去追梦 elasticsearch 大数据搜索引擎
段合并是Elasticsearch中的一个重要概念，它在数据索引和查询过程中起着关键的作用。Elasticsearch使用Lucene作为其全文搜索库，Lucene中使用的数据结构就是段（Segment）合并。段合并的策略思想主要体现在以下几个方面：提高查询性能：在Elasticsearch中，段合并的过程可以看作是对索引进行优化，通过合并将多个小的段合并成一个大的段，这样可以减少内存的使用，提高
Grafana仪表盘设计最佳实践：如何创建有效的监控面板范范0825 grafana 信息可视化
Grafana仪表盘设计最佳实践：如何创建有效的监控面板引言Grafana是一个开源的数据可视化和监控平台，它提供了丰富的仪表盘功能，用于展示和分析各种数据源（如Prometheus、InfluxDB、Elasticsearch等）。有效的仪表盘设计能够帮助团队迅速识别和解决问题，提高系统的可靠性和性能。本文将深入探讨如何设计高效的Grafana仪表盘，涵盖最佳实践和实际应用。1.了解需求和目标1
es安装ik分词器 abments ES elasticsearch jenkins 大数据
下载分词器首先确定es对应的版本（假设版本是7.10.0）根据版本下载指定的分词器开始安装在线安装./bin/elasticsearch-plugininstallhttps://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.10.0/elasticsearch-analysis-ik-7.10.0.zip离线安装-
Elasticsearch——配置详解 smart哥 elasticsearch专题 elasticsearch 搜索引擎
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析阶段5、深入jvm源码解析码哥源码部分码哥讲源码-原理源码篇【2024年最新大厂关于线程池使用的场
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

ElasticSearch6.0.1 拼音搜索，并且高亮显示结果 —6.X版本

转自:https://blog.csdn.net/weixin_38822045/article/details/89306616

你可能感兴趣的:(ElasticSearch)