22_ElasticSearch 搜索推荐match_phrase_prefix实现search-time

22_ElasticSearch 搜索推荐match_phrase_prefix实现search-time

更多干货

  • 分布式实战(干货)
  • spring cloud 实战(干货)
  • mybatis 实战(干货)
  • spring boot 实战(干货)
  • React 入门实战(干货)
  • 构建中小型互联网企业架构(干货)
  • python 学习持续更新

一、概述

1.名称解释

搜索推荐,search as you type,搜索提示。

  • 如百度搜索输入 elas 会提示 --> elasticsearch 提示 --> elasticsearch权威指南
  • 如 输入 hello w 会有一下提示
hello world
hello we
hello win
hello wind
hello dog
hello cat

2.说明

  • 尽量不要用,因为,最后一个前缀始终要去扫描大量的索引,性能可能会很差
  • max_expansions:指定prefix最多匹配多少个term,超过这个数量就不继续匹配了

二、语法

GET /my_index/my_type/_search 
{
  "query": {
    "match_phrase_prefix": {
      "title": "hello d"
    }
  }
}

三、原理

原理跟match_phrase类似,唯一的区别,就是把最后一个term作为前缀去搜索。一下用输入 hello w 进行讲解

  • 1、hello就是去进行match,搜索对应的doc
  • 2、w,会作为前缀,去扫描整个倒排索引,找到所有w开头的doc
  • 3、然后找到所有doc中,即包含hello,又包含w开头的字符的doc
  • 4、根据你的slop去计算,看在slop范围内,能不能让hello w,正好跟doc中的hello和w开头的单词的position相匹配
  • 也可以指定slop,但是只有最后一个term会作为前缀
  • max_expansions:指定prefix最多匹配多少个term,超过这个数量就不继续匹配了,限定性能
  • 默认情况下,前缀要扫描所有的倒排索引中的term,去查找w打头的单词,但是这样性能太差。可以用max_expansions限定,w前缀最多匹配多少个term,就不再继续搜索倒排索引了。

相关内容

  • 1_ElasticSearch使用term filter来搜索数据

  • 2_ElasticSearch filter执行原理 bitset机制与caching机制

  • 3_ElasticSearch 基于bool组合多个filter条件来搜索数据

  • 4_ElasticSearch 使用terms搜索多个值

  • 5_ElasticSearch 基于range filter来进行范围过滤

  • 6_ElasticSearch 控制全文检索结果的精准度

  • 7_ElasticSearch term+bool实现的multiword搜索原理

  • 8_基于boost的搜索条件权重控制

  • 9_ElasticSearch 多shard场景下relevance score不准确

  • 10_ElasticSearch dis_max实现best fields策略进行多字段搜索

  • 11_ElasticSearch 基于tie_breaker参数优化dis_max搜索效果

  • 12_ElasticSearch multi_match语法实现dis_max+tie_breaker

  • 13_ElasticSearch multi_match+most fiels策略进行multi-field搜索

  • 14_ElasticSearch 使用most_fields策略进行cross-fields search

  • 15_ElasticSearch copy_to定制组合field进行cross-fields搜索

  • 16_ElasticSearch 使用原生cross-fiels 查询

  • 17_ElasticSearch phrase matching搜索

  • 18_ElasticSearch 基于slop参数实现近似匹配

  • 日志管理ELK


你可能感兴趣的:(【构建高可用架构】,【大数据】,【ElatisSearch】)