es中match_phrase和term区别

term是将传入的文本原封不动地(不分词)拿去查询。
match会对输入进行分词处理后再去查询,部分命中的结果也会按照评分由高到低显示出来。
match_phrase是按短语查询,只有存在这个短语的文档才会被显示出来。

也就是说,term和match_phrase都可以用于精确匹配,而match用于模糊匹配。

之前我以为match_phrase不会被分词,看来理解错了,其官方解释如下:

Like the match query, the match_phrase query first analyzes the query string to produce a list of terms. It then searches for all the terms, but keeps only documents that contain all of the search terms, in the same positions relative to each other.

总结下,这段话的3个要点:

  1. match_phrase还是分词后去搜的
  2. 目标文档需要包含分词后的所有词
  3. 目标文档还要保持这些词的相对顺序和文档中的一致

只有当这三个条件满足,才会命中文档!

那么,term和match_phrase都可以实现按短语搜索,二者在实际使用中有啥区别呢。

【发现问题】
1.我们先放入一个文档:
es中match_phrase和term区别_第1张图片
2.然后使用match_phrase搜索:
es中match_phrase和term区别_第2张图片
es中match_phrase和term区别_第3张图片
嗯,不出所料,搜索到了。

3.然后我们用term试试
es中match_phrase和term区别_第4张图片
es中match_phrase和term区别_第5张图片
纳尼!!!居然没有?那么全句带进去搜总行了吧
es中match_phrase和term区别_第6张图片
es中match_phrase和term区别_第7张图片
居然还是不行!!这就奇怪了。

【问题分析】我们来看看这句话的分词结果:
es中match_phrase和term区别_第8张图片es中match_phrase和term区别_第9张图片
我们会发现,中文竟然被默认分词器分词单个字了!尴尬啊!!!
这就不难理解为啥term搜“学习”搜不到,搜全文也搜不到,因为存的是“学”和“习”。

【总结】如果使用term查询,要确保字段是no analyzed的。建索引的时候要注意。

你可能感兴趣的:(big,data)