Elasticsearch连续剧之实战搜索文档

目录

  • 一、前言
  • 二、准备工作
  • 三、文档搜索
    • 1.查询所有文档
    • 2.根据关键词模糊查询
    • 3.范围搜索(range)
    • 4.短语检索
    • 5.词组查询term/terms
    • 6.复合搜索
    • 7.结果排序
    • 8.分页查询
    • 9.sql查询
  • 四、总结

一、前言

前几篇文章中,小编给大家介绍了一些es的基本操作,还有常用分词器的搭建,现在给大家来示范一下es的一些常见文档搜索方式。

二、准备工作

在学习文档搜索方式前,我们先来创建一个文档,并添加一些文档数据。

tips: 这里的分词器,我们使用的是上篇文章所说的ik分词器

#创建索引
PUT /students
{
  "mappings":{
    "properties":{
      "id": {
            "type": "integer",
        "index": true
       },
         "name": {
            "type": "text",
            "store": true,
        "index": true,
            "analyzer": "ik_smart"
         },
      "info": {
            "type": "text",
            "store": true,
        "index": true,
            "analyzer": "ik_smart"
         }
     }
   }
}
# 添加数据
POST /students/_doc/
{
 "id":1,
 "name":"小白程序员",
 "info":"I love coding"
}

POST /students/_doc/
{
 "id":2,
 "name":"美羊羊",
 "info":"美羊羊是羊村最漂亮的人"
}

POST /students/_doc/
{
 "id":3,
 "name":"懒羊羊",
 "info":"懒羊羊的成绩不是很好"
}

POST /students/_doc/
{
 "id":4,
 "name":"小灰灰",
 "info":"小灰灰的年纪比较小"
}

POST /students/_doc/
{
 "id":5,
 "name":"沸羊羊",
 "info":"沸羊羊喜欢美羊羊"
}

POST /students/_doc/
{
 "id":6,
 "name":"灰太狼",
 "info":"灰太狼是小灰灰的父亲,每次都会说我一定会回来的"
}

三、文档搜索

1.查询所有文档

match:
1.全文检索字符,将查询条件分词后再进行搜索
2.还支持模糊查询,具有自动纠错功能(最多纠错两个字,超过则报错)

#格式
{
    "query":{
    "match_all":{}
   }
}

eg:  查询全部
GET /students/_search
{
  "query": {
    "match_all": {}
  }
}

2.根据关键词模糊查询

#eg1:全文检索 match:将查询条件分词后再进行搜索 
GET /students/_search
{
  "query": {
    "match": {
      "info": "喜欢"
    }
  }
}
#eg2:match还支持模糊查询 还具有自动纠错功能(最多自动纠错两个字符,超过两个报错)
GET /students/_search
{
  "query": {
    "match": {
      "info": {
        "query": "lov",
        "fuzziness": 1
      }
    }
  }
}

3.范围搜索(range)

对数字类型的字符进行范围搜索,这个和数据库的范围限定符类似。

#格式
{
    "query":{
    "range":{
      搜索字段:{ 
        "gte":最小值,
        "lte":最大值
       } 
     }
   }
}
gt/lt:大于/小于
gte/lte:大于等于/小于等于

eg:
GET /students/_search
{
  "query": {
    "range": {
      "id": {
        "gte": 1,
        "lte": 3
      }
    }
  }
}

4.短语检索

搜索条件不做任何分词解析,在搜索字段对应的倒排索引中精确匹配

#格式
{
    "query":{
    "match_phrase":{
      搜索字段:搜索条件
     }
   }
}

eg:
GET /students/_search
{
  "query": {
    "match_phrase": {
      "info": "成绩"
    }
  }
}

5.词组查询term/terms

单词或者词组搜索,不做任何分词解析,在搜索字段对应的倒排索引中精确匹配

#格式
{
    "query":{
    "term":{ 
            搜索字段: 搜索条件
     }
   }
}


{
    "query":{
    "terms":{ 
            搜索字段: [搜索条件1,搜索条件2]
     }
   }
}

6.复合搜索

es也是可以像Java语言那样,可以将多个条件嵌套使用,从而筛选出符合条件的那一个。

#格式
GET /索引/_search
{ 
    "query": { 
    "bool": { 
      // 必须满足的条件 
      "must": [ 
                搜索方式:搜索参数,
                搜索方式:搜索参数
       ],
      // 多个条件有任意一个满足即可
      "should": [
                搜索方式:搜索参数,
               搜索方式:搜索参数
           ],
            // 必须不满足的条件
           "must_not":[
               搜索方式:搜索参数,
               搜索方式:搜索参数
           ]
       } 
   } 
}
eg:
GET /students/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "term": {
            "info": "成绩"
          }
        },
        {
          "range": {
            "id": {
              "gte": 1,
              "lte": 3
            }
          }
        }
      ]
    }
  }
}

上面就是查询出id在1到3范围内,且info里面含有成绩字样的student

7.结果排序

es默认使用相关度分数实现排序,也可以通过搜索语法定制化排序

#格式
GET /索引/_search
{ 
  "query": 搜索条件,
  "sort": [
       {
           "字段1":{
               "order":"asc"
           } 
       },
       { 
           "字段2":{ 
               "order":"desc" 
           } 
       }
   ] 
}
eg:
#1根据匹配度排序,高的在前面
GET /students/_search
{
  "query": {
    "match": {
      "info": "我喜欢成绩好的学生"
    }
  }
}

#2根据搜索语法定制化排序
GET /students/_search
{
  "query": {
    "match": {
      "info": "我喜欢淑仪"
    }
  },
  "sort": [
    {
      "id": {
        "order": "desc"
      }
    }
  ]
}

tips:es默认不会对text类型的字段做排序(因为会分词),如果需要使用text类型的字段做结果排序,可以使用keyword类型的字段作为排序依据(因为keyword类型的字段不会做分词处理)

8.分页查询

这个顾名思义就是当查询内容过多的时候,可以将其分成几页,每页限定规定的数量进行查询。

#格式
GET /索引/_search
{ 
    "query": 搜索条件,
    "from": 起始下标,
    "size": 查询记录数
}
eg:
GET /students/_search
{
	"query":{
        "match_all":{}
    },
    "from":0,
    "size":3
}

9.sql查询

在es里面使用sql语句对文档进行查询(没啥用)

#格式
GET /_sql?format=txt
{
    "query": SQL语句
}
eg:
GET /_sql?format=txt
{
  "query": "select *from students"
}

四、总结

介绍了一些elasticsearch的常见文档搜索方式,结合前几篇文章学习,可以很好地入门es,希望你有所收获。

你可能感兴趣的:(es,elasticsearch,全文检索,大数据)