前几篇文章中,小编给大家介绍了一些es的基本操作,还有常用分词器的搭建,现在给大家来示范一下es的一些常见文档搜索方式。
在学习文档搜索方式前,我们先来创建一个文档,并添加一些文档数据。
tips: 这里的分词器,我们使用的是上篇文章所说的ik分词器
#创建索引
PUT /students
{
"mappings":{
"properties":{
"id": {
"type": "integer",
"index": true
},
"name": {
"type": "text",
"store": true,
"index": true,
"analyzer": "ik_smart"
},
"info": {
"type": "text",
"store": true,
"index": true,
"analyzer": "ik_smart"
}
}
}
}
# 添加数据
POST /students/_doc/
{
"id":1,
"name":"小白程序员",
"info":"I love coding"
}
POST /students/_doc/
{
"id":2,
"name":"美羊羊",
"info":"美羊羊是羊村最漂亮的人"
}
POST /students/_doc/
{
"id":3,
"name":"懒羊羊",
"info":"懒羊羊的成绩不是很好"
}
POST /students/_doc/
{
"id":4,
"name":"小灰灰",
"info":"小灰灰的年纪比较小"
}
POST /students/_doc/
{
"id":5,
"name":"沸羊羊",
"info":"沸羊羊喜欢美羊羊"
}
POST /students/_doc/
{
"id":6,
"name":"灰太狼",
"info":"灰太狼是小灰灰的父亲,每次都会说我一定会回来的"
}
match:
1.全文检索字符,将查询条件分词后再进行搜索
2.还支持模糊查询,具有自动纠错功能(最多纠错两个字,超过则报错)
#格式
{
"query":{
"match_all":{}
}
}
eg: 查询全部
GET /students/_search
{
"query": {
"match_all": {}
}
}
#eg1:全文检索 match:将查询条件分词后再进行搜索
GET /students/_search
{
"query": {
"match": {
"info": "喜欢"
}
}
}
#eg2:match还支持模糊查询 还具有自动纠错功能(最多自动纠错两个字符,超过两个报错)
GET /students/_search
{
"query": {
"match": {
"info": {
"query": "lov",
"fuzziness": 1
}
}
}
}
对数字类型的字符进行范围搜索
,这个和数据库的范围限定符类似。
#格式
{
"query":{
"range":{
搜索字段:{
"gte":最小值,
"lte":最大值
}
}
}
}
gt/lt:大于/小于
gte/lte:大于等于/小于等于
eg:
GET /students/_search
{
"query": {
"range": {
"id": {
"gte": 1,
"lte": 3
}
}
}
}
搜索条件不做任何分词解析,在搜索字段对应的倒排索引中精确匹配
#格式
{
"query":{
"match_phrase":{
搜索字段:搜索条件
}
}
}
eg:
GET /students/_search
{
"query": {
"match_phrase": {
"info": "成绩"
}
}
}
单词或者词组搜索,不做任何分词解析,在搜索字段对应的倒排索引中精确匹配
#格式
{
"query":{
"term":{
搜索字段: 搜索条件
}
}
}
{
"query":{
"terms":{
搜索字段: [搜索条件1,搜索条件2]
}
}
}
es也是可以像Java语言那样,可以将多个条件嵌套使用,从而筛选出符合条件的那一个。
#格式
GET /索引/_search
{
"query": {
"bool": {
// 必须满足的条件
"must": [
搜索方式:搜索参数,
搜索方式:搜索参数
],
// 多个条件有任意一个满足即可
"should": [
搜索方式:搜索参数,
搜索方式:搜索参数
],
// 必须不满足的条件
"must_not":[
搜索方式:搜索参数,
搜索方式:搜索参数
]
}
}
}
eg:
GET /students/_search
{
"query": {
"bool": {
"must_not": [
{
"term": {
"info": "成绩"
}
},
{
"range": {
"id": {
"gte": 1,
"lte": 3
}
}
}
]
}
}
}
上面就是查询出id在1到3范围内,且info里面含有成绩字样的student
es默认使用相关度分数实现排序,也可以通过搜索语法定制化排序
#格式
GET /索引/_search
{
"query": 搜索条件,
"sort": [
{
"字段1":{
"order":"asc"
}
},
{
"字段2":{
"order":"desc"
}
}
]
}
eg:
#1根据匹配度排序,高的在前面
GET /students/_search
{
"query": {
"match": {
"info": "我喜欢成绩好的学生"
}
}
}
#2根据搜索语法定制化排序
GET /students/_search
{
"query": {
"match": {
"info": "我喜欢淑仪"
}
},
"sort": [
{
"id": {
"order": "desc"
}
}
]
}
tips:es默认不会对text类型的字段做排序(因为会分词),如果需要使用text类型的字段做结果排序,可以使用keyword类型的字段作为排序依据(因为keyword类型的字段不会做分词处理)
这个顾名思义就是当查询内容过多的时候,可以将其分成几页,每页限定规定的数量进行查询。
#格式
GET /索引/_search
{
"query": 搜索条件,
"from": 起始下标,
"size": 查询记录数
}
eg:
GET /students/_search
{
"query":{
"match_all":{}
},
"from":0,
"size":3
}
在es里面使用sql语句对文档进行查询(没啥用)
#格式
GET /_sql?format=txt
{
"query": SQL语句
}
eg:
GET /_sql?format=txt
{
"query": "select *from students"
}
介绍了一些elasticsearch的常见文档搜索方式,结合前几篇文章学习,可以很好地入门es,希望你有所收获。