搜索-Elasticsearch-进阶1

outline

一.function_score
二.搜索字段的权重控制

一.function_score

functions是一个数组,存放加强函数列表

1.加强_score的计算函数

(1) weight
设置一个简单而不被规范化的权重提升值
new_score = old_score * weight

(2) field_value_factor
将某个字段的值乘上old_score

(3) random_score :
为每个用户都使用一个不同的随机评分对结果排序,但对某一具体用户来说,看到的顺序始终是一致的

2.辅助参数

(1) boost_mode : 决定 old_score 和 加强score 如何合并
(2) score_mode:先合并functions中的函数,然后使用加强score和old_score合并(boost_mode)
(3) max_boost

3.衰减函数

以某个字段的值为基准,距离某个值越近得分越高
linear : 线性函数是条直线,一旦直线与横轴0香蕉,所有其他值的评分都是0
exp : 指数函数是先剧烈衰减然后变缓
guass(最常用) : 高斯函数则是钟形的,他的衰减速率是先缓慢,然后变快,最后又放缓

4.script_score

当需求超出以上范围时,可以用自定义脚本完全控制评分计算,不过因为还要额外维护脚本不好维护,因此尽量使用ES提供的评分函数,需求真的无法满足再使用script_score

weight-example:


GET 127.0.0.1/mytest/doc/_search
{
"query": {
"function_score": {
"query": {
"match_all": {} //match_all查出来的所有文档的_score都是1
},
"functions": [
//第一个filter(使用weight加强函数),如果language是java,加强score就是2
{
"filter": {
"term": {
"language": "java"
}
},
"weight": 2
},
//第二个filter(使用weight加强函数),如果language是go,加强score就是3
{
"filter": {
"term": {
"language": "go"
}
},
"weight": 3
},
//第三个filter(使用weight加强函数),如果like数大于等于10,加强score就是5
{
"filter": {
"range": {
"like": {
"gte": 10
}
}
},
"weight": 5
},
//field_value_factor加强函数,会应用到所有文档上,加强score就是like值
{
"field_value_factor": {
"field": "like"
}
}
],
"score_mode": "multiply", //设置functions裡面的加强score们怎麽合併成一个总加强score
"boost_mode": "multiply" //设置old_score怎麽和总加强score合併
}
}
}

按受欢迎度提升权重/field_value_factor


GET /forum/article/_search
{
"query": {
"function_score": {
"query": {
"multi_match": {
"query": "java spark",
"fields": ["tile", "content"]
}
},
"field_value_factor": {
"field": "follower_num",
"modifier": "log1p",
"factor": 0.5
},
"boost_mode": "sum",
"max_boost": 2
}
}
}

field_value_factor中如果只有field,那么会将每个doc的分数都乘以follower_num,如果有的doc follower是0,那么分数就会变为0,效果很不好。因此一般会加个log1p函数,公式会变为,new_score = old_score * log(1 + number_of_votes),这样出来的分数会比较合理
factor的作用:new_score = old_score * log(1 + factor * number_of_votes)
boost_mode:可以决定分数与指定字段的值如何计算,multiply,sum,min,max,replace
max_boost,限制计算出来的分数不要超过max_boost指定的值

new_score的函数曲线

搜索-Elasticsearch-进阶1_第1张图片
image

二.搜索字段的权重控制

在多个field中搜索,field的权重不同/增加某个term的权重
(1)


{
"multi_match" : {
"query" : "天龙八部",
"type" : "best_fields",
"tie_breaker" : 0.3,
"fields" : [ "title^1.5", "body" ],
"minimun_should_match" : "30%"
}
}

(2)

GET /_search
{
"query": {
"bool": {
"should": [
{
"match": {
"title": {
"query": "quick brown fox",
"boost": 2
}
}
},
{
"match": {
"content": "quick brown fox"
}
}
]
}
}
}

Not Quite Not


GET /_search
{
"query": {
"bool": {
"must": {
"match": {
"text": "apple"
}
},
"must_not": {
"match": {
"text": "pie tart fruit crumble tree"
}
}
}
}
}

negative boost


GET /forum/article/_search
{
"query": {
"boosting": {
"positive": {
"match": {
"content": "java"
}
},
"negative": {
"match": {
"content": "spark"
}
},
"negative_boost": 0.2
}
}

elasticsearch笔记
elasticsearch控制度相关
ElasticSearch - function_score 简介

你可能感兴趣的:(搜索-Elasticsearch-进阶1)