es 7.10
注意:使用此方式去重时,不会去除掉不存在去重字段的数据。
去重字段只能是数字类型或keyword。
对text字段进行去重将报错,报错如下。
"unknown type for collapse field `xxx`,only keywords and numbers are accepted"
去重举例如下:
(1)根据approval查询,且根据standardId去重
GET test/_search
{
"query": {
"term": {
"approval":"苏械注准20172091712"
}
},
"collapse": {
"field": "standardId"
}
}
其中standardId的mappings信息如下:
"standardId" : {
"type" : "long"
}
(2)根据approval查询,且根据dosageName去重
GET test/_search
{
"query": {
"term": {
"approval":"苏械注准20172091712"
}
},
"collapse": {
"field": "dosageName.keyword"
}
}
其中dosageName的mappings信息如下:
"dosageName" : {
"type" : "text",
"fields" : {
"keyword" : {
"type" : "keyword",
"ignore_above" : 256
}
}
}
注意:使用此方式去重时,会去除掉不存在去重字段的数据。
根据approval查询,且根据standardId去重
GET test/_search
{
"query": {
"term": {
"approval": "苏械注准20172091712"
}
},
"size": 0,
"aggs": {
"age_aggs": {
"terms": {
"field": "standardId",
"size": 10
},
"aggs": {
"age_top": {
"top_hits": {
"sort": [{
"standardId": {
"order": "desc"
}
}],
"size": 1
}
}
}
}
}
}
注意:使用此方式统计去重后的数量时,会去除掉不存在去重字段的数据。
查询根据approval查询,且根据standardId去重后的数量:
# "size": 0 -> 指定es结果中不返回去重前的具体数据,只返回去重后的数量
GET test/_search
{
"query": {
"term": {
"approval": "苏械注准20172091712"
}
},
"size": 0,
"aggs": {
"age_aggs": {
"cardinality": {
"field": "standardId"
}
}
}
}
使用collapse功能去重的关键在于使用CollapseBuilder设置去重字段。举例如下所示。
根据approval查询,且根据standardId去重:
// 构建查询条件
SearchSourceBuilder builder = new SearchSourceBuilder();
BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
boolQuery.must(QueryBuilders.termQuery("approval", "国药准字20240119001"));
builder.query(boolQuery).from(0).size(20);
CollapseBuilder collapseBuilder = new CollapseBuilder("standardId");
builder.collapse(collapseBuilder);
(1)ElasticSearch单字段查询去重详解
(2)es检索到的大量数据如何根据特定字段去重