亚瑟死灵骑士

Elasticsearch笔记(十一) ES term terms prefix 搜索聚合查询详细总结

ES term terms prefix 搜索聚合查询详细总结

1 前提
2 准备数据
3 凉菜--这个都不会？一首凉凉送给你
- 1 term
- 2 terms
- 3 prefix
- 4 wildcard
- 5 range
- 6 exists
4 油焖大虾--把condition组合起来一锅焖
- 1 bool
- 2 must
- 3 must_not
- 4 should
- 5 filter
5 阿凡提羊肉串--给查询加点料
- 1 过滤字段 _source
- 2 排序 sort
- 3 分页查询 from+size
6 肉末茄子--Aggs服务员，你过来统计下肉末
- 1 count
- 2 terms聚合
- 3 having，聚合完，再过滤
- 4 先过滤后，再聚合
7 扇子骨-collapse听说你想折叠起来
- 1 collapse折叠查询
8 青椒肉丝-Explain服务员，解释下为啥只有青椒
- 1 explain
9 总结一句话

1 前提

本人从17年在工作中接触ES，但是到现在感觉没有入门，主要是一直使用ES的JavaAPI去做简单业务逻辑开发，并没有认真看过ES的文档，对ES的理解还很浅。本着“教是最好的学”，特别想整理下ES查询的常用API，尤其看了下面ES开发者占比，感觉尤为强烈，因为我不属于其中一种（我=年龄大+工资低+头发少）。

2 准备数据

PUT /pigg/_doc/1
{
     
  "name": "老亚瑟",
  "age": 31,
  "sex": "男",
  "word": "死亡骑士，不是死掉的骑士",
  "weapon": ["黑切", "冰痕之握", "反伤刺甲","闪电匕首","破军"]
}

PUT /pigg/_doc/2
{
     
  "name": "孙悟空",
  "age": 40,
  "sex": "男",
  "word": "我就是吉吉国王",
  "weapon": ["黑切", "冰痕之握", "无尽战刃", "宗师之力"]
}

PUT /pigg/_doc/3
{
     
  "name": "安琪拉",
  "age": 16,
  "sex": "女",
  "word": "我就是小萝莉",
  "weapon": []
}

PUT /pigg/_doc/4
{
     
  "name": "老夫子",
  "age": 100,
  "sex": "男",
  "word": "我要定住你"
}

3 凉菜–这个都不会？一首凉凉送给你

对ES不熟悉可先看Elasticsearch笔记(九) term terms exists 查询案例

1 term

查询name=“老亚瑟”的数据

GET /pigg/_search
{
     
  "query": {
     
    "term": {
     
      "name": {
     
        "value": "老亚瑟"
      }
    }
  },
  "_source": ["name"]
}

这个时候我们发下结果如下，没有数据

{
     
  "hits" : {
     
    "total" : 0,
    "max_score" : null,
    "hits" : [ ]
  }
}

因为我们没有自己定义mapping，这里name是text类型，“老亚瑟”被ES默认分词为“老”，“亚”，“瑟”这3个字，所以找不到。
term是包含的意思，查询name里包含“老”的数据：

GET /pigg/_search
{
     
  "query": {
     
    "term": {
     
      "name": {
     
        "value": "老"
      }
    }
  },
  "_source": ["name"]
}

返回结果如下，可以看到“老夫子”和“老亚瑟”都匹配中。

{
     
    "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "4",
        "_score" : 0.6931472,
        "_source" : {
     
          "name" : "老夫子"
        }
      },
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.2876821,
        "_source" : {
     
          "name" : "老亚瑟"
        }
      }
    ]

name默认下面有个keyword字段，就是name.keyword，它没有被分词。

GET /pigg/_search
{
     
  "query": {
     
    "term": {
     
      "name.keyword": {
     
        "value": "老亚瑟"
      }
    }
  },
  "_source": ["name"]
}

结果如下，通过keyword类型可以精确查询

    "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.2876821,
        "_source" : {
     
          "name" : "老亚瑟"
        }
      }
    ]

2 terms

terms是命中一个就算匹配，查询有黑切或者宗师之力的人

GET /pigg/_search
{
     
  "query": {
     
    "terms": {
     
      "weapon.keyword": [
        "黑切",
        "宗师之力"
      ]
    }
  },
  "_source": ["name", "weapon"]
}

返回结果如下：

    "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 1.0,
        "_source" : {
     
          "weapon" : [
            "黑切",
            "冰痕之握",
            "无尽战刃",
            "宗师之力"
          ],
          "name" : "孙悟空"
        }
      },
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : {
     
          "weapon" : [
            "黑切",
            "冰痕之握",
            "反伤刺甲",
            "闪电匕首",
            "破军"
          ],
          "name" : "老亚瑟"
        }
      }
    ]

3 prefix

prefix前缀查询，在工作中很常见，就行MySQL里的 like “abc%”。
查询name以“老”开头的人：

GET /pigg/_search
{
     
  "query": {
     
    "prefix": {
     
      "name.keyword": {
     
        "value": "老"
      }
    }
  },
  "_source": ["name"]
}

结果如下：

  "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "4",
        "_score" : 1.0,
        "_source" : {
     
          "name" : "老夫子"
        }
      },
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : {
     
          "name" : "老亚瑟"
        }
      }
    ]

4 wildcard

wildcard查询就像MySQL的Like查询，它查询效率比较低，一般也不用
查询name里包含“亚”的人：

GET /pigg/_search
{
     
  "query": {
     
    "wildcard": {
     
      "name.keyword": {
     
        "value": "*亚*"
      }
    }
  },
  "_source": ["name"]
}

5 range

range是范围查询，查询age在[10,30]的人

GET /pigg/_search
{
     
  "query": {
     
    "range": {
     
      "age": {
     
        "gte": 10,
        "lte": 30
      }
    }
  },
  "_source": ["name"]
}

返回如下：

    "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "3",
        "_score" : 1.0,
        "_source" : {
     
          "name" : "安琪拉"
        }
      }
    ]

6 exists

查询weapon字段有值的人：

GET /pigg/_search
{
     
  "query": {
     
    "exists": {
     
        "field": "weapon"
    }
  },
  "_source": ["name"]
}

查询weapon字段没有值的人：

GET /pigg/_search
{
     
  "query": {
     
    "bool": {
     
      "must_not": [
        {
     
          "exists": {
     
            "field": "weapon"
          }
        }
      ]
    }
  },
  "_source": ["name"]
}

结果如下：其中老夫子没有weapon这个字段，而安琪拉的weapon=[]。

    "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "4",
        "_score" : 1.0,
        "_source" : {
     
          "name" : "老夫子"
        }
      },
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "3",
        "_score" : 1.0,
        "_source" : {
     
          "name" : "安琪拉"
        }
      }
    ]

4 油焖大虾–把condition组合起来一锅焖

1 bool

bool 过滤器是个复合过滤器，它可以接受多个其他过滤器作为参数，并将这些过滤器结合成各式各样的布尔（逻辑）组合。
它格式如下：

{
     
   "bool" : {
     
      "must" :     [],
      "should" :   [],
      "must_not" : [],
   }
}

2 must

查询name以“老”开头的，并且age>=90的人

GET /pigg/_search
{
     
  "query": {
     
    "bool": {
     
      "must": [
        {
     
          "prefix": {
     
            "name": {
     
              "value": "老"
            }
          }
        },
        {
     
          "range": {
     
            "age": {
     
              "gte": 90
            }
          }
        }
      ]
    }
  },
   "_source": ["name","age"]
}

查询结果如下，毕竟我们的亚瑟王怎么可能那么老

 "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "4",
        "_score" : 2.0,
        "_source" : {
     
          "name" : "老夫子",
          "age" : 100
        }
      }
    ]

3 must_not

must_not和must相反，是非的意思，查询买了武器但是没有买无尽战刃的人

GET /pigg/_search
{
     
  "query": {
     
    "bool": {
     
      "must_not": [
        {
     
          "term": {
     
            "weapon.keyword": {
     
              "value": "无尽战刃"
            }
          }
        }
      ],
      "must": [
        {
     
          "exists": {
     
            "field": "weapon"
          }
        }
      ]
    }
  },
  "_source": ["name", "weapon"]
}

4 should

should是或的意思
查询是女的，或者word包含“吉吉国王”的人

GET /pigg/_search
{
     
  "query": {
     
    "bool": {
     
      "should": [
        {
     
          "term": {
     
            "sex": {
     
              "value": "女"
            }
          }
        },
        {
     
          "match": {
     
            "word": "吉吉国王"
          }
        }
      ]
    }
  },
  "_source": ["name","sex", "word"]
}

返回如下：

 "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 3.1186123,
        "_source" : {
     
          "sex" : "男",
          "name" : "孙悟空",
          "word" : "我就是吉吉国王"
        }
      },
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "3",
        "_score" : 0.2876821,
        "_source" : {
     
          "sex" : "女",
          "name" : "安琪拉",
          "word" : "我就是小萝莉"
        }
      }
    ]

当should和must或者must_not在同一层的时候，它不会影响结果，但影响匹配分数。

GET /pigg/_search
{
     
  "query": {
     
    "bool": {
     
      "must": [
        {
     
          "term": {
     
            "sex.keyword": {
     
              "value": "男"
            }
          }
        }
      ],
      "should": [
        {
     
          "range": {
     
            "age": {
     
              "gte": 90
            }
          }
        }
      ]
    }
  },
  "_source": ["name","sex", "age"]
}

结果如下：大家都是男人，但是老夫子的年龄>=90,他的_score=1.1823215，比另外2人高。

  "hits" : [
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "4",
        "_score" : 1.1823215,
        "_source" : {
     
          "sex" : "男",
          "name" : "老夫子",
          "age" : 100
        }
      },
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.2876821,
        "_source" : {
     
          "sex" : "男",
          "name" : "老亚瑟",
          "age" : 31
        }
      },
      {
     
        "_index" : "pigg",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.18232156,
        "_source" : {
     
          "sex" : "男",
          "name" : "孙悟空",
          "age" : 40
        }
      }
    ]

5 filter

filter过滤查询，它不评分，效率高，网上介绍filter的文章很多，在此我就不瞎BB了。

GET /pigg/_search
{
     
  "query": {
     
    "bool": {
     
      "filter": {
     
        "term": {
     
          "sex.keyword": "男"
        }
      }
    }
  },
  "_source": ["name","sex"]
}

5 阿凡提羊肉串–给查询加点料

1 过滤字段 _source

#只返回"name", "sex"2个字段
GET /pigg/_search
{
     
  "query": {
     
    "match_all": {
     }
  },
  "_source": ["name", "sex"]
}

#只返回w开头的字段
GET /pigg/_search
{
     
  "query": {
     
    "match_all": {
     }
  },
  "_source": ["w*"]
}

#只返回w开头并且不是n结尾的字段
GET /pigg/_search
{
     
  "query": {
     
    "match_all": {
     }
  },
  "_source": {
     
    "includes": "w*",
    "excludes": "*n"
  }
}

2 排序 sort

GET /pigg/_search
{
     
  "sort": [
     {
     
      "sex.keyword": {
     
        "order": "desc"
      }
    },
    {
     
      "age": {
     
        "order": "desc"
      }
    }
  ],
  "_source": ["name","sex","age"]
}

3 分页查询 from+size

分页功能很常用，from从0开始，如果数据量很大，有深分页的问题。虽然有时公司喜欢改max_result_window这个参数，调的很多。额。。。，能查出来，你高兴就好。
如果数据量很大，分页读取数据并处理，可以考虑scroll，网上文章很多，我就不BB了。

GET /pigg/_search
{
     
  "from": 0,
  "size": 2, 
  "sort": [
    {
     
      "sex.keyword": {
     
        "order": "desc"
      }
    }
  ],
  "_source": ["name","sex"]
}

6 肉末茄子–Aggs服务员，你过来统计下肉末

1 count

统计满足条件的数量

GET /pigg/_count
{
     
  "query": {
     
    "term": {
     
      "sex.keyword": {
     
        "value": "男"
      }
    }
  }
}

2 terms聚合

terms聚合，就像GROUP BY

POST /_xpack/sql?format=txt
{
     
  "query": "SELECT sex, COUNT(*) num FROM pigg GROUP BY sex ORDER BY num desc" 
}

统计各装备的使用数量，并排序

GET /pigg/_search
{
     
  "aggs": {
     
    "terms_by_weapon": {
     
      "terms": {
     
        "field": "weapon.keyword",
        "size": 10,
         "order" : {
      "_count" : "asc" }
      }
    }
  }
}

结果如下：

      "buckets" : [
        {
     
          "key" : "反伤刺甲",
          "doc_count" : 1
        },
        {
     
          "key" : "宗师之力",
          "doc_count" : 1
        },
        {
     
          "key" : "无尽战刃",
          "doc_count" : 1
        },
        {
     
          "key" : "破军",
          "doc_count" : 1
        },
        {
     
          "key" : "闪电匕首",
          "doc_count" : 1
        },
        {
     
          "key" : "冰痕之握",
          "doc_count" : 2
        },
        {
     
          "key" : "黑切",
          "doc_count" : 2
        }
      ]

3 having，聚合完，再过滤

统计使用量>=2的装备

GET /pigg/_search
{
     
    "size": 0,
    "aggs":{
     
        "terms_by_weapon":{
     
            "terms":{
     
                "field":"weapon.keyword",
                "size":10
            },
            "aggs":{
     
                "having":{
     
                    "bucket_selector":{
     
                        "buckets_path":{
     
                            "weaponCount":"_count"
                        },
                        "script":{
     
                            "lang":"expression",
                            "inline":"weaponCount >= 2"
                        }
                    }
                }
            }
        }
    }
}

返回结果如下：

      "buckets" : [
        {
     
          "key" : "冰痕之握",
          "doc_count" : 2
        },
        {
     
          "key" : "黑切",
          "doc_count" : 2
        }
      ]

4 先过滤后，再聚合

先限定age<=90,然后按照sex分组，再求各性别的平均age

GET /pigg/_search
{
     
  "size": 5,
  "query": {
     
    "bool": {
     
      "filter": {
     
        "range": {
     
          "age": {
     
            "lte": 90
          }
        }
      }
    }
  }, 
  "_source": ["name","sex","age"],
  "aggs": {
     
    "terms_by_sex": {
     
      "terms": {
     
        "field": "sex.keyword",
        "size": 10
      },
      "aggs":{
     
        "avg_age":{
     
          "avg": {
     
            "field": "age"
          }
        }
      }
    }
  }
}

7 扇子骨-collapse听说你想折叠起来

1 collapse折叠查询

GET /pigg/_search
{
     
  "query": {
     
    "range": {
     
      "age": {
     
        "gte": 10,
        "lte": 90
      }
    }
  },
  "collapse": {
     
    "field": "sex.keyword",
    "inner_hits":{
     
      "name": "old_age",
      "size": 1,
      "sort": [{
     "age": "desc"}]
    }
  },
  "sort": [
    {
     
      "age": {
     
        "order": "desc"
      }
    }
  ]
}

8 青椒肉丝-Explain服务员，解释下为啥只有青椒

1 explain

explain参数可以接受DSL的语句，_validate验证DSL是否合法。

GET /pigg/_validate/query?explain
{
     
  "query": {
     
    "terms": {
     
      "weapon.keyword": [
        "黑切",
        "宗师之力"
      ]
    }
  }
}

返回如下：

  "valid" : true,
  "explanations" : [
    {
     
      "index" : "pigg",
      "valid" : true,
      "explanation" : "weapon.keyword:(宗师之力 黑切)"
    }
  ]

9 总结一句话

上面也就算ES的一些皮毛，ES功能很多，想一次性学完不可能，只能在工作中在闲暇时间学习积累，
少玩些农药，多学习吧。

Docker快速单点部署Elasticsearch ❀͜͡傀儡师 docker elasticsearch
x86架构dockerpullregistry.cn-hangzhou.aliyuncs.com/qiluo-images/elasticsearch:8.17.4arm架构dockerpullregistry.cn-hangzhou.aliyuncs.com/qiluo-images/linux_arm64_elasticsearch:8.17.43、elasticsearch安装mkdir-p
ES 压缩包安装思静鱼 #elasticsearch elasticsearch 大数据
以下是Elasticsearch(ES)通过.tar.gz压缩包安装的详细步骤（适用于Linux/macOS系统）：1.准备工作1.1检查系统依赖Java环境：ES需要JDK，推荐OpenJDK11/17（ES7.x/8.x兼容版本）。java-version#检查是否已安装如果未安装，使用以下命令安装（以Ubuntu为例）：sudoaptupdatesudoaptinstallopenjdk-1
云原生时代的日志管理：ELK、Loki、Fluentd 如何选型？
一、引言在微服务和Kubernetes普及的今天，传统的日志管理方式已经难以应对高并发、分布式架构带来的挑战。随着容器化应用数量激增，日志数据量呈指数级增长，如何高效地收集、存储、查询和分析日志，成为每个团队必须面对的问题。在这样的背景下，ELK（Elasticsearch+Logstash+Kibana）、Loki和Fluentd成为当前主流的日志解决方案。它们各有特色，适用于不同规模和技术栈的
自动化运维工程师实操面试题
以下是针对Ansible、Zabbix、ElasticsearchLogstashKibana（ELK）设计的2道综合实操题，难度适中且结合实际应用场景：实操题1：Ansible自动化部署Zabbix监控平台并集成ELK日志分析题目背景某企业需要通过Ansible自动化部署Zabbix监控服务器（含Agent）、Elasticsearch、Logstash、Kibana（ELK）日志分析系统，并实
怎么安装自定义分词器思静鱼 #elasticsearch es
安装自定义分词器的完整步骤在Elasticsearch中安装自定义分词器，通常需要修改索引配置或开发插件。以下是详细方法：一、基于配置实现自定义分词器（无需插件）适用于通过组合Elasticsearch内置的CharacterFilters、Tokenizers和TokenFilters实现的分词器。1.定义分词规则在创建索引时，通过settings.analysis配置自定义分词器：PUT/my
【容器】优质文章分享
文章目录加速器Docker教程安装坑volumn网络配置踩坑其他dockerfiledocker-compose手册教程网络坑docker使用dockermysqldockermongoredisdocker-rabbitmqnginxtomcatnacoszookeeperelasticsearch加速器现在docker镜像站真的不好找了。阿里什么的加速目前只能给阿里自己的容器用了。且用且珍惜D
【Elasticsearch】自定义评分检索 G皮T #Elastic elasticsearch 大数据自定义评分查询检索 _score 搜索引擎
自定义评分检索1.自定义评分2.为什么需要自定义评分3.搜索结果相关度4.影响相关度评分的查询子句5.控制相关度评分的方法5.1FunctionScoreQuery5.1.1基础查询部分5.1.2评分函数部分（functions数组）第一个函数：品牌加权第二个函数：销量因子第三个函数：时间衰减5.1.3评分组合方式score_modeboost_mode5.1.4整体效果5.2使用Boosting
Elasticsearch：什么是搜索相关性？ Elastic 中国社区官方博客 Elasticsearch Elastic elasticsearch 大数据搜索引擎人工智能全文检索
搜索相关性定义搜索相关性衡量的是搜索引擎返回的搜索结果与用户查询和意图之间的匹配程度。搜索结果的质量取决于显示的信息与用户预期之间的契合度。提升搜索相关性和性能需要进行语言分析、排序算法优化以及考虑上下文因素。这些因素可能包括用户行为分析、位置信息、热门程度和搜索历史等。搜索相关性是客户体验中的关键因素，通过合理平衡，搜索体验可以同时满足企业和用户的需求。了解为什么相关性对搜索引擎至关重要，以及如
Elasticsearch MacJerry elasticsearch 大数据搜索引擎
学习目标[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BGW4RqWM-1635414988340)(es.assets/Snipaste_2020-07-06_13-03-45.png)]Elasticsearch简介与安装什么是Elasticsearch？ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基
C#.NET NLog 详解 c#.net
简介NLog是.NET平台上最流行的开源日志框架之一，特色是灵活的配置、丰富的输出目标（Target），以及高性能的异步写入能力。适用场景：从控制台、文件、数据库、网络到ElasticSearch、Seq、AzureTableStorage等各种日志收集后端。支持文件、数据库（SQL/NoSQL）、控制台、邮件、Elasticsearch等50+内置目标，并可通过插件扩展原生兼容JSON格式，可输
Elasticsearch 启动失败？从日志分析到最终解决（磁盘空间不足案例） Leaton Lee elasticsearch 大数据搜索引擎
问题背景最近在本地运行一个SpringBoot项目时，突然遇到Elasticsearch(ES)连接超时的问题：org.springframework.beans.factory.UnsatisfiedDependencyException:Errorcreatingbeanwithname'awardController':Unsatisfieddependencyexpressedthroug
Elasticsearch：基本概念、索引结构与优缺点分析 Leaton Lee elasticsearch 大数据搜索引擎
一、Elasticsearch基本概念Elasticsearch是一个基于Lucene构建的开源、分布式、RESTful搜索引擎，专为云计算环境设计，能够实现近乎实时的数据搜索和分析功能。核心概念解析文档(Document)Elasticsearch中的基本数据单元，使用JSON格式表示每个文档有唯一ID和类型示例：一条产品信息、一篇博客文章或一个客户记录索引(Index)文档的集合，类似于关系数
Elasticsearch 查询统计 A 字段全部为空的 B 字段（qbit）
前言本文对Elasticsearch7.17适用问题是有两个字符串字段app_id和owner，怎么查询app_id全部为空字符串的owner有哪些？查询DSL语句{"size":0,"aggs":{"owners":{"terms":{"field":"owner",//取决于owner字段的基数"size":10000},"aggs":{"non_empty_app_id_docs":{"fi
【123揭秘】Elasticsearch内部数据结构大起底：行存、列存与倒排索引，你选对了吗？墨瑾轩 Java乐园 elasticsearch 数据结构 jenkins
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第一部分：理解基本概念——构建知识的基础首先，我们需要了解一些基础概念，这对于理解Elasticsearch如何处理和存储数据至关重要。1.1行存储vs列存储行存储：适用于频繁写入和读取整行数据的场景。例如，在关系型数据库中，每一行代表一条记录，所有列的数据都
ElasticSearch中的分片是什么? java1234_小锋 java elasticsearch 大数据搜索引擎
大家好，我是锋哥。今天分享关于【ElasticSearch中的分片是什么?】面试题。希望对大家有帮助；ElasticSearch中的分片是什么?超硬核AI学习资料，现在永久免费了！在Elasticsearch中，分片（Shard）是将数据拆分成更小的部分，允许在分布式环境中并行处理和存储数据的机制。它是Elasticsearch在水平扩展时用于管理大量数据的关键概念。主要概念：主分片（Primar
spring-ai-alibaba 1.0.0.2 学习（十二）——聊天记忆扩展包
学习spring-ai时提到过，spring-ai除了内置的InMemoryChatMemoryRepository，还提供jdbc、cassandra、neo4j三个扩展包。而spring-ai-alibaba则提供了jdbc、redis、elasticsearch三个扩展包。两者都提供了jdbc扩展包，有什么区别呢？spring-aijdbc和spring-ai-alibabajdbc对比sp
基于Elasticsearch的短视频平台个性化推荐系统设计与实现亲爱的非洲野猪 elasticsearch 音视频推荐算法
在当今内容爆炸的时代，个性化推荐系统已成为短视频平台的核心竞争力之一。本文将详细介绍如何利用Elasticsearch（ES）构建一个高效、可扩展的短视频个性化推荐系统。一、系统架构概述我们的推荐系统将采用混合推荐策略，结合协同过滤、内容相似度和热度推荐等多种方法。Elasticsearch作为核心搜索引擎和数据存储，将承担以下职责：用户画像存储与查询视频内容索引与检索实时行为日志分析推荐结果计算
Docker三分钟部署ElasticSearch平替MeiliSearch轻量级搜索引擎
‍个人主页：阿木木AEcru(更多精彩内容可进入主页观看)系列专栏：《Docker容器化部署系列》《Java每日面筋》每一次技术突破，都是对自我能力的挑战和超越。目录一、什么是MeiliSearch？二、对比ElasticSearch有什么好处？三、使用场景有哪些？四、docker部署MeiliSearch4.1创建数据持久化文件夹4.2拉取镜像4.3运行容器五、访问测试5.1访问5.2下载测试文
meilisearch-轻量级搜索引擎 Leon.ENV 大数据搜索引擎
meilisearch是一款开源的轻量级搜索引擎，相比于elasticsearch等重量级搜索引擎，meilisearch注重数据搜索，从而而省去了其它不必要的功能（如支持聚合分析、分布式搜索等特性），以便于快速上手开发和构建应用。meilisearch有以下优点1）非常轻量级，只需500MB内存就可以运行2）支持多种接入方式：http、多种语言SDK3）无其它依赖环境，下载启动即可使用4）非常适
亿级电商搜索引擎基石：Elasticsearch分片、副本与性能调优实战 lingRJ777 Java技术栈应用 java backend elasticsearch springboot microservices searchengine
亿级电商搜索引擎基石：Elasticsearch分片、副本与性能调优实战引言每年的“双十一”大促，海量用户涌入电商平台，搜索请求量瞬时可达平时的数十甚至上百倍。同时，数百万商品的库存、价格、促销信息也在以极高的频率更新。这种“读写混合”的超高并发场景，对商品搜索引擎提出了两大核心挑战：高可用与可扩展性：如何在流量洪峰下保证搜索服务7x24小时不间断，并且能够随着业务增长而平滑扩容？极致的查询性能：
【ES】--Elasticsearch的高亮模式
目录一、高亮策略1、FastVectorHighlighter（快速向量高亮器）2、PostingHighlighter（帖子高亮器）3、UnifiedHighlighter（统一高亮器）4、PlainHighlighter（普通高亮器）5、总结二、高亮参数三、高亮案例解析1、words_one配置解析2、words_two配置解析3、words_three配置解析4、words_four配置解析
Elasticsearch检索高亮不正确，不精确问题
问题场景：搜索“a”高亮"A8A",,,,,分词器：IK分词器确认分词结果：下图说明已经正确分词！确认高亮效果：换一种高亮器查询效果：对应java代码：总结：当高亮显示不精确的时候，要从以下两方面找问题：1.分词器是否分词准确2.高亮器是否满足你的要求，不满足换一种高亮器查看效果我之前原默认的高亮器（plain）不能满足要求，后来使用unified高亮器解决了高亮不精确的问题。
【Elasticsearch】深度分页及其替代方案 G皮T #Elastic elasticsearch 大数据搜索引擎深度分页 search_after scroll 检索
深度分页及其替代方案1.深度分页2.为什么不推荐深度分页2.1性能问题（核心原因）2.2资源消耗对比2.3实际限制3.深度分页的替代方案3.1方案一：SearchAfter（推荐）3.1.1为什么SearchAfter性能更高3.1.2技术原理简化3.1.3关键区别3.1.4适用场景3.2方案二：ScrollAPI（适用于大批量导出）3.2.1详细解释3.2.2类比理解3.2.3注意事项3.3方案
docker安装单机nacos、rocketmq、reids、xxl-job、minio、elasticsearch、kibana、gogs、nginx、mongo 丶会武术的流氓丶 docker rocketmq redis elasticsearch
目录在右侧中部启动容器报错直接删除那个name后边的就可以安装nacos首先需要拉取对应的镜像文件：dockerpullnacos/nacos-server挂载目录：mkdir-p/mydata/nacos/logs/#新建logs目录mkdir-p/mydata/nacos/init.d/vim/mydata/nacos/init.d/custom.properties#修改配置文件修改cust
50个Java+SpringBoot+Vue毕业设计选题（含技术栈+核心功能） 21光年 java spring boot vue.js 毕业设计毕设
适合人群：计算机专业毕业设计/实战项目/求职作品技术亮点：前后端分离、主流技术栈、多领域覆盖一、电商与交易类智能推荐电商平台技术栈：SpringBoot+Vue+Redis+Elasticsearch核心功能：协同过滤推荐算法、秒杀系统、物流跟踪二手商品交易平台技术栈：SpringBoot+Vue+OSS存储核心功能：多维度检索、信用评分、实名认证社区团购管理系统技术栈：SpringBoot+Vu
canal实现Mysql数据同步 BUG指挥官 MySQL数据库相关讲解 mysql 数据库
在当今互联网行业尤其是现在分布式、微服务开发环境下，为了提高搜索效率，以及搜索的精准度，会大量使用Redis、Memcached等NoSQL数据库，也会使用大量的Solr、Elasticsearch等全文检索服务和搜索引擎。那么，这个时候，就会有一个问题需要我们来思考和解决：那就是数据同步的问题！如何将实时变化的数据库中的数据同步到Redis/Memcached或者Solr/Elasticsear
springCloud集成elasticsearch 月光一族吖 spring cloud elasticsearch spring
Elasticsearch是一个分布式、RESTful风格的搜索和数据分析引擎，同时是可扩展的数据存储和矢量数据库，能够应对日益增多的各种用例。作为ElasticStack的核心，Elasticsearch能够集中存储您的数据，实现闪电般的搜索速度、精细的相关性调整以及强大的分析能力，并且能够轻松地进行规模扩展。废话少说，开干一、docker部署ES1、创建网络，让ES与Kibana容器互联doc
docker安装Elasticsearch Uluoyu docker elasticsearch
1.安装版本Elasticsearch（8.18.3）kibana（8.18.3）ik分词器（8.18.3）2.创建网络，让ES与Kibana容器互联dockernetworkcreatees-net3.加载镜像dockerpulldocker.elastic.co/elasticsearch/elasticsearch:8.18.3sudodockerpulldocker.elastic.co/
windows安装ELK
ELK是什么？ELK是Elasticsearch、Logstash和Kibana三款开源软件的组合，主要用于日志收集、存储、分析和可视化。三款软件版本必须保持一致三款软件下载地址通过网盘分享的文件：elasticsearch-9.0.3-windows-x86_64.zip等3个文件链接:https://pan.baidu.com/s/16Y7T6TYIZZ4uAou4ZeoQ4w?pwd=e8x
解决 Spring Boot 对 Elasticsearch 字段没有小驼峰映射的问题大只鹅 spring boot elasticsearch 后端
场景重现在使用MyBatis/Mybatis-Plus框架对MySQL操作时习惯了字段名小驼峰映射，然而在操作Elasticsearch时发现字段名没有小驼峰映射。解决方法1.使用`ObjectMapper`手动转换：这是最直接也最常用的方法。在SpringBoot应用中使用`ObjectMapper`将从Elasticsearch获取的数据进行转换，将下划线命名转换为小驼峰命名。importco
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

Elasticsearch笔记(十一) ES term terms prefix 搜索 聚合查询 详细总结

ES term terms prefix 搜索 聚合查询 详细总结

1 前提

2 准备数据

3 凉菜–这个都不会？一首凉凉送给你

1 term

2 terms

3 prefix

4 wildcard

5 range

6 exists

4 油焖大虾–把condition组合起来一锅焖

1 bool

2 must

3 must_not

4 should

5 filter

5 阿凡提羊肉串–给查询加点料

1 过滤字段 _source

2 排序 sort

3 分页查询 from+size

6 肉末茄子–Aggs服务员，你过来统计下肉末

1 count

2 terms聚合

3 having，聚合完，再过滤

4 先过滤后，再聚合

7 扇子骨-collapse听说你想折叠起来

1 collapse折叠查询

8 青椒肉丝-Explain服务员，解释下为啥只有青椒

1 explain

9 总结一句话

你可能感兴趣的:(Elasticsearch,elasticsearch)

Elasticsearch笔记(十一) ES term terms prefix 搜索聚合查询详细总结

ES term terms prefix 搜索聚合查询详细总结