bigbigtree911

Elasticsearch——Query DSL

概述
查询context与过滤context
- 查询上下文
- 过滤上下文
- 示例
Match All Query
- Match All Query
- Match None Query
全文检索
Full text queries
- Match Query匹配查询
  - match
  - Fuzziness
  - zero terms query
  - cutoff frequency
- match phrase
- Match Phrase Prefix Query
- multi match query
  - best_fields
  - most_fields
  - phrase和phrase_prefix
  - corss_fields
- Common Terms Query
  - 问题
  - 解决方法
多词匹配
- 多字段搜索
- dis_max分离最大化查询
- dis_breker
- 设定匹配精度
- 如何使用bool匹配How match Uses bool

概述

Elasticsearch提供基于Json的查询功能，将DSL查询看做AST树的话，包含两种子句类型：
+ Leaf query clauses：叶子节点的查询子句，主要用于检索特定字段的特定值，例如match、term、range查询。这些子句可以嵌套自己。
+ Compound query clauses：复合子句，用于组合多个叶子查询子句，形成逻辑，例如bool或者dis_max查询，或者行为修改（例如constant_score查询）
查询子句在query上下文与filter上下文表现有所区别。

查询context与过滤context

查询上下文

查询上下文中的查询子句，用于计算文档与该查询的相似程度，同时计算_score用于衡量相似度。当查询子句放入query中时，此时该查询子句就处于查询上下文中。例如：

{
    "query": {
        "match" :{
                "message": "test"
                       }
                    }
}

过滤上下文

过滤上下文中的查询子句主要解决“这个文档是否符合这个查询子句”，其结果不是相似度，结果只有“是”或者“否”。过滤想下雨主要用于过滤数据，例如
+ 年龄是否大于18岁
+ 状态是否是正常
大量使用过滤上下文时，过滤查询会被ES自动缓存，加速性能。当查询子句放入“filter”参数中时，会被置于过滤环境中，例如bool查询中的filter或者must_not、constant_score中的filter参数以及聚集中的filter，都是过滤上下文环境。具体过滤如何缓存，会单独介绍。

示例

总结：将影响文档相似度计算的查询，放入query上下文中，将其他的查询放入filter的上下文中。

1. 查询参数，表示查询上下文
2. bool查询，其中两个match查询子句（3和4），位于查询上下文中，用于计算匹配程度
5. 过滤参数，表示过滤上下文
6. 过滤上下文中的term查询，用于过滤数据
7. 过滤上下文中的range擦好像，用于过滤数据

Match All Query

最简单的查询：匹配所有文档，对每个文档打分_score为1.0，相当于关系数据库中的select * from table

curl -XGET 'localhost:9200/_search?pretty' -d'
{
    "query": {
        "match_all": {}
    }
}'

如果对于某个查询条件，希望更改其计算_score的权重，可以使用boost参数：

curl -XGET 'localhost:9200/_search?pretty' -d'
{
    "query": {
        "match_all": { "boost" : 1.2 }
    }
}'

Match None Query

与全检索相反，可以使用match_none，不匹配任何文档

curl -XGET 'localhost:9200/_search?pretty' -d'
{
    "query": {
        "match_none": {}
    }
}'

全文检索

全文搜索两个最重要的方面是：

相关（relevance）:相关是将查询到相关的文档结果进行排名的一种能力，这种相关度可以是根据TF/IDF、地理位置相似性（geolocation）、模糊相似，或者其他的一些算法得出。
分析（analysis）:将一个文本块转换为唯一的、规范化的token的过程，目的是为了（a）创建反向索引以及（b）查询反向索引。

当我们提到相关与分析的时候，我们已经身处查询上下文之中，而不是过滤。

Full text queries

高层级的全文检索，通常会对文本的整体内容进行分析查询。在检索前会使用每个字段的analyzer对查询字段进行分词。
+ 如果我们用它来查询时间（date）或整数（integer），他们会将查询字符串用分别当作时间和整数。
+ 如果查询一个准确的（未分析过的 not_analyzed）字符串字段，它会将整个查询字符串当成一个术语。
+ 但是如果要查询一个全文字段（分析过的 analyzed），它会讲查询字符串传入到一个合适的分析器，然后生成一个供查询的术语列表。
一旦查询组成了一个术语列表，它会对每个术语逐一执行低层次的查询，然后将结果合并，为每个文档生成一个最终的相关性分数。
注意：
当我们想要准确查询一个未分析过（not_analyzed）的字段之前，需要仔细想想，我们到底是想要一个查询还是一个过滤。
单术语查询通常可以用是非问题表示，所以更适合用过滤来表达，而且这样子可以有效利用过滤的缓存。
下面对全文本查询进行详细介绍：

Match Query匹配查询

match查询接受文本、数值、时间类型的数据，对其进行分析，构建查询。简单示例：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "match" : {

            "message" : "this is a test"

        }

    }

}'

其中message是字段名称，可以根据情况替换。上面的查询会先对this is a test进行分词，对每个term进行匹配并合并结果。

match

match是布尔类型的查询，通过对提供的文本进行analyze，构建一个boolean的查询。

operator：其操作符operator可以设定为and或者or，用于控制查询结构的构建。
minimum_should_match：当存在多个should可选时，可以通过minimum_should_match来设定最少匹配的should条件个数。
analyzer：可以控制文本分析器
lenient：默认为false，当设定为true时，可以忽略类型不匹配导致的异常

Fuzziness

fuziness可以开启模糊匹配功能。通过设定模糊参数，修改匹配时可以容忍的差距，该值最后在0-2之间，值越大，则计算时间越长。例如下面的例子中，名称多了一个a，通过模糊匹配也能查找出来：

参考：
https://www.elastic.co/blog/found-fuzzy-search

zero terms query

cutoff frequency

指定文档频率

match phrase

短语匹配，通过对查询字符串进行分词，并记录token的位置关系，然后对待查询的字段进行过滤查询分析。

例如：下面例子会查询包含this is a test短语，且顺序与其一致的文档。


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "match_phrase" : {

            "message" : "this is a test"

        }

    }

}'

对于查询字符串的分析器，可以手动置顶：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "match_phrase" : {

            "message" : {

                "query" : "this is a test",

                "analyzer" : "my_analyzer"

            }

        }

    }

}'

有时不希望对顺序要求过于严格，可以通过设定slop，指定可以移动查询字符串的token的次数，最终使其顺序一致。如果slop足够大，其检索与忽略顺序一致。例如

文档内容为：quick brown fox
检索字符串为：fox quick
移动步骤：
- 将quick从pos2移动到pos1
- 将fox从pos1移动到pos2
- 将fox从pos2移动到pos3

Match Phrase Prefix Query

与match_phrase类似，但最后一个token作为前缀进行匹配，其最长的匹配长度由max_expansions设定：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "match_phrase_prefix" : {

            "message" : {

                "query" : "quick brown f",

                "max_expansions" : 10

            }

        }

    }

}'

multi match query

允许对多个字段进行同时检索：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

  "query": {

    "multi_match" : {

      "query":    "this is a test", 

      "fields": [ "subject", "message" ] 

    }

  }

}'

可以对各字段分配不同权重，例如下面例子中，subject的权重是message的三倍：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

  "query": {

    "multi_match" : {

      "query" : "this is a test",

      "fields" : [ "subject^3", "message" ] 

    }

  }

}'

multi match查询包括以下几种类型：

best_fields

将每个match查询封入dis_max中，这样可以保证精确匹配得分更高


curl -XGET 'localhost:9200/_search?pretty' -d'

{

  "query": {

    "multi_match" : {

      "query":      "brown fox",

      "type":       "best_fields",

      "fields":     [ "subject", "message" ],

      "tie_breaker": 0.3

    }

  }

}'

与下面等价：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

  "query": {

    "dis_max": {

      "queries": [

        { "match": { "subject": "brown fox" }},

        { "match": { "message": "brown fox" }}

      ],

      "tie_breaker": 0.3

    }

  }

}'

tie_breaker：只有在use_dis_max参数设为true时才会使用这个参数。它指定低分数项和最高分数项之间的平衡。该参数指定了除了最高得分的子查询外，其他查询得分所占的权重。

most_fields

对每个字段都进行搜索匹配并计算，匹配文档越多，分数越高


curl -XGET 'localhost:9200/_search?pretty' -d'

{

  "query": {

    "multi_match" : {

      "query":      "quick brown fox",

      "type":       "most_fields",

      "fields":     [ "title", "title.original", "title.shingles" ]

    }

  }

}'

与下面的一致：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

  "query": {

    "bool": {

      "should": [

        { "match": { "title":          "quick brown fox" }},

        { "match": { "title.original": "quick brown fox" }},

        { "match": { "title.shingles": "quick brown fox" }}

      ]

    }

  }

}'

将所有match子句的得分相加并除以match的个数

phrase和phrase_prefix

相当于将每个match子句用match_phrase_prefix封装：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

  "query": {

    "multi_match" : {

      "query":      "quick brown f",

      "type":       "phrase_prefix",

      "fields":     [ "subject", "message" ]

    }

  }

}'

与下面语句功能一致：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

  "query": {

    "dis_max": {

      "queries": [

        { "match_phrase_prefix": { "subject": "quick brown f" }},

        { "match_phrase_prefix": { "message": "quick brown f" }}

      ]

    }

  }

}'

corss_fields

将所有字段作为一个big-fields，进行检索

Common Terms Query

问题

当查询多个字段时，每个token会使用一个term查询，但某些token十分常见，并不应该影响文档的的得分，例如the、a等词，将其作为stopword可以减少term查询个数。但直接移除这些词汇，我们会损失一些精度，比如我们无法区分 happy和not happy。

解决方法：

common terms查询会分两步进行查询

查询重要性高的文档（分布在较少的文档中），并计算score
在第一步查询结果的文档中，查询相关性低的token，并计算socre
可以通过cutoff_frequency控制频率（值大于1为绝对频率，小于1为相对频率）

下面例子中，对频率大于0.1%的token视为common term，

例如下面示例，对低频token使用and操作：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "common": {

            "body": {

                "query": "nelly the elephant as a cartoon",

                    "cutoff_frequency": 0.001,

                    "low_freq_operator": "and"

            }

        }

    }

}'

上面查询近似得等同下面的查询：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "bool": {

            "must": [

            { "term": { "body": "nelly"}},

            { "term": { "body": "elephant"}},

            { "term": { "body": "cartoon"}}

            ],

            "should": [

            { "term": { "body": "the"}},

            { "term": { "body": "as"}},

            { "term": { "body": "a"}}

            ]

        }

    }

}'

可以分别对高频和低频token进行限制：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "common": {

            "body": {

                "query": "nelly the elephant not as a cartoon",

                    "cutoff_frequency": 0.001,

                    "minimum_should_match": {

                        "low_freq" : 2,

                        "high_freq" : 3

                    }

            }

        }

    }

}'

多词匹配

其中match是一个boolean查询，会对匹配字段进行analyze，操作符默认是or，可以根据情况设定为or或and。例如为了同时匹配三个term，则设定为and：


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "match" : {

            "message" : "this is a test",

            "operator": "and"

        }

    }

}'

多字段搜索

索引测试的文档：


PUT /my_index/my_type/1
{
    "title": "Quick brown rabbits",
    "body":  "Brown rabbits are commonly seen."
}

PUT /my_index/my_type/2
{
    "title": "Keeping pets healthy",
    "body":  "My quick brown fox eats rabbits on a regular basis."
}

多字段查询：

若多个字段进行查询，默认查询按照下面规则进行排序：


{
    "query": {
        "bool": {
            "should": [
                { "match": { "title": "Brown fox" }},
                { "match": { "body":  "Brown fox" }}
            ]
        }
    }
}

它会执行 should 语句中的两个查询
将两个查询的分数相加
与总匹配语句的数目相乘
并除以总语句的数目（这里为：2）
普通的多字段查询，文档1两个字段都包含brown，所以两个match都符合，其匹配度高于文档2；

但我们发现文档2对于borwn fox的匹配度更高，如果我们想要提高最佳匹配的文档的匹配度，可以使用dis_max：

dis_max分离最大化查询


{
    "query": {
        "dis_max": {
            "queries": [
                { "match": { "title": "Quick pets" }},
                { "match": { "body":  "Quick pets" }}
            ]
        }
    }
}

dis_breker

设定匹配精度


curl -XGET 'localhost:9200/_search?pretty' -d'

{

    "query": {

        "match" : {

            "message" : "this is a test",

             "minimum_should_match": "75%"

        }

    }

}'

通常设定最小的匹配百分比，来控制匹配term的个数，例如上面的例子中有三个term，75%会被修正为66.6%，即最少匹配2个term。

但该值可以为负数，负数的意义有些特殊。

例如有4个term的匹配，当匹配度为-25%与75%，其意义是一样的，都是最少匹配三个，但处理5个term时，-25%表示至少匹配四个，而75%表示至少匹配三个term。

如何使用bool匹配（How match Uses bool）

目前为止，可能已经知道如何对多个词进行查询，我们需要做的只是要把多个语句放入bool查询中，因为默认的操作符是 or，每个 term 查询都会被当作 should 语句进行处理，所以至少有一个语句需要匹配，下面的两个查询是等价的：


{

    "match": { "title": "brown fox"}
}

与


{
  "
bool": {
    "should": [
      { "term": { "title": "brown" }},
      { "term": { "title": "fox"   }}
    ]
  }
}

如果使用 and 操作符，那么下面两个语句也是等价的：


{
    "
match": {
        "title": {
            "query":    "brown fox",
            "operator": "and"
        }
    }
}

与


{
  "
bool": {
    "must": [
      { "term": { "title": "brown" }},
      { "term": { "title": "fox"   }}
    ]
  }
}

如果按照下面这样给定参数 minimum_should_match，那么下面两个查询也是等价的：


{
    "
match": {
        "title": {
            "query":                "quick brown fox",
            "minimum_should_match": "75%"
        }
    }
}

与


{
  "
bool": {
    "should": [
      { "term": { "title": "brown" }},
      { "term": { "title": "fox"   }},
      { "term": { "title": "quick" }}
    ],
    "minimum_should_match": 2 
  }
}

当然，我们通常将这些查询以 match 查询来表示，但是如果了解match内部的工作原理，我们就能对查询过程按照我们的需要进行控制，有些时候单个match查询无法满足需求，比如我们要为一些查询条件分配更多的权重。在下一部分中，我们会介绍这个例子。

深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
vue+el-table 可输入表格使用上下键进行input框切换以对_ vue学习记录 vue.js javascript 前端
使用上下键进行完工数量这一列的切换-->//键盘触发事件show(ev,index){letnewIndex;letinputAll=document.querySelectorAll('.table_inputinput');//向上=38if(ev.keyCode==38){if(index==0){//如果是第一行,回到最后一个newIndex=inputAll.length-1}elsei
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
Vue + Express实现一个表单提交九旬大爷的梦
最近在折腾一个cms系统，用的vue+express，但是就一个表单提交就弄了好久，记录一下。环境：Node10+前端：Vue服务端：Express依赖包：vueexpressaxiosexpress-formidableelement-ui（可选）前言：axiosget请求参数是：paramsaxiospost请求参数是：dataexpressget接受参数是req.queryexpresspo
ElasticSearch查询超过10000条（1000页）时出现Result window is too large的问题王月亮17
问题当ES数据量较大，使用分页查询超过10000条（1000页）时，出现如下错误：Cannotexecutejestaction,responsecode:500,error:{"root_cause":[{"type":"query_phase_execution_exception","reason":"Resultwindowistoolarge,from+sizemustbelesstha
MySQl篇（SQL - 基本介绍）（持续更新迭代） wclass-zhengge mysql sql 数据库
目录一、简介二、SQL方言（分页查询为例）1.简介2.SQL方言大比拼2.1.Oracle2.1.1.使用ROWNUM实现分页查询2.1.2.使用ROW_NUMBER()实现分页查询2.2.MySQL2.3.PostgreSQL三、语法规范四、注释五、MySQL脚本中的标点符号一、简介1、SQL是结构化查询语言（StructureQueryLanguage），专门用来操作/访问关系型数据库的通用语
C# 开发教程-入门基础天马3798 教程系列整理 c#开发语言
1.C#简介、环境，程序结构2.C#基本语法，变量，控制局域，数据类型，类型转换3.C#数组、循环，Linq4.C#类，封装，方法5.C#枚举、字符串6.C#面相对象，继承，封装，多态7.C#特性、属性、反射、索引器8.C#委托，事件，集合，泛型9.C#匿名方法10.C#多线程更多：JQuery开发教程入门基础Vue开发基础入门教程Vue开发高级学习教程
【Python爬虫】百度百科词条内容 PokiFighting 数据处理 python 爬虫开发语言
词条内容我这里随便选取了一个链接，用的是FBI的词条importurllib.requestimporturllib.parsefromlxmlimportetreedefquery(url):headers={'user-agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/80.
MySQL 源码｜55 - 语法解析(V2)：基础查询语句（query_specification）｜V20240915 长行 MySQL源码 mysql 源码语法解析查询
目录文档：MySQL源码｜源码剖析文档目录源码位置（版本=MySQL8.0.37）：sql/sql_yacc.yy前置文档：MySQL源码｜68-语法解析(V2)：LOCKING子句（锁定读取）｜V20240909MySQL源码｜39-语法解析(V2)：ORDERBY子句｜V20240814｜V20240912（第2版）MySQL源码｜40-语法解析(V2)：GROUPBY子句｜V20240814
Spring Cloud: Hystrix请求队列线程不足 MeazZa
在SpringCloud中，Feign可以实现本地化的微服务API调用，Hystrix可以实现调用失败时的fallback处理。问题描述：在实际生产环境中使用时，我们遇到了这样一个错误："...,stacktrace:[com.netflix.hystrix.exception.HystrixRuntimeException:QueryNodeImpalaBdService#getQueryRes
Servlet容器的作用、HttpServlet的工作机制流程图烟雨国度 servlet 流程图 hive
HttpServletRequest解析过程是否GETPOST其他方法Servlet生命周期init-初始化Servletservice-处理请求destroy-销毁ServletgetMethod返回HTTP方法getRequestURI返回请求URIgetQueryString返回查询字符串getParameter返回特定参数值客户端发送HTTP请求服务器接收请求Web容器创建ServletR
MySQL内存结构 san.hang 数据库数据结构与算法
实际上MySQL内存的组成和Oracle类似，也可以分为SGA（系统全局区）和PGA（程序缓存区）。mysql>showvariableslike"%buffer%";一、SGA1.innodb_buffer_bool用来缓存Innodb表的数据、索引、插入缓冲、数据字典等信息。2.innodb_log_buffer事务在内存中的缓冲，即redlogbuffer的大小3.querycache高速查
html 删除事件,html 事件的添加和删除列蒂齐亚 html 删除事件
jQuery在jQuery1.7版本中bind()unbind(),live()die(),on()off(),delegate()下面我们给li元素添加事件bind()旧版写法:事件不能适用脚本创建的新元素live()旧版写法:适用脚本创建的新元素写法，但性能极不好on()新版写法，事件不能适用脚本创建的新元素(接收多个函数绑定)这三种方法都是基于要给添加事件的元素本身。$("ulli").bi
动态生成的html元素绑定click事件 .NET跨平台 Jquery及其组件 html jquery
第一篇博客，开启技术博客的生涯，欢迎大家批评指教（坚信妹子也可以做好程序猿）今天想说帮公司做项目的时候遇到的一个小问题，动态添加html元素以后再去事件监听出问题。在实际开发中会遇到要给动态生成的html元素绑定触发事件的情况。就是上面的一张表格要动态实现添加行，然后序列号还要随着增加，当删除的时候序列号依旧是按顺序排列。刚开始使用jQuery的on方法来解决，但是发现一个问题会出现事件绑定很多次
详解 Pandas 的 query 函数文刀小桂 Pandas pandas python 开发语言
Pandas的query()方法能够使用字符串表达式来筛选DataFrame数据的行，类似于SQL的where子句importpandasaspddf=pd.DataFrame({"A":[1,3,5,6,7],"B":[11,10,9,8,12],"C":["hello","pandas","python","java","shell"],"D":["2024-02-01","2023-12-1
prometheus中step或resolution的含义 iceman1952 prometheus
prometheus官方文档对resolution的解释真是语焉不详，只有下面寥寥几句话Queryingexamples|PrometheusSubqueryReturnthe5-minuterateofthehttp_requests_totalmetricforthepast30minutes,witharesolutionof1minute.rate(http_requests_total[
前端页面实现table可拖动改变列宽牧码人 js jQuery js 表格拖动 css colResizable
此处实现页面的table表格可以自由拖动列宽，拖动时表格内文字不换行，超出部分以...代替，实现步骤如下：1.首先引入jQuery和colResizable的js文件，colResizable支持表格拖动改变列宽，但基于jQuery，（1）colResizable可以去：http://www.bacubacu.com/colresizable/#rangeSlider下载（2）引入文件：2.编写j
mysql查询慢排查_mysql慢查询排查优化 weixin_39970855 mysql查询慢排查
即时分析：showfullpercesslist;开启慢查询日志，分析日志记录：long_query_time=1log-slow-queries=/data/3306/slow.loglog_queries_not_using_indexes分割日志发送至邮箱加explain查看语句的具体执行方式，并定位在哪些字段加上索引，查看条件字段的唯一值selectcount(distinctcolumn
一条sql是如何执行的详解听忆. 轻松拿捏【面试干货】sql 数据库
一条sql是如何执行的详解1.SQL解析（Parsing）2.查询重写（QueryRewrite）3.查询规划（QueryPlanning）4.查询执行（QueryExecution）5.结果返回示例：查询执行流程总结边走、边悟迟早会好一条SQL查询在PostgreSQL（以及大多数关系型数据库）中的执行过程可以分为多个阶段。每个阶段都对应特定的任务，从SQL解析到最终获取查询结果。以下是SQL查
C# Linq语句用法大全以及Lambda表达式一个小码码 c#linq 开发语言 .net
C#Linq语句用法大全以及Lambda表达式Linq：是一种用于数据查询和操作的语言集成查询（LanguageIntegratedQuery）技术。通过Linq，我们可以使用类似于SQL查询的方式来查询、筛选和操作各种类型的数据集合，包括数组、列表、集合、XML文档、数据库表等等。常见的有：LinqtoObjects：用于操作对象集合，例如数组、列表等。LinqtoXML：用于操作XML数据，支
【HTML】元素自定义属性设置与获取（两种方式-含data-*） Sam9029 html 前端 javascript
介绍了两种自定义属性的方式一：完全自定义二：data-*内置的自定义方式1.自定义属性名Clickme!varbtn=document.querySelector('button')console.log(btn.getAttribute('desc'))//获取属性值btn.setAttribute('tip','pleaseclickbutton')//设置属性值–2.data-*自定义属性名
gorm RecordNotFound darcyaf
gorm中,RecordNotFound()方法只能在结构体中使用，如果是slice类型，则不会报ErrRecordNotFound这个错误先前写的时候发现result.RecordNotFound()这个方法没用，然后看看源码,在callback_query.go中有以下逻辑:ifkind:=results.Kind();kind==reflect.Slice{isSlice=trueresul
Elasticsearch7.7.0 配置用户名和密码 i0208 Elasticsearch
配置用户和密码需要在配置文件中开启x-pack验证,修改config目录下面的elasticsearch.yml文件，在里面添加如下内容,并重启ES[root@localhostesuser]#vim/opt/es/elasticsearch-7.7.0/config/elasticsearch.ymlxpack.security.enabled:truexpack.license.self_ge
elasticsearch数据迁移之elasticdump 迷茫运维路 elasticsearch 中间件 elasticsearch linux 运维
系列文章目录第一章es集群搭建第二章es集群基本操作命令第三章es基于search-guard插件实现加密认证第四章es常用插件文章目录系列文章目录前言一、elasticdump是什么？二、安装elasticdump工具1.离线安装2.在线安装三、elasticdump相关参数四、使用elasticdump进行数据备份五、使用elasticdump进行数据恢复前言在企业实际生产环境中,避免不了要对
fluentd 简介，日志收集并导入BigQuery nvd11 Cloud spring Etl spring boot
日志收集的工具有很多种例如Splunk，很多大公司都在使用，但是个人使用的话并不合适，主要是需要license的…钱是1个大问题另1个常见开源的解决方案是ELK,但是搭建和学习成本高，如果只是为了日志收集并不值。对于k8s方案，还有1个开源选择，就是fluentd，本文的主题。Fluentd的简介Fluentd是一个开源的数据收集器，旨在实现日志数据的统一收集、处理和转发。它支持多种数据源和数据格
K8S - Emptydir - 取代ELK 使用fluentd 构建logging saidcar nvd11 K8S kubernetes
由于k8s的无状态service通常部署在多个POD中，实现多实例面向高并发。但是k8s本身并没有提供集中查询多个pod的日志的功能其中1个常见方案就是ELK.本文的方案是利用fluentdsidecar和emptydir把多个pod的日志导向到bigquery的table中。Emptydir的简介Kubernetes中的EmptyDir是一种用于容器之间共享临时存储的空目录卷类型。EmptyDi
关于jquery的on(“click”,function(){}),事件绑定无效微特尔普拉斯 javascript jquery
之前在做jquery时,遇到一个问题,就是我在append一个给啊标签绑定click点击事件时不起作用,jquery的版本时3.4.1,也找不到起的错误.就是没触发:$(self).find(".comment-action.cancel").off("click");//console.log("点击了取消回复的按钮!");$(self).find(".comment-action.cancel
在生产环境中部署Elasticsearch：最佳实践和故障排除技巧——聚合与搜索（三）不会编程的小孩子 elasticsearch 大数据搜索引擎
#在生产环境中部署Elasticsearch：最佳实践和故障排除技巧——聚合与搜索（三）前言文章目录前言-聚合和分析-执行聚合操作-1.使用JavaAPI执行聚合操作-2.使用CURL命令执行聚合操作-1.使用JavaAPI执行度量操作-2.使用CURL命令执行度量操作-使用缓存-调整分片大小和数量-使用搜索建议-结论-节点发现-负载均衡-故障转移-结论-访问控制-加密-身份验证-结论-RESTA
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

Elasticsearch——Query DSL

概述

查询context与过滤context

查询上下文

过滤上下文

示例

Match All Query

Match All Query

Match None Query

全文检索

Full text queries

Match Query匹配查询

match

Fuzziness

zero terms query

cutoff frequency

match phrase

Match Phrase Prefix Query

multi match query

best_fields

most_fields

phrase和phrase_prefix

corss_fields

Common Terms Query

问题

解决方法：

多词匹配

多字段搜索

dis_max分离最大化查询

dis_breker

设定匹配精度

如何使用bool匹配（How match Uses bool）

你可能感兴趣的:(Elasticsearch——Query DSL)