全端工程师

掌握 ElasticSearch 精准查询：Term Query 与 Filter 详解

- 一、引言 (Introduction)
- 二、准备工作：创建索引和添加示例数据
- 三、Term Query：精准匹配
- - 3.1 `term` 查询：单个值的精准匹配
  - 3.2 `terms` 查询：多个值的精准匹配
  - 3.3 `term` vs. `match_phrase`
- 四、Filter：高效过滤
- - 4.1 什么是 Filter？
  - 4.2 Query vs. Filter
- 5. 结合使用 Term 和 Filter
- 六、总结 (Conclusion)

一、引言 (Introduction)

在信息检索的世界里，我们常常面临两种不同但又互补的需求：

全文检索 (Full-text Search): 就像你在 Google 或百度中输入一个关键词，搜索引擎会返回一系列相关的网页。这种搜索方式关注的是文档与查询之间的 相关性，它会考虑词频、词的位置等因素，对结果进行排序。Elasticsearch 中的 match 查询（如上一篇博客所述）就是典型的全文检索方式。
精准查询 (Exact Value Search): 想象一下，你正在一个电商网站上浏览商品，你只想看 “在售” 状态的商品，或者只想找 ID 为 “12345” 的特定商品。这种情况下，你关心的不是商品与查询的 相关程度，而是商品是否 完全符合 你的要求。这就是精准查询的用武之地。

Elasticsearch 作为一款强大的搜索引擎，不仅擅长全文检索，也提供了强大的精准查询功能。在本文中，我们将深入探讨两种核心的精准查询方式：Term Query 和 Filter。

Term Query: 用于查找某个字段的值与查询值 完全相等 的文档。它不会对查询值进行分词，而是直接进行精确匹配。
Filter: 用于筛选符合特定条件的文档，但 不计算相关性得分。它只关心文档是否匹配条件，不关心匹配程度，因此通常比计算得分的查询（如 match）更高效。

通过本文，你将掌握 Term Query 和 Filter 的基本概念、用法、区别以及它们在实际应用中的价值。

二、准备工作：创建索引和添加示例数据

在开始学习查询之前，我们需要先创建一个索引并添加一些示例数据。请确保你已经安装并启动了 Elasticsearch 7.10。推荐使用 Kibana 的 Dev Tools 来执行以下操作。

创建索引 products:

我们创建一个名为 products 的索引，其中包含以下字段：

product_id (keyword): 产品ID，不分词。
status (keyword): 产品状态（如 “in_stock”, “out_of_stock”, “discontinued”），不分词。
category (keyword): 产品类别（如 “electronics”, “clothing”, “books”），不分词。
price (double): 产品价格。
in_stock (boolean): 是否有库存。
launch_date (date): 产品发布日期。

PUT products
{
  "mappings": {
    "properties": {
      "product_id": {
        "type": "keyword"
      },
      "status": {
        "type": "keyword"
      },
      "category": {
        "type": "keyword"
      },
      "price": {
        "type": "double"
      },
      "in_stock": {
        "type": "boolean"
      },
      "launch_date": {
        "type": "date"
      }
    }
  }
}

添加示例数据:

我们使用 _bulk API 批量添加一些产品数据：

POST products/_bulk
{"index":{"_index": "products"}}
{"product_id": "12345", "status": "in_stock", "category": "electronics", "price": 299.99, "in_stock": true, "launch_date": "2023-01-15"}
{"index":{"_index": "products"}}
{"product_id": "67890", "status": "out_of_stock", "category": "clothing", "price": 49.99, "in_stock": false, "launch_date": "2023-03-10"}
{"index":{"_index": "products"}}
{"product_id": "13579", "status": "in_stock", "category": "books", "price": 19.99, "in_stock": true, "launch_date": "2023-05-20"}
{"index":{"_index": "products"}}
{"product_id": "24680", "status": "discontinued", "category": "electronics", "price": 199.99, "in_stock": false, "launch_date": "2022-11-01"}
{"index":{"_index": "products"}}
{"product_id": "11223", "status": "in_stock", "category": "electronics", "price": 599.99, "in_stock": true, "launch_date": "2023-08-01"}
{"index":{"_index": "products"}}
{"product_id": "33445", "status": "in_stock", "category": "clothing", "price": 79.99, "in_stock": true, "launch_date": "2023-07-15"}

三、Term Query：精准匹配

3.1 `term` 查询：单个值的精准匹配

基本概念： term 查询是 Elasticsearch 中最基本的精准查询方式。它用于查找指定字段的值与查询值 完全相等 的文档。需要特别注意的是，term 查询不会对查询值进行分词，而是直接将其作为一个整体进行匹配。

语法：

GET index/_search
{
  "query": {
    "term": {
      "field_name": {
        "value": "your_exact_value"
      }
    }
  }
}

参数说明：

field_name: 要搜索的字段名。
value: 要匹配的精确值。

示例：

查找 product_id 为 “12345” 的产品：

GET products/_search
{
  "query": {
    "term": {
      "product_id": {
        "value": "12345"
      }
    }
  }
}

结果解释： 根据我们添加的数据，这个查询将返回 product_id 为 “12345” 的那一条文档。

查找 status 为 “in_stock” 的产品：

GET products/_search
{
  "query": {
    "term": {
      "status": {
        "value": "in_stock"
      }
    }
  }
}

结果解释： 这个查询将返回所有 status 字段值为 “in_stock” 的产品文档。

Code 运行结果

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 4,
      "relation" : "eq"
    },
    "max_score" : 0.44183272,
    "hits" : [
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "PjDrMJUBaTLipzfiYli6",
        "_score" : 0.44183272,
        "_source" : {
          "product_id" : "12345",
          "status" : "in_stock",
          "category" : "electronics",
          "price" : 299.99,
          "in_stock" : true,
          "launch_date" : "2023-01-15"
        }
      },
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "QDDrMJUBaTLipzfiYli6",
        "_score" : 0.44183272,
        "_source" : {
          "product_id" : "13579",
          "status" : "in_stock",
          "category" : "books",
          "price" : 19.99,
          "in_stock" : true,
          "launch_date" : "2023-05-20"
        }
      },
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "QjDrMJUBaTLipzfiYli6",
        "_score" : 0.44183272,
        "_source" : {
          "product_id" : "11223",
          "status" : "in_stock",
          "category" : "electronics",
          "price" : 599.99,
          "in_stock" : true,
          "launch_date" : "2023-08-01"
        }
      },
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "QzDrMJUBaTLipzfiYli6",
        "_score" : 0.44183272,
        "_source" : {
          "product_id" : "33445",
          "status" : "in_stock",
          "category" : "clothing",
          "price" : 79.99,
          "in_stock" : true,
          "launch_date" : "2023-07-15"
        }
      }
    ]
  }
}

重要提示：

term 查询对 keyword 类型的字段效果最好，因为 keyword 字段不会被分词。
如果你对一个 text 类型的字段使用 term 查询，很可能得不到你想要的结果。因为 text 字段在索引时会被分词，而 term 查询不会对查询值分词。

3.2 `terms` 查询：多个值的精准匹配

基本概念：

terms 查询是 term 查询的扩展，它允许你指定一个值的列表，只要文档的指定字段与列表中的 任意一个 值完全匹配，该文档就会被返回。这相当于 SQL 中的 IN 操作符。

语法：

GET index/_search
{
  "query": {
    "terms": {
      "field_name": ["value1", "value2", "value3"]
    }
  }
}

field_name: 要搜索的字段名。
[]: 一个包含多个值的数组，表示要匹配的多个精确值。

示例：

查找 category 为 “electronics” 或 “appliances” 的产品：
```
GET products/_search
{
  "query": {
    "terms": {
      "category": ["electronics", "clothing"]
    }
  }
}
```
结果解释： 这个查询将返回所有 category 字段值为 “electronics” 或 “clothing” 的产品文档。根据我们的示例数据：
- product_id 为 “12345”、“24680” 和 “11223” 的产品 (category 为 “electronics”)
- product_id 为 “67890” 和 “33445” 的产品 (category 为 “clothing”)
都会被返回。

Code 运行结果

{
 ...
  "hits" : {
    "total" : {
      "value" : 5,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "9WhxJpUBFTEr5wdT-FfA",
        "_score" : 1.0,
        "_source" : {
          "product_id" : "12345",
          "status" : "in_stock",
          "category" : "electronics",
          "price" : 299.99,
          "in_stock" : true,
          "launch_date" : "2023-01-15"
        }
      },
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "-GhxJpUBFTEr5wdT-FfA",
        "_score" : 1.0,
        "_source" : {
          "product_id" : "11223",
          "status" : "in_stock",
          "category" : "electronics",
          "price" : 599.99,
          "in_stock" : true,
          "launch_date" : "2023-08-01"
        }
      },
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "9mhxJpUBFTEr5wdT-FfA",
        "_score" : 1.0,
        "_source" : {
          "product_id" : "67890",
          "status" : "out_of_stock",
          "category" : "clothing",
          "price" : 49.99,
          "in_stock" : false,
          "launch_date" : "2023-03-10"
        }
      },
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "-WhxJpUBFTEr5wdT-FfA",
        "_score" : 1.0,
        "_source" : {
          "product_id" : "24680",
          "status" : "discontinued",
          "category" : "electronics",
          "price" : 199.99,
          "in_stock" : false,
          "launch_date" : "2022-11-01"
        }
      },
      {
        "_index" : "products",
        "_type" : "_doc",
        "_id" : "-mhxJpUBFTEr5wdT-FfA",
        "_score" : 1.0,
        "_source" : {
          "product_id" : "33445",
          "status" : "in_stock",
          "category" : "clothing",
          "price" : 79.99,
          "in_stock" : true,
          "launch_date" : "2023-07-15"
        }
      }
    ]
  }
}

3.3 `term` vs. `match_phrase`

为了更好地理解 term 查询的特性，我们将其与上一篇博客中介绍的 match_phrase 查询进行对比：

特性	`term` 查询	`match_phrase` 查询
查询类型	精准查询	全文检索
分词	不对查询值分词	对查询值分词
匹配要求	字段值与查询值完全相等	所有查询词项都必须出现，顺序和邻近度（默认情况下）必须与查询字符串完全一致。可以通过`slop`参数调整
适用场景	查找与特定值完全匹配的文档（如 ID、状态码）	查找包含特定短语的文档，且对短语中词项的顺序和邻近度有要求

假设我们有一个索引 my_index，其中有一个 description 字段，类型为 text。我们向该索引添加一个文档，其 description 值为 “The quick brown fox jumps over the lazy dog”。

准备数据：

PUT my_index
{
“mappings”: {
“properties”: {
“description”: {
“type”: “text”
}
}
}
}

POST my_index/_doc
{
“description”: “The quick brown fox jumps over the lazy dog”
}
```

使用 term 查询：

示例 1：查询 “quick brown”
```
GET my_index/_search
{
  "query": {
    "term": {
      "description": {
        "value": "quick brown"
      }
    }
  }
}
```
结果： 这个查询很不会返回任何结果(默认分词器下)。因为 term 查询不会对 “quick brown” 进行分词，而 description 字段在索引时已经被分词为 “the”, “quick”, “brown”, “fox”, “jumps”, “over”, “the”, “lazy”, “dog” 等词项。没有一个词项与 “quick brown” 完全相等。
示例 2：查询 “quick”
```
GET my_index/_search
{
  "query": {
    "term": {
      "description": {
        "value": "quick"
      }
    }
  }
}
```
结果： 这个查询会返回包含 “quick” 作为分词结果的文档。因为 “quick” 是 description 字段分词后的一个词项。

使用 match_phrase 查询：

示例 1：查询 “quick brown”

JSON
```
GET my_index/_search
{
  "query": {
    "match_phrase": {
      "description": "quick brown"
    }
  }
}
```
结果： 这个查询会返回包含 “quick brown” 这个短语的文档。因为 match_phrase 查询会对 “quick brown” 分词，然后要求这两个词项按顺序相邻出现。
示例 2：查询 “brown fox jumps”
```
GET my_index/_search
{
  "query": {
    "match_phrase": {
      "description": "brown fox jumps"
    }
  }
}
```
结果： 这个查询也会返回文档，因为 “brown”, “fox”, “jumps” 三个词项按照顺序相邻出现。
term 查询适用于 keyword 类型字段的精确匹配。
对于 text 类型字段，term 查询匹配的是分词后的单个词项，而不是整个字段值。
match_phrase 查询适用于 text 类型字段的短语匹配，要求词项顺序和邻近度。

四、Filter：高效过滤

4.1 什么是 Filter？

基本概念：

Filter（过滤器）是 Elasticsearch 中一种特殊的查询方式，它用于筛选符合特定条件的文档，但 不计算相关性得分（_score）。
Filter 的核心思想是 结果导向，它只关心文档是否匹配过滤条件，而不关心文档与查询的 相关程度。
由于不计算得分，Filter 通常比计算得分的查询（如 match）更高效。此外，Elasticsearch 会自动缓存 Filter 的结果，进一步提高查询性能。

语法：

Filter 通常与 constant_score 查询结合使用。constant_score 查询会将 Filter 包装起来，并为所有匹配的文档赋予一个固定的得分（默认为 1.0）。

GET _search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": { 
          "status": "in_stock"
        }
      }
    }
  }
}

参数说明：

constant_score: 将 filter 查询包装成为一个不计算分数的查询。
filter: 包含具体的过滤条件。在 filter 内部，你可以使用各种查询，如 term、terms、range、exists、bool 等，就像在普通的 query 中一样。

示例：

使用 term Filter 筛选 status 为 “in_stock” 的产品：
```
GET products/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": {
          "status": "in_stock"
        }
      }
    }
  }
}
```
结果解释： 这个查询将返回所有 status 为 “in_stock” 的产品，但所有返回文档的 _score 都将是 1.0（或你在 constant_score 中指定的其他值）。

使用 range Filter 筛选 price 在 100 到 300 之间的产品：

GET products/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "range": {
          "price": {
            "gte": 100,
            "lte": 300
          }
        }
      }
    }
  }
}

使用 terms Filter 筛选 category 为 “electronics” 或 “clothing” 的产品：

GET products/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "terms": {
          "category": ["electronics", "clothing"]
        }
      }
    }
  }
}

4.2 Query vs. Filter

为了更好地理解 Filter 的作用和优势，我们将它与 Query 进行对比：

特性	Query	Filter
核心思想	过程导向：关心文档与查询的相关程度，计算相关性得分（`_score`）。	结果导向：只关心文档是否匹配过滤条件，不计算得分。
性能	通常较慢，因为需要计算得分。	通常较快，因为不计算得分，且结果可以被缓存。
缓存	默认情况下不缓存结果。	自动缓存结果，提高查询效率。
使用场景	当你需要根据相关性得分对文档进行排序时。	当你只关心文档是否匹配，不关心匹配程度，且过滤条件不影响文档的排序时。
	当你需要执行全文检索，且查询条件会影响文档的排序时（例如，使用 `match` 查询搜索包含特定关键词的文档）。	当你需要对结果进行过滤，且过滤条件不影响文档的排序时（例如，筛选特定状态、类别或范围的文档）。

何时使用 Filter？

当你只关心文档是否匹配过滤条件，而 不关心 匹配程度（相关性得分）时。
当你需要对结果进行过滤，并且过滤条件 不影响 文档的排序时。
当你需要 提高查询性能 时，特别是对于经常使用的过滤条件，Filter 的缓存机制可以带来显著的性能提升。

何时使用 Query？

当你需要根据 相关性得分 对文档进行排序时。
当你需要执行 全文检索，并且查询条件 会影响 文档的排序时（例如，使用 match 查询搜索包含特定关键词的文档）。

在实际应用中，Query 和 Filter 经常 结合使用。例如，你可以使用 Query 来查找与关键词相关的文档，然后使用 Filter 来过滤出符合特定条件的文档。

5. 结合使用 Term 和 Filter

在实际应用中，我们经常需要将 Term 查询与其他查询或过滤器结合起来，以构建更复杂的查询逻辑。Filter 尤其适合与 Term 查询结合，因为它们都关注精确匹配，并且 Filter 可以提高查询效率。

示例：

假设我们需要找到 products 索引中所有类别为 “electronics” 且价格在 200 到 600 之间的在售产品。我们可以结合使用 term、range 和 bool 查询，并将 range 查询放在 filter 子句中：

GET products/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "category": "electronics"
          }
        },
        {
          "term": {
            "status": "in_stock"
          }
        }
      ],
      "filter": [
        {
          "range": {
            "price": {
              "gte": 200,
              "lte": 600
            }
          }
        }
      ]
    }
  }
}

结果解释：

bool 查询：用于组合多个查询子句。我们将在下一节详细学习 bool 查询。
- must 子句：表示必须匹配的条件。这里我们使用了两个 term 查询，要求 category 为 “electronics” 且 status 为 “in_stock”。
- filter 子句：表示过滤条件，不影响评分。这里我们使用了一个 range 查询，要求 price 在 200 到 600 之间。
由于 range 查询位于 filter 子句中，它不会影响文档的得分，只起到过滤作用。
最终返回的结果是同时满足 must 和 filter 条件的文档。

关于 bool 查询的进一步说明：

在上面的示例中，我们使用了 bool 查询来组合 Query 和 Filter。bool 查询提供了一种灵活的方式来组合多个查询子句：

must： 类似于“与” (AND) 关系，要求所有子句都必须匹配。子句可以是 Query 或 Filter。
filter： 用于放置 Filter 子句，这些子句不影响评分，只进行过滤。
should： 类似于“或” (OR) 关系，至少有一个子句匹配即可。子句可以是 Query 或 Filter。
must_not： 类似于“非” (NOT) 关系，要求所有子句都不匹配。子句可以是 Query 或 Filter。

通过灵活组合 bool 查询的这四个子句，我们可以构建出非常复杂的查询逻辑，同时利用 Filter 来提高查询效率。我们将在下一章节详细介绍 bool 查询的用法和更多高级特性。

六、总结 (Conclusion)

在本文中，我们深入探讨了 ElasticSearch 7.10 中的两种核心精准查询方式：Term Query 和 Filter。

Term Query:
- 用于查找某个字段的值与查询值 完全相等 的文档。
- 不对查询值进行分词，直接进行精确匹配。
- 适用于 keyword 类型字段的精确匹配。
- terms 查询是 term 查询的扩展，允许指定多个值进行匹配。
- range查询允许进行范围查询
Filter:
- 用于筛选符合特定条件的文档，但 不计算相关性得分。
- 结果导向，只关心文档是否匹配，不关心匹配程度。
- 通常比计算得分的查询更高效，且结果可以被缓存。
- 常与 constant_score 查询结合使用。

全文检索 vs. 精准查询：

特性	全文检索 (如 `match`)	精准查询 (如 `term`, Filter)
关注点	文档与查询的相关性	文档是否完全符合条件
分词	对查询值进行分词	不对查询值分词 (Term Query)
得分	计算相关性得分 (`_score`)	不计算得分 (Filter) 或固定得分 (constant_score)
适用场景	查找与关键词相关的文档	查找与特定值完全匹配的文档，或进行数据过滤
性能	相对较低，因为需要计算得分	相对较高，因为不计算得分，且 Filter 可缓存

最佳实践：

对于精确匹配的场景，优先使用 Term Query 和 Filter。
对于不需要相关性得分的过滤，使用 Filter。
结合使用 Query 和 Filter，构建复杂的查询逻辑（可以使用 bool 查询，我们将在下一章节详细介绍）。
充分利用 Filter 的缓存机制，提高查询效率。

希望通过本文，你已经对 Elasticsearch 中的 Term Query 和 Filter 有了深入的理解。在下一章节中，我们将深入探讨 bool 查询，学习如何构建更复杂的查询组合。

你可能感兴趣的:(elasticsearch,elasticsearch,大数据,搜索引擎)

数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
Elasticsearch混合搜索深度解析（下）：执行机制与完整流程 GeminiJM ES学习笔记 elasticsearch jenkins 大数据
引言在上篇中，我们发现了KNN结果通过SubSearch机制被保留的关键事实。本篇将继续深入分析混合搜索的执行机制，揭示完整的处理流程，并解答之前的所有疑惑。深入源码分析1.SubSearch的执行机制1.1KnnScoreDocQueryBuilder的实现KNN结果被转换为KnnScoreDocQueryBuilder，这个类负责在查询阶段重新执行KNN搜索：//server/src/main
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python爬虫：从图片或扫描文档中提取文字数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据挖掘 c++
1.引言随着大数据技术的不断进步，图像数据逐渐成为了许多行业中重要的数据源之一。图像中不仅包含了丰富的视觉信息，还可能蕴含着大量的文字数据。对于科研、企业、政府等多个领域而言，如何从图片或扫描文档中提取出有价值的文字信息是一个亟待解决的问题。在这一过程中，OCR（OpticalCharacterRecognition，光学字符识别）技术成为了解决这一问题的重要工具。在本文中，我们将探讨如何使用Py
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？架构师李肯嵌入式物联网开发进阶 c语言面试性能优化
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？我相信大部分初中级C程序员在面试的过程中，可能都被问过关于memcpy函数的问题，甚至需要手撕memcpy。本文从另一个角度带你领悟一下memcpy的面试题，你可以看看是否能接得住？文章目录1写在前面2源码实现2.1函数申明2.2简单的功能实现2.3满足大数据量拷贝的功能实现3源码测试4小小总结5更多分享1写在前面假如你遇到下面的面试
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
大数据技术之集群数据迁移
dfs.namenode.rpc-address.nameservice1.namenode30hadoop104:8020dfs.namenode.rpc-address.nameservice1.namenode37hadoop106:8020dfs.namenode.http-address.nameservice1.namenode30hadoop104:9870dfs.namenode.
如何通过YashanDB优化企业大数据处理流程数据库
在当今数据驱动的商业环境中，企业面临着巨大的数据处理挑战。性能瓶颈、数据一致性问题和可扩展性需求使得大数据处理成为一项复杂任务。作为一种新兴的数据库管理系统，YashanDB以其独特的架构设计和强大的数据处理能力，在解决这些挑战方面提供了有效的手段。本文旨在探讨如何利用YashanDB优化大数据处理流程，为企业提供高效、可靠的解决方案。YashanDB的体系架构与部署形态YashanDB支持多种部
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
如何通过YashanDB提升客户体验数据库
如何优化查询速度？这是许多企业在使用数据库技术时常常会遇到的问题。查询速度的快慢直接影响到用户的体验，尤其是在大数据量和高并发的使用场景中。顾客期望迅速获取信息，若响应时间过长，可能导致客户流失。因此，优化数据库的性能成为提升客户体验的关键举措之一。YashanDB作为一种高性能的数据库技术架构，提供了多种优化机制，以提升系统的查询速度和整体处理能力。多种部署架构YashanDB支持多种部署架构，
如何通过YashanDB数据库实现企业级数据分区管理？数据库
在当今大数据时代，企业面临着海量数据的管理和优化访问的问题。如何有效地组织和划分庞大的数据集，以提升查询性能和运维效率，成为数据库系统设计的核心挑战。数据分区技术作为解决大规模数据处理的关键手段，能够显著减少无关数据的访问，优化资源利用率。本文聚焦于YashanDB数据库，详细解析其数据分区管理的实现机制及应用，为企业级应用提供高效、灵活的数据分区解决方案。YashanDB中的数据分区基础Yash
国产开源高性能对象存储RustFS保姆级上手指南光爷不秃对象存储 rust 国产开源软件 rust 云计算开源软件 github 开源数据仓库 database
在云计算与大数据爆发的时代，企业和开发者对存储方案的要求愈发严苛——不仅要能扛住海量数据的读写压力，还得兼顾安全性、可扩展性和兼容性。今天给大家介绍一款基于Rust语言开发的开源分布式对象存储系统——RustFS，它不仅是MinIO的国产化优秀替代方案，更是AI、大数据和云原生场景的理想之选。本文将从基础介绍到实战操作，带大家快速上手这款"优雅的存储解决方案"。一、RustFS核心特性解析Rust
通过YashanDB提升大数据处理能力的指南数据库
数据的急剧增长给数据库技术领域带来了诸多挑战，包括性能瓶颈、数据一致性问题及处理效率低下等。为了应对这些挑战，企业需采取有效的技术手段来提升大数据处理能力。YashanDB作为一款高性能的数据库产品，通过其先进的体系架构、优化的数据存储形式以及强大的并发控制能力，有效地提升了大数据环境下的处理性能。本文旨在为技术人员和决策者提供深入的技术分析和可操作的建议，通过YashanDB的功能特性来实现大数
Java多线程实战指南：从基础到高并发的核心技术解析添砖Java中 java python 开发语言 spring boot spring cloud spring
一、为什么必须掌握多线程？在单核CPU时代，多线程主要用于提高程序响应速度；在如今的多核处理器时代，多线程已成为榨干硬件性能的必备技能。无论是高并发Web服务器、实时数据处理系统，还是游戏引擎，都离不开多线程技术的支撑。典型案例：电商秒杀系统：1秒内处理10万+请求大数据处理：并行计算TB级数据金融交易系统：毫秒级订单撮合二、线程创建的四大核心方式1.继承Thread类（不推荐）classMyTh
3D 可视化技术开启污水治理全新发展阶段广州华锐视点 3d
3D可视化大屏展示技术在污水厂的应用，已然开启了污水处理的全新篇章。它不仅为污水厂解决了当下管理和展示的难题，更如同一座灯塔，照亮了未来污水处理领域的发展道路。随着科技的持续进步，3D可视化大屏展示技术必将迎来更加辉煌的发展。一方面，其与人工智能、大数据、物联网等前沿技术的融合将愈发紧密。借助人工智能算法，大屏系统将具备更强大的自主学习和分析能力，能够根据实时数据和历史经验，自动优化污水处理工艺参
UI前端大数据可视化实战策略：如何设计交互式数据探索界面？ UI前端开发工作室 ui 前端信息可视化
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“被动观看”到“主动探索”的可视化革命传统大数据可视化常陷入“图表堆砌”的困境：企业dashboard上布满折线图、饼图，却难以回答“销售额下降的核心区域是哪里”“用户流失与哪个行为强相关”等深度问题。
【HTML网页】智能健康监测——全方位健康管理专家（包含网页源代码）
智能健康监测分析系统智能健康监测分析系统是一种基于物联网、大数据、人工智能等技术的综合性健康管理解决方案。它具有以下六大核心功能：实时监测系统通过智能传感器和可穿戴设备，实时采集用户的生理数据，例如心率、血压、血氧饱和度、血糖水平和睡眠质量等，确保用户随时掌握自己的身体状况。健康数据分析利用人工智能和大数据分析技术，系统对采集到的数据进行处理和分析，提取有价值的健康信息，如心率变异性、呼吸频率等，
SkyWalking + Logstash全链路追踪系统详细实施方案 @淡定 skywalking
SkyWalking+Logstash全链路追踪系统详细实施方案一、系统架构与数据流向核心流程：数据采集：SkyWalkingAgent埋点收集调用链路数据日志增强：应用程序通过MDC注入TraceID日志收集：Logstash采集应用日志并发送至Elasticsearch数据存储：SkyWalking指标数据与日志数据分别存储可视化分析：SkyWalkingUI展示链路追踪，Kibana分析日志
自建ELK vs 云商日志服务：成本对比分析亲爱的非洲野猪 elk
在当今数据驱动的时代，日志管理已成为企业IT基础设施中不可或缺的一部分。面对日益增长的日志数据，许多团队都在纠结：是自建ELK（Elasticsearch、Logstash、Kibana）堆栈，还是直接使用云服务商提供的日志服务？本文将从成本角度对这两种方案进行详细对比分析。自建ELK方案成本分析1.硬件/基础设施成本服务器成本：至少需要3个节点（生产环境推荐）实现高可用中等规模部署：3台16核6
【spring boot】三种日志系统对比：ELK、Loki+Grafana、Docker API ladymorgana 日常工作总结 spring boot elk grafana
文章目录**方案1：使用ELK（Elasticsearch+Logstash+Kibana）****适用场景****搭建步骤****1.修改SpringBoot日志输出****2.创建DockerCompose文件****3.配置Logstash****4.启动服务****方案2：使用Loki+Grafana****适用场景****搭建步骤****1.修改SpringBoot日志驱动****2.配
Semantic text 就是那么强大，还附带一包（ BBQ ）薯片！配有可配置的分块设置和索引选项。 Elastic 中国社区官方博客 Elasticsearch AI 大数据 elasticsearch 搜索引擎全文检索人工智能 ai 图搜索
作者：来自ElasticKathleenDeRusso语义文本搜索现在可以自定义，支持可配置的分块设置和索引选项，用于自定义向量量化，使semantic_text在专业用例中更强大。Elasticsearch拥有大量新功能，帮助你为你的用例构建最佳搜索解决方案。深入查看我们的示例笔记本以了解更多信息，开始免费云试用，或者立即在本地机器上体验Elastic。随着Elasticsearch8.18和9
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

掌握 ElasticSearch 精准查询：Term Query 与 Filter 详解

掌握 ElasticSearch 精准查询：Term Query 与 Filter 详解

一、引言 (Introduction)

二、准备工作：创建索引和添加示例数据

三、Term Query：精准匹配

3.1 term 查询：单个值的精准匹配

3.2 terms 查询：多个值的精准匹配

3.3 term vs. match_phrase

四、Filter：高效过滤

4.1 什么是 Filter？

4.2 Query vs. Filter

5. 结合使用 Term 和 Filter

六、总结 (Conclusion)

你可能感兴趣的:(elasticsearch,elasticsearch,大数据,搜索引擎)

3.1 `term` 查询：单个值的精准匹配

3.2 `terms` 查询：多个值的精准匹配

3.3 `term` vs. `match_phrase`