十八线的梦想猿

使用kibana操作ElasticSearch（详细篇）

1.简介

Kibana是一个基于Node.js的Elasticsearch索引库数据统计工具，可以利用Elasticsearch的聚合功能，生成各种图表，如柱形图，线状图，饼图等。

详细说明：
可以想象成数据库

概念	说明
索引库（indices)	indices是index的复数，代表许多的索引，可以想象成数据库一个database
类型（type）	类型是模拟mysql中的table概念，一个索引库下可以有不同类型的索引，比如商品索引，订单索引，其数据格式不同。不过这会导致索引库混乱，因此未来版本中会移除这个概念可以想象成数据库中的一个表，一个数据库中可以有很多表，一个索引库中就会有很多类型
文档（document）	存入索引库原始的数据。比如每一条商品信息，就是一个文档想成每一个表中一行一行的数据
字段（field）	文档中的属性
映射配置（mappings）	字段的数据类型、属性、是否索引、是否存储等特性

索引集（Indices，index的复数）：逻辑上的完整索引
分片（shard）：数据拆分后的各个部分，可以部署在多台服务器上
副本（replica）：每个分片的复制，保存的数据一样，类似集群

2.2.创建索引

2.2.1.语法

Elasticsearch采用Rest风格API，因此其API就是一次http请求，你可以用任何工具发起http请求
创建索引的请求格式。
由于遵循REST风格，可以很直观的想到操作名

POST 新增
GET 查询
DELETE 删除
PUT 修改

这里使用kibanna简化操作

2.3.查看索引

2.3.1 查看某一个特定索引库

GET 索引库名

2.3.2 查看所有索引库

GET *

2.4 删除索引

DELETE 索引库名

2.5.映射配置

索引有了，接下来肯定是添加数据。但是，在添加数据之前必须定义映射。

什么是映射？

映射是定义文档的过程，文档包含哪些字段，这些字段是否保存，是否索引，是否分词等

只有配置清楚，Elasticsearch才会帮我们进行索引库的创建（不一定）

2.5.1.创建映射字段

请求方式依然是PUT

PUT /索引库名/_mapping/类型名称
{
  "properties": {
    "字段名": {
      "type": "类型",
      "index": true，
      "store": true，
      "analyzer": "分词器"
    }
  }
}

类型名称：就是前面将的type的概念，类似于数据库中的不同表
字段名：任意填写，可以指定许多属性，例如：
type：类型，可以是text、long、short、date、integer、object等
index：是否索引，默认为true
store：是否存储，默认为false （会自动生成一个_source备份）
analyzer：分词器，这里的ik_max_word即使用ik分词器

发起请求：

2.5.2 查看映射关系

GET /索引库名/_mapping

2.5.3.字段属性详解

2.5.3.1.type

Elasticsearch中支持的数据类型非常丰富：

我们说几个关键的：

String类型，又分两种：
- text：可分词，不可参与聚合
- keyword：不可分词，数据会作为完整字段进行匹配，可以参与聚合
Numerical：数值类型，分两类
- 基本数据类型：long、interger、short、byte、double、float、half_float
- 浮点数的高精度类型：scaled_float
  - 需要指定一个精度因子，比如10或100。elasticsearch会把真实值乘以这个因子后存储，取出时再还原。
Date：日期类型

elasticsearch可以对日期格式化为字符串存储，但是建议我们存储为毫秒值，存储为long，节省空间。

2.5.3.2.index

index影响字段的索引情况。

true：字段会被索引，则可以用来进行搜索。默认值就是true
false：字段不会被索引，不能用来搜索

index的默认值就是true，也就是说你不进行任何配置，所有字段都会被索引。

但是有些字段是我们不希望被索引的，比如商品的图片信息，就需要手动设置index为false。

2.5.3.3.store

是否将数据进行额外存储。

在学习lucene和solr时，我们知道如果一个字段的store设置为false，那么在文档列表中就不会有这个字段的值，用户的搜索结果中不会显示出来。

但是在Elasticsearch中，即便store设置为false，也可以搜索到结果。

原因是Elasticsearch在创建文档索引时，会将文档中的原始数据备份，保存到一个叫做_source的属性中。而且我们可以通过过滤_source来选择哪些要显示，哪些不显示。

而如果设置store为true，就会在_source以外额外存储一份数据，多余，因此一般我们都会将store设置为false，事实上，store的默认值就是false。

2.5.3.4.boost

激励因子，这个与lucene中一样

2.5.4字段映射设置流程

2.6.新增数据

2.6.1. 新增会随机生成id

POST /索引库名/类型名
{
    "key":"value"
}

2.6.2. 新增时自定义id

如果我们想要自己新增的时候指定id，可以这么做：

POST /索引库名/类型/id值
{
    ...
}

2.6.3.智能判断

在学习Solr时我们发现，我们在新增数据时，只能使用提前配置好映射属性的字段，否则就会报错。

不过在Elasticsearch中并没有这样的规定。

事实上Elasticsearch非常智能，你不需要给索引库设置任何mapping映射，它也可以根据你输入的数据来判断类型，动态添加数据映射。

测试一下：

POST /heima/goods/3
{
    "title":"超米手机",
    "images":"http://image.leyou.com/12479122.jpg",
    "price":2899.00,
    "stock": 200,
    "saleable":true
}

我们额外添加了stock库存，和saleable是否上架两个字段。

来看结果：

{
  "_index": "heima",
  "_type": "goods",
  "_id": "3",
  "_version": 1,
  "_score": 1,
  "_source": {
    "title": "超米手机",
    "images": "http://image.leyou.com/12479122.jpg",
    "price": 2899,
    "stock": 200,
    "saleable": true
  }
}

在看下索引库的映射关系:

{
  "heima": {
    "mappings": {
      "goods": {
        "properties": {
          "images": {
            "type": "keyword",
            "index": false
          },
          "price": {
            "type": "float"
          },
          "saleable": {
            "type": "boolean"
          },
          "stock": {
            "type": "long"
          },
          "title": {
            "type": "text",
            "analyzer": "ik_max_word"
          }
        }
      }
    }
  }
}

stock和saleable都被成功映射了。

2.7修改数据

把刚才新增的请求方式改为PUT，就是修改了。不过修改必须指定id，

id对应文档存在，则修改
id对应文档不存在，则新增
(这样来说，我们可以全部用put 来进行增和改，post不用也可以了)
比如，我们把id为3的数据进行修改：

注意：如果只修改了一个字段，那么原有的其他字段都会消失。只保留当前的这次修改。相当于覆盖

2.8.删除数据

DELETE /索引库名/类型名/id值

DELETE heima/goods/2

3.查询

基本查询
_source过滤
结果过滤
高级查询
排序

3.1.基本查询(不能设置查询多个条件，如果需要请用后面的高级bool查询)

GET /索引库名/_search
{
    "query":{
        "查询类型":{
            "查询条件":"查询条件值"
        }
    }
}

这里的query代表一个查询对象，里面可以有不同的查询属性

查询类型：
- 例如：match_all， match，term ， range 等等
查询条件：查询条件会根据类型的不同，写法也有差异，后面根据示例进行详细讲解

3.1.1 查询所有(match_all)

hits：搜索结果的文档对象数组，每个元素是一条搜索到的文档信息

_index：索引库
_type：文档类型
_id：文档id
_score：文档得分
_source：文档的源数据

3.1.2. 匹配查询(match)

这里我们发现，搜索小米电视出现了两条匹配的，原因是在搜索的时候默认将搜索条件进行分词后再进行搜索。并且分词后词之间是or的关系。所以我们会分成小米和电视两个来进行搜索，如果我们想更精确的查找，可以讲分词后之间的关系设为and

or和and之间？

在 or 与 and 间二选一有点过于非黑即白。如果用户给定的条件分词后有 5 个查询词项，想查找只包含其中 4 个词的文档，该如何处理？将 operator 操作符参数设置成 and 只会将此文档排除。

有时候这正是我们期望的，但在全文搜索的大多数应用场景下，我们既想包含那些可能相关的文档，同时又排除那些不太相关的。换句话说，我们想要处于中间某种结果。

match 查询支持 minimum_should_match 最小匹配参数，这让我们可以指定必须匹配的词项数用来表示一个文档是否相关。我们可以将其设置为某个具体数字，更常用的做法是将其设置为一个百分数，因为我们无法控制用户搜索时输入的单词数量：

GET /heima/_search
{
    "query":{
        "match":{
            "title":{
            	"query":"小米曲面电视",
            	"minimum_should_match": "75%"
            }
        }
    }
}

本例中，搜索语句可以分为3个词，如果使用and关系，需要同时满足3个词才会被搜索到。这里我们采用最小品牌数：75%，那么也就是说只要匹配到总词条数量的75%即可，这里3*75% 约等于2。所以只要包含2个词条就算满足条件了。
结果:

3.1.3多字段查询

multi_match与match类似，不同的是它可以在多个字段中查询

GET /heima/_search
{
    "query":{
        "multi_match": {
            "query":    "小米",
            "fields":   [ "title", "subTitle" ]
        }
	}

本例中，我们会在title字段和subtitle字段中查询小米这个词

3.1.4 词条匹配(term)

term 查询被用于精确值匹配，
这些精确值可能是数字、时间、布尔或者那些未分词的字符串(keyword)

GET /heima/_search
{
    "query":{
        "term":{
            "price":2699.00
        }
    }
}

3.1.5 多词条精确匹配(terms)

terms 查询和 term 查询一样，但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值，那么这个文档满足条件：

GET /heima/_search
{
    "query":{
        "terms":{
            "price":[2699.00,2899.00,3899.00]
        }
    }
}

3.2.结果过滤

默认情况下，elasticsearch在搜索的结果中，会把文档中保存在_source的所有字段都返回。
如果我们只想获取其中的部分字段，我们可以添加_source的过滤

3.2.1 直接指定该字段

GET /heima/_search
{
  "_source": ["title","price"],
  "query": {
    "term": {
      "price": 2699
    }
  }
}

3.2.2 指定includes和excludes

我们也可以通过：

includes：来指定想要显示的字段
excludes：来指定不想要显示的字段

二者都是可选的。

GET /heima/_search
    {
      "_source": {
        "includes":["title","price"]
      },
      "query": {
        "term": {
          "price": 2699
        }
      }
    }

与下面的结果将是一样的：

    GET /heima/_search
    {
      "_source": {
         "excludes": ["images"]
      },
      "query": {
        "term": {
          "price": 2699
        }
      }
    }

3.3高级查询

3.3.1 布尔组合(bool)(多条件查询，过滤用到。很重要！)

GET heima/goods/_search
{
  
  "query": {
  
    "bool": {
      "must": [
        {"match": {
          "title": "小米电视"
        }}
      ],
      "must_not": [
        {
          "match": {
            "title": "电视"
          }
        }
      ]
    }
    
  }
}

3.3.2范围查询(range)

range 查询找出那些落在指定区间内的数字或者时间
range允许以下操作符

操作符	说明
gt	大于
gte	大于等于
lt	小于
lte	小于等于

GET heima/goods/_search
{
  
  "query": {
  "range": {
    "price": {
      "gte": 3000,
      "lte": 9909
    }
  }
    
  }
}

3.3.3. 模糊查询(fuzzy)

fuzzy 查询是 term 查询的模糊等价。它允许用户搜索词条与实际词条的拼写出现偏差，但是偏差的编辑距离不得超过2：

GET /heima/_search
    {
      "query": {
        "fuzzy": {
          "title": "appla"
        }
      }
    }

上面的查询，也能查询到apple手机

我们可以通过fuzziness来指定允许的编辑距离：

GET /heima/_search
    {
      "query": {
        "fuzzy": {
            "title": {
                "value":"appla",
                "fuzziness":1
            }
        }
      }
    }

3.4.过滤(filter)

条件查询中进行过滤
所有的查询都会影响到文档的评分及排名。如果我们需要在查询结果中进行过滤，并且不希望过滤条件影响评分，那么就不要把过滤条件作为查询条件来用。而是使用filter方式：

无查询条件，直接过滤

如果一次查询只有过滤，没有查询条件，不希望进行评分，我们可以使用constant_score取代只有 filter 语句的 bool 查询。在性能上是完全相同的，但对于提高查询简洁性和清晰度有很大帮助。

GET /heima/_search
{
    "query":{
        "constant_score":   {
            "filter": {
            	 "range":{"price":{"gt":2000.00,"lt":3000.00}}
            }
        }
}

3.5排序

3.4.1单字段排序(Sort)

sort 可以让我们按照不同的字段进行排序，并且通过order指定排序的方式

GET /heima/_search
{
  "query": {
    "match": {
      "title": "小米手机"
    }
  },
  "sort": [
    {
      "price": {
        "order": "desc"
      }
    }
  ]
}

tips：sort是对查询后做的，不属于查询和过滤的条件，因此在query查询对象外面

3.4.2 多字段排序

假定我们想要结合使用 price和 _score（得分）进行查询，并且匹配的结果首先按照价格排序，然后按照相关性得分排序：

GET heima/goods/_search
{
  "query": {
   
    
      
    "bool": {"must": [
      {"match": {
        "title": "小米"
      }}
     
    ]}

  },
  "sort": [
    {
      "price": {
        "order": "desc"
        
      }
    },
    {
      "_score": {
        "order": "desc"
        
      }
    }
  ]
  
}

4.聚合（aggregations）（重要！）

聚合可以让我们极其方便的实现对数据的统计、分析。例如：

什么品牌的手机最受欢迎？
这些手机的平均价格、最高价格、最低价格？
这些手机每月的销售情况如何？

实现这些统计功能的比数据库的sql要方便的多，而且查询速度非常快，可以实现实时搜索效果。

4.1 基本概念

Elasticsearch中的聚合，包含多种类型，最常用的两种，一个叫桶，一个叫度量：

4.1.1.桶（bucket）（类似于数据库中的分组group_by）

桶的作用，是按照某种方式对数据进行分组，每一组数据在ES中称为一个桶，例如我们根据国籍对人划分，可以得到中国桶、英国桶，日本桶……或者我们按照年龄段对人进行划分：0_10,1020,20_30,3040等。

Elasticsearch中提供的划分桶的方式有很多：

Date Histogram Aggregation：根据日期阶梯分组，例如给定阶梯为周，会自动每周分为一组
Histogram Aggregation：根据数值阶梯分组，与日期类似
Terms Aggregation：根据词条内容分组，词条内容完全匹配的为一组
Range Aggregation：数值和日期的范围分组，指定开始和结束，然后按段分组
……

语法

GET /cars/_search
{
  "size":0,
  "aggs":{
    "起一个名称":{
      "划分桶的方式": {
       
      }
    }
  }
}

综上所述，我们发现bucket aggregations 只负责对数据进行分组，并不进行计算，因此往往bucket中往往会嵌套另一种聚合：metrics aggregations即度量

4.1.2.度量（metrics）（类似数据库中的聚合函数max,min,avg…）

分组完成以后，我们一般会对组中的数据进行聚合运算，例如求平均值、最大、最小、求和等，这些在ES中称为度量

比较常用的一些度量聚合方式：

Avg Aggregation：求平均值
Max Aggregation：求最大值
Min Aggregation：求最小值
Percentiles Aggregation：求百分比
Stats Aggregation：同时返回avg、max、min、sum、count等
Sum Aggregation：求和
Top hits Aggregation：求前几
Value Count Aggregation：求总数
……

注意：在ES中，需要进行聚合、排序、过滤的字段其处理方式比较特殊，因此不能被分词（一般选为keyword）。这个类型不会被分词，将来就可以参与聚合

4.2聚合为桶

首先，我们按照汽车的颜色color来划分桶

GET /cars/_search
    {
        "size" : 0,
        "aggs" : { 
            "popular_colors" : { 
                "terms" : { 
                  "field" : "color"
                }
            }
        }
    }

size：查询条数，这里设置为0，因为我们不关心搜索到的数据，只关心聚合结果，提高效率
aggs：声明这是一个聚合查询，是aggregations的缩写
- popular_colors：给这次聚合起一个名字，任意。
  - terms：划分桶的方式，这里是根据词条划分
    - field：划分桶的字段

结果：

    {
      "took": 1,
      "timed_out": false,
      "_shards": {
        "total": 1,
        "successful": 1,
        "skipped": 0,
        "failed": 0
      },
      "hits": {
        "total": 8,
        "max_score": 0,
        "hits": []
      },
      "aggregations": {
        "popular_colors": {
          "doc_count_error_upper_bound": 0,
          "sum_other_doc_count": 0,
          "buckets": [
            {
              "key": "red",
              "doc_count": 4
            },
            {
              "key": "blue",
              "doc_count": 2
            },
            {
              "key": "green",
              "doc_count": 2
            }
          ]
        }
      }
    }

hits：查询结果为空，因为我们设置了size为0
aggregations：聚合的结果
popular_colors：我们定义的聚合名称
buckets：查找到的桶，每个不同的color字段值都会形成一个桶
- key：这个桶对应的color字段的值
- doc_count：这个桶中的文档数量

通过聚合的结果我们发现，目前红色的小车比较畅销！

4.3 桶内度量

前面的例子告诉我们每个桶里面的文档数量，这很有用。但通常，我们的应用需要提供更复杂的文档度量。例如，每种颜色汽车的平均价格是多少？

因此，我们需要告诉Elasticsearch使用哪个字段，使用何种度量方式进行运算，这些信息要嵌套在桶内，度量的运算会基于桶内的文档进行

现在，我们为刚刚的聚合结果添加求价格平均值的度量：

GET /cars/_search
{
    "size" : 0,
    "aggs" : { 
        "popular_colors" : { 
            "terms" : { 
              "field" : "color"
            },
            "aggs":{
                "avg_price": { 
                   "avg": {
                      "field": "price" 
                   }
                }
            }
        }
    }
}

aggs：我们在上一个aggs(popular_colors)中添加新的aggs。可见度量也是一个聚合,度量是在桶内的聚合
avg_price：聚合的名称
avg：度量的类型，这里是求平均值
field：度量运算的字段

结果：

...
  "aggregations": {
    "popular_colors": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
        {
          "key": "red",
          "doc_count": 4,
          "avg_price": {
            "value": 32500
          }
        },
        {
          "key": "blue",
          "doc_count": 2,
          "avg_price": {
            "value": 20000
          }
        },
        {
          "key": "green",
          "doc_count": 2,
          "avg_price": {
            "value": 21000
          }
        }
      ]
    }
  }
...

可以看到每个桶中都有自己的avg_price字段，这是度量聚合的结果

4.4 桶内嵌套桶

刚刚的案例中，我们在桶内嵌套度量运算。事实上桶不仅可以嵌套运算，还可以再嵌套其它桶。也就是说在每个分组中，再分更多组。

比如：我们想统计每种颜色的汽车中，分别属于哪个制造商，按照make字段再进行分桶

GET /cars/_search
{
    "size" : 0,
    "aggs" : { 
        "popular_colors" : { 
            "terms" : { 
              "field" : "color"
            },
            "aggs":{
                "avg_price": { 
                   "avg": {
                      "field": "price" 
                   }
                },
                "maker":{
                    "terms":{
                        "field":"make"
                    }
                }
            }
        }
    }
}

原来的color桶和avg计算我们不变（因为我们想统计在每一个颜色下的平均价格和他们的品牌，所以都在第一个分组popular_colors下）
maker：在嵌套的aggs下新添一个桶，叫做maker
terms：桶的划分类型依然是词条
filed：这里根据make字段进行划分

4.5.划分桶的其它方式

前面讲了，划分桶的方式有很多，例如：

Date Histogram Aggregation：根据日期阶梯分组，例如给定阶梯为周，会自动每周分为一组
Histogram Aggregation：根据数值阶梯分组，与日期类似
Terms Aggregation：根据词条内容分组，词条内容完全匹配的为一组
Range Aggregation：数值和日期的范围分组，指定开始和结束，然后按段分组

刚刚的案例中，我们采用的是Terms Aggregation，即根据词条划分桶。

接下来，我们再学习几个比较实用的：

4.5.1.阶梯分桶Histogram

histogram是把数值类型的字段，按照一定的阶梯大小进行分组。你需要指定一个阶梯值（interval）来划分阶梯大小。

举例：

比如你有价格字段，如果你设定interval的值为200，那么阶梯就会是这样的：

0，200，400，600，…

上面列出的是每个阶梯的key，也是区间的启点。

如果一件商品的价格是450，会落入哪个阶梯区间呢？计算公式如下：

bucket_key = Math.floor((value - offset) / interval) * interval + offset

value：就是当前数据的值，本例中是450

offset：起始偏移量，默认为0

interval：阶梯间隔，比如200

因此你得到的key = Math.floor((450 - 0) / 200) * 200 + 0 = 400

比如，我们对汽车的价格进行分组，指定间隔interval为5000：

GET /cars/_search
{
  "size":0,
  "aggs":{
    "price":{
      "histogram": {
        "field": "price",
        "interval": 5000
      }
    }
  }
}

结果：

{
  "took": 21,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 8,
    "max_score": 0,
    "hits": []
  },
  "aggregations": {
    "price": {
      "buckets": [
        {
          "key": 10000,
          "doc_count": 2
        },
        {
          "key": 15000,
          "doc_count": 1
        },
        {
          "key": 20000,
          "doc_count": 2
        },
        {
          "key": 25000,
          "doc_count": 1
        },
        {
          "key": 30000,
          "doc_count": 1
        },
        {
          "key": 35000,
          "doc_count": 0
        },
        {
          "key": 40000,
          "doc_count": 0
        },
        {
          "key": 45000,
          "doc_count": 0
        },
        {
          "key": 50000,
          "doc_count": 0
        },
        {
          "key": 55000,
          "doc_count": 0
        },
        {
          "key": 60000,
          "doc_count": 0
        },
        {
          "key": 65000,
          "doc_count": 0
        },
        {
          "key": 70000,
          "doc_count": 0
        },
        {
          "key": 75000,
          "doc_count": 0
        },
        {
          "key": 80000,
          "doc_count": 1
        }
      ]
    }
  }
}

你会发现，中间有大量的文档数量为0 的桶，看起来很丑。

我们可以增加一个参数min_doc_count为1，来约束最少文档数量为1，这样文档数量为0的桶会被过滤

示例：

GET /cars/_search
{
  "size":0,
  "aggs":{
    "price":{
      "histogram": {
        "field": "price",
        "interval": 5000,
        "min_doc_count": 1
      }
    }
  }
}

结果：

{
  "took": 15,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 8,
    "max_score": 0,
    "hits": []
  },
  "aggregations": {
    "price": {
      "buckets": [
        {
          "key": 10000,
          "doc_count": 2
        },
        {
          "key": 15000,
          "doc_count": 1
        },
        {
          "key": 20000,
          "doc_count": 2
        },
        {
          "key": 25000,
          "doc_count": 1
        },
        {
          "key": 30000,
          "doc_count": 1
        },
        {
          "key": 80000,
          "doc_count": 1
        }
      ]
    }
  }
}

完美，！

如果你用kibana将结果变为柱形图，会更好看：

4.5.2.范围分桶range

范围分桶与阶梯分桶类似，也是把数字按照阶段进行分组，只不过range方式需要你自己指定每一组的起始和结束大小。

你可能感兴趣的:(ElasticSearch)

2.ELK之Elasticsearch常用DSL语句(kibana语句) 焱齿 elk elasticsearch
目录什么是DSL？零、ES基本操作1、查看索引/mapping2、查看集群健康状态3、查询ES中所有的index4、删除索引5、查看索引的分片情况6、根据docid查询文档7、常规查找——在/index/type中查找8、限制查找条数9、ES的基本CURD一、ES高级查询DSL0、ESmapping中的数据类型2、queryDSL——查询所有(match_all)3、queryDSL——关键词查询
【ELK】【Elasticsearch 】DSL 和 DQL 日月星宿～ elk elk
1.DSL查询（QueryDSL）全称：DomainSpecificLanguage（领域特定语言）。定义：Elasticsearch提供的一种基于JSON的查询语言，用于构建复杂的查询逻辑。特点：支持多种查询类型（如match、term、range、bool等）。可以组合多个查询条件。支持聚合、排序、分页等功能。适用场景：复杂的查询需求。需要精确控制查询逻辑的场景。示例：json复制GET/in
【ELK】【Elasticsearch】数据查询方式日月星宿～ elk elk
1.简单查询（URISearch）通过URL参数直接进行查询，适合简单的搜索场景。示例：bash复制GET/index_name/_search?q=field_name:search_value说明：index_name：索引名称。field_name：字段名称。search_value：搜索值。特点：简单易用，适合快速测试。功能有限，不支持复杂的查询逻辑。2.DSL查询（QueryDSL）使用
Elasticsearch常用的查询条件凌涑数据库搜索引擎
目录1.MatchQuery2.TermQuery3.RangeQuery4.BoolQuery5.ExistsQuery6.PrefixQuery7.WildcardQuery8.RegexpQuery9.TermsQuery10.NestedQuery11.GeoDistanceQuery12.ScriptQuery13.FuzzyQuery14.IdsQuery15.MoreLikeThis
Nginx 配置Kibana和Elasticsearch转发和认证「已注销」大数据与人工智能 nginx linux elasticsearch kibana
前言默认的，kibana地址端口为5601，elasticsearch地址端口为9200，有时候不希望展示端口信息。这个时候可以使用nginx完成转发。配置Kibana首先需要修改kibana的配置文件kibana.yml添加如下信息server.basePath:"/kibana"注意：空格然后添加locationlocation/kibana/{auth_basic"kibana";auth_
SpringBoot整合easy-es m0_74824865 面试学习路线阿里巴巴 spring boot elasticsearch 后端
一、easy-es简介EasyES是一款基于Elasticsearch官方提供的RestHighLevelClient开发的ORM框架，旨在简化开发流程并提高效率。EasyES在保持RestHighLevelClient原有功能的基础上进行增强，而不做任何改变。它采用与Mybatis-Plus相似的语法，使得开发者可以无缝迁移至EasyES，无需额外学习成本。EasyES的核心理念是将简单、易用性
阿里云通过docker安装skywalking及elasticsearch操作流程 stone.eye 阿里云 docker skywalking elasticsearch
系统本文使用系统为AlibabaCloudLinux3.2104LTS64位配置为4核8GPS：最低配置应为2核4G，配置过低无法启动安装docker1.卸载旧版本dockeryumremovedocker\docker-client\docker-client-latest\docker-common\docker-latest\docker-latest-logrotate\docker-lo
Windows上安装Magento2.4+ wustzdd Magento PHP windows php
Magento2.4+的系统要求PHP-PHP7.3+数据库-MySQL5.7+Elasticsearch7.6+Web服务器-Apache2.4x或Nginx1.8x操作系统-跨平台浏览器-GoogleChrome，InternetExplorer或Firefox等安全套接字层（SSL）-HTTPS的有效安全证书第1步：开启以下PHP扩展并修改php.ini和mysql.ini的配置参数.php
自定义 Celery的logging模块 code-ranger python python celery
为什么需要自定义Celery日志默认的Celery日志配置虽然满足基本需求，但在以下情况下可能需要进行自定义：支持日志滚动：原生celery不支持日志滚动。更详细的日志信息：需要包含更多上下文信息，以便更好地理解任务的执行过程。日志格式调整：适应现有的日志管理系统，如ELK（Elasticsearch,Logstash,Kibana）堆栈。多日志目标：将日志同时输出到多个地方，例如控制台、文件和远
ELK技术栈：从入门到实践指南点点喜欢 elk
一、ELK简介ELK是Elasticsearch、Logstash、Kibana三大开源工具的首字母缩写，现扩展为ElasticStack，新增轻量级数据采集器Beats。其核心价值在于提供一套完整的日志管理、搜索分析和可视化解决方案，广泛应用于实时数据处理、业务监控、安全分析等领域。二、核心组件详解Elasticsearch定位：分布式搜索与分析引擎，基于ApacheLucene构建。特性：实时
【Elasticsearch】Search Templates（搜索模板） risc123456 Elasticsearch elasticsearch
Elasticsearch的SearchTemplates（搜索模板）是一种强大的功能，允许用户预定义搜索查询的结构，并通过参数动态调整查询内容。这种方式在实际应用中非常有用，尤其是在需要根据用户输入或不同场景灵活调整查询逻辑时，同时又避免了直接暴露Elasticsearch查询语法给最终用户。以下是对Elasticsearch搜索模板的详细说明，结合了前面的翻译和示例代码。---1.什么是搜索模
私有化部署落地方案～后端维搭小刘后端架构运维
在上一期中，我们介绍了星云私有化部署落地方案～前端。今天，我们将继续深入探讨星云私有化部署落地方案，重点讲解后端部分的部署架构，包括中间件和后端服务两大核心。中间件从星云私有化部署整体方案中，可以知道我们采用了MySQL、Redis、ElasticSearch、RabbitMQ和FastDFS这五种中间件组件。它们在私有化部署中的具体落地方案如下图所示：（1）将星云使用的五种组件镜像上传至维搭自有
ElasticSearch+Kibana通过Docker部署到Linux服务器中易安杰 elasticsearch 搜索引擎 linux 全文检索中文分词
1、ElasticSearch概念Elasticsearch是一个基于Lucene构建的开源搜索引擎，它提供了一个分布式、RESTful风格的搜索和数据分析引擎。Elasticsearch能够对大量数据进行快速全文搜索，并且具有非常好的水平扩展能力，这意味着当你需要处理更多数据时，可以通过增加更多的服务器来提升性能。文档和字段：elasticsearch是面向文档（Document）存储的，可以是
Docker部署Kibana8 GitIDEA docker 容器运维
安装Kibana安装Kibana前置创建并配置kibana.yml启动Kibana检查是否启动成功通过页面访问Docker安装Kibana:GitIDEA安装Kibana前置Kibana是一款适用于Elasticsearch的源可用数据可视化仪表板软件。使用docker下载kibanadockerpullkibana:8.13.0查看es的ipdockerinspect809c99acde7f|g
蓝易云 - 使用logstash+elasticsearch+kibana快速搭建日志平台蓝易云 elasticsearch jenkins 大数据运维容器开发语言搜索引擎
使用Logstash、Elasticsearch和Kibana快速搭建日志平台是非常简单的。以下是简要的步骤：安装Logstash、Elasticsearch和Kibana：前往官方网站下载并安装Logstash、Elasticsearch和Kibana。确保它们都在同一台服务器上或可以互相访问。配置Logstash：创建一个Logstash配置文件，定义输入来源（如文件、日志收集器等）和输出目标
ubuntu22.4搭建单节点es8.1 宇智波云大数据项目运维 elasticsearch
下载对应的包elasticsearch-8.1.1-linux-x86_64.tar.gz创建es租户groupaddelasticsearcuseraddelasticsearch-gelasticsearch-pelasticsearchchmodu+w/etc/sudoerschmod-Relasticsearch:elasticsearchelasticsearch修改配置文件vim/et
【学习笔记】Elasticsearch之环境搭建聪明马的博客 elasticsearch 学习笔记 elasticsearch
Elasticsearch官网本文是自己在学习Elasticsearch的过程中，记下的觉得非常有用的笔记，希望对大家认识Elasticsearch有一点点帮助。1.什么是Elasticsearch官网上是这么介绍的：Elasticsearchisadistributeddocumentstore.Insteadofstoringinformationasrowsofcolumnardata,El
海量日志接入 Serverless 应用降本70%以上
概述随着互联网业务的快速发展，日志数据量日益庞大，传统的日志处理方式面临着成本高、扩展性差等问题。为了应对这一挑战，越来越多的企业开始转向更先进的解决方案——阿里云ElasticsearchServerless。本文档将探讨在日志场景下，使用阿里云ElasticsearchServerless相较于基于ECS自建Elasticsearch集群的成本与性能优势，展示如何通过Serverless架构实
【elasticsearch】reindex 断点续传 infiniteWei elasticsearch elasticsearch 搜索引擎
在进行大规模reindex时，由于数据量庞大或者网络/硬件故障，可能会发生中断。为了确保数据的完整性并支持中断后的续传，Elasticsearch提供了一些方法来实现断点续传。尽管reindex操作本身没有直接的“断点续传”选项，但可以通过一些技巧和配置来模拟这一过程。POST_reindex{"source":{"remote":{"host":"http://远程ip:9200"},"inde
【Elasticsearch源码解读】代码包结构概述 risc123456 elasticsearch
Elasticsearch的代码库包含多个包，每个包负责不同的功能。以下是这些包的主要功能：####action封装了Elasticsearch的各种操作，如索引、搜索、删除等，提供了与集群交互的接口。####bootstrap包含启动Elasticsearch节点所需的引导程序，负责初始化环境和配置。####client/internal提供客户端与Elasticsearch集群交互的内部实现，
浅聊读写分离不全数据库 JAVA C#相关数据库读写分离 C#JAVA
一、前言最近工作很繁忙，同事的离职给我带来了很多的事情，投身于博客的时间比较少，另外在宿舍住可能部分的时间要随大流，鹤立鸡群有一些不好，当然这也是给自己找借口和理由，趁着周末整理下最近的感悟；另外公司用的ElasticSearch，最近我也在探索，微服务方面暂时搁浅，待到搬出宿舍的时候在开始一波666的操作；另外随着数据量增加自己还需要去接触波大数据东西，不得说真是有些挑战和机遇，看自己如何把握了
Elasticsearch 技术分享 chao_dev 大数据 elasticsearch
Elasticsearch技术分享文章目录Elasticsearch技术分享一，Elasticsearch基础介绍1.简介2.kibana3.基本概念4.索引的应用二，Elasticsearch聚合查询1.聚合的概念2.Metric(指标)聚合3.Bucket(桶)聚合4.Pipeline(管道)聚合5.Matrix(矩阵)聚合6.总结三，Elasticsearch索引别名Aliases1.业务问
ELK安装部署同步mysql数据未发哦京东发 elk 运维
ELK安装部署指南ELK是Elasticsearch、Logstash和Kibana的简称，用于日志收集、存储、分析和可视化。1.安装ElasticsearchElasticsearch是一个分布式搜索和分析引擎。1.1下载并安装访问Elasticsearch官网下载最新版本。解压并安装：tar-xzfelasticsearch-8.10.0-linux-x86_64.tar.gzcdelasti
使用 INFINI Gateway 保护 Elasticsearch 集群之阻断不合理的查询数据库
本文将探讨如何使用INFINIGateway阻止不合理的查询发送到Elasticsearch，此方法同样适用于Opensearch和Easysearch。在以往处理ElasticsearchOOM（内存溢出）问题的经验中，我们发现许多案例是由于查询操作导致节点出现OOM的情况。经过调查，这些案例主要分为两类：一类是由于查询吞吐量超出了集群的处理能力，另一类则是在执行某些不合理的查询时触发了OOM。
Join字段类型超容易上手的好吧(Elasticsearch) 籽麟网络 elasticsearch 大数据搜索引擎
最近因为工作原因吗，比较忙，然后个人也比较懒，输出又慢下来了，后面会慢慢恢复的，定期保证周更吧，并且保证质量输出。阅读本文需要一定的Elasticsearch基础哦，本文深度有，但是不深概述Elasticsearch中Join数据类型的字段相信大家也都用过，也就是口中常谈的父子文档。在Elasticsearch中Join不能跨索引和分片，所以保存文档信息时要保证父子文档使用相同的路由参数来保证父文
【Elasticsearch】多索引(数据流)搜索 risc123456 Elasticsearch elasticsearch
在Elasticsearch中，搜索多个数据流（datastreams）和索引（indices）是一个常见的操作，尤其是在处理大规模数据或跨多个数据源进行查询时。以下是关于如何使用查询来搜索多个数据流和索引的详细说明，包括方法、示例和一些高级特性。---1.为什么需要搜索多个数据流和索引？在实际应用中，数据可能会分散在多个索引或数据流中，例如：•日志数据按日期或服务类型分隔到不同的索引。•数据流用
【Elasticsearch】`nested`字段 risc123456 Elasticsearch elasticsearch
Elasticsearch的`nested`字段是一种强大的数据类型，用于处理嵌套对象数组，允许将每个对象独立索引和查询。以下是关于`nested`字段的详细说明：1.`nested`字段的定义`nested`字段是`object`数据类型的特殊版本，允许将对象数组索引为独立的隐藏文档。这使得每个嵌套对象可以独立于其他对象进行查询。例如：```jsonPUT/blog-posts{"mapping
Elasticsearch字段类型 java编程小帅 Elasticsearch 大数据 java elasticsearch 搜索引擎
每个字段都有一个字段数据类型或字段类型。此类型指示字段包含的数据类型（如strings或boolean）及其预期用途。例如，可以将strings索引到text和keyword字段。但是，text字段值将被分析以进行全文搜索，而keyword字符串则保留原样以进行过滤和排序。字段类型按家庭分组。同一家庭中的类型支持相同的搜索功能，但可能具有不同的空间使用或性能特征。目前，唯一的类型家庭是keywor
Elasticsearch详解久梦歌行 elasticsearch jenkins 大数据
Elasticsearch是什么Elasticsearch是使用Lucene为基础建立的开源可用全文搜索引擎，它可以快速地储存、搜索和分析海量数据Elasticsearch的特点和传统的关系数据库对比关系型数据库查询性能，数据量超过百万级千万级之后下降厉害，本质是索引的算法效率不行，B+树算法不如倒排索引算法高效。关系型数据库索引最左原则限制，查询条件字段不能任意组合，否则索引失效，相反Elast
Windows环境下es8的集群部署想养一只萨摩耶～ Elasticsearch elasticsearch 大数据服务器
原创文章：Windows环境下es8的集群部署–编程屋目录1相关概念1.1单机集群1.2集群Cluster1.3节点Node2Windows下部署2.1节点node-10012.2节点node-10022.3节点node-10031相关概念1.1单机集群单台Elasticsearch服务器提供服务，往往都有最大的负载能力，超过这个阀值，服务器新能就会大大降低不可用，所以生产环境中，一般都是运行在指
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一