const伐伐

elastic search query dsl查询语法总结

elastic search query DSL 关键字很多，什么场景对应选择合适的DSL并不容易。

文章目录

- 核心概念
- - 概念1
  - 概念2
  - 概念3
  - 概念4
- 子查询语句
- - 第1组：单个field 单值包含
  - 第2组：多fields 单值包含
  - 第3组：单field范围查询
  - 第4组：单field单值相等
  - 第5组：单field 多值相等
  - 第6组：filter
  - 第7组：sort排序
  - 第8组：单个field 多值匹配
  - 第9组：单field多值匹配
  - 第10组：单field多值匹配，至少匹配几个值
  - 第11组：是否存在exists
  - 第12组：获取某个字段的去重记录
  - 第13组：根据字段长度进行过滤
- 复合语句查询
- - 第1组：多fields单值包含 + 过滤条件
  - 第2组多fields多值匹配
  - 第3组多fields多值匹配
  - 第4组
  - 第5组：多个field多个值匹配
- 特殊需求语句查询
- - 第1组：搜索条件的权重boost
  - 第2组：dis_max实现best fields策略
  - 第3组：tie_breaker参数优化dis_max搜索效果
  - 第4组：boost+dis_max+tie_breaker
  - 第5组：most_fields策略
  - 第6组：cross-fields技术改善most_fields策略
  - 第7组：phrase match 短语匹配
  - 第8组：基于slop参数实现proximity match 近似匹配
  - 第9组：混合使用match和近似匹配实现召回率与精准度的平衡
  - 第10组：使用rescoring机制优化近似匹配搜索的性能
  - 第11组：实现前缀搜索
  - 第12组：实现通配搜索
  - 第13组：实现正则搜索
  - 第14组：negative boost
  - 第15组：function_score自定义分数
  - 第16组：fuzzy 模糊搜索

官方文档：https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl.html

核心概念

概念1

查询语句其可以分为两种类型：

子查询语句 Leaf query clauses

子查询子句在特定字段中查找特定值，例如match，term或range查询。

复合查询语句 Compound query clauses

复合查询子句包装其他子查询或复合查询，并用于以逻辑方式组合多个查询（例如bool或dis_max查询），或更改其行为（例如constant_score查询）。

概念2

查询语句的使用场景分为两种：query context 以及 filter context

官方文档：Query and filter context

query context

解决问题：该文档与该查询子句的匹配程度如何

其使用相关度评分 relevance score

filter context

解决问题：该文档与该查询子句匹配吗？

其不使用相关度评分 relevance score

概念3

另外的一组关键概念：exact value & full text

在创建索引mapping的时候，不同类型的field，可能有的就是full text，有的就是exact value

对于full text，其会创建倒排索引，并且对每一个词进行分词（类似mapping type=text）

对于exact value，其也会创建倒排索引，但是不会进行分词（类似mapping type=keyword）

对于query context，处理的就是类似sql中like的含义，是否包含，其处理的是full text

对于filter context，其处理的就是类似sql中 = 的含义，是否相等，其处理的是exact value

概念4

召回率recall

比如你搜索一个java spark，总共有100个doc，能返回多少个doc作为结果，就是召回率，recall

精准度precision

比如你搜索一个java spark，能不能尽可能让包含java spark，或者是java和spark离的很近的doc，排在最前面，precision

将查询部分分为子查询语句、复合查询语句以及特殊需求语句

子查询语句

下面以需求 <-> 对应的Query Dsl为例

第1组：单个field 单值包含

需求：match 单个field 单值包含

语句：

GET /test_index/test_type/_search 
{
  "query": {
    "match": {
      "test_field": "test"
    }
  }
}

match query是会对查询字段进行分词的

第2组：多fields 单值包含

需求：multi_match 多fields 单值包含

语句：

GET /test_index/test_type/_search
{
  "query": {
    "multi_match": {
      "query": "test",
      "fields": ["test_field", "test_field1"]
    }
  }
}

第3组：单field范围查询

需求：range query 单field范围查询

语句：

GET /company/employee/_search 
{
  "query": {
    "range": {
      "age": {
        "gte": 30
      }
    }
  }
}

第4组：单field单值相等

需求：term query 单field单值相等

语句：

GET /test_index/test_type/_search 
{
  "query": {
    "term": {
      "test_field": "test hello"
    }
  }
}

term query把查询字段当作exact value来查询，这个前提是mapping的时候对应term query的字段，mapping type=keyword 不分词

第5组：单field 多值相等

需求：terms query，单field 多值相等

语句：

GET /_search
{
    "query": { 
    	"terms": 
    		{ "tag": [ "search", "full_text", "nosql" ] 
    	}
    }
}

第6组：filter

需求：filter

语句：

GET /company/employee/_search 
{
  "query": {
    "constant_score": {
      "filter": {
        "range": {
          "age": {
            "gte": 30
          }
        }
      }
    }
  }
}

“query”下直接放filter是不支持的，要加上constant_score

其另外一种写法

GET /_search
{
    "query" : {
        "bool" : {
            "filter" : {
                "term" : {
                    "author_id" : 1
                }
            }
        }
    }
}

filter是不计算相关度分数的

第7组：sort排序

需求：sort

语句：

GET /company/employee/_search 
{
  "query": {
    "constant_score": {
      "filter": {
        "range": {
          "age": {
            "gte": 30
          }
        }
      }
    }
  },
  "sort": [
    {
      "join_date": {
        "order": "asc"
      }
    }
  ]
}

默认是根据相关度分数降序排列的，可以通过sort语句修改
sort：最好在“日期型”和“数字型”字段上排序

第8组：单个field 多值匹配

需求：单个field 多值匹配

搜索标题中包含java或elasticsearch的blog

语句：

GET /forum/article/_search
{
    "query": {
        "match": {
            "title": "java elasticsearch"
        }
    }
}

与之前的term query不同，不是搜索exact value，是进行full text全文检索。

match query，是负责进行全文检索的。当然，如果要检索的field，是not_analyzed 不分词keyword类型，那么match query也相当于term query。

也可以这样实现

{
  "bool": {
    "should": [
      { "term": { "title": "java" }},
      { "term": { "title": "elasticsearch"   }}
    ]
  }
}

实际上es底层最终就是转换为上面的语句进行执行的

第9组：单field多值匹配

需求：搜索标题中包含java和elasticsearch的blog

语句：

GET /forum/article/_search
{
    "query": {
        "match": {
            "title": {
				"query": "java elasticsearch",
				"operator": "and"
   	    	}
        }
    }
}

灵活使用and关键字，如果你是希望所有的搜索关键字都要匹配的，那么就用and，可以实现单纯match query无法实现的效果

另一种写法must+term

{
  "bool": {
    "must": [
      { "term": { "title": "java" }},
      { "term": { "title": "elasticsearch"   }}
    ]
  }
}

这也是底层实际执行的语句

第10组：单field多值匹配，至少匹配几个值

需求：搜索包含java，elasticsearch，spark，hadoop，4个关键字中，至少3个的blog

语句：

GET /forum/article/_search
{
  "query": {
    "match": {
      "title": {
        "query": "java elasticsearch spark hadoop",
        "minimum_should_match": "75%"
      }
    }
  }
}

minimum_should_match：指定一些关键字中，必须至少匹配其中的多少个关键字，才能作为结果返回

也可以这样实现

GET /forum/article/_search
{
  "query": {
    "bool": {
      "should": [
        { "match": { "title": "java" }},
        { "match": { "title": "elasticsearch"   }},
        { "match": { "title": "hadoop"   }},
		{ "match": { "title": "spark"   }}
      ],
      "minimum_should_match": 3 
    }
  }
}

如果没有must的话，那么should中必须至少匹配一个才可以

通过minimum_should_match进行精准控制，should的4个条件中，至少匹配几个才能作为结果返回

这是底层实际执行的语句

第11组：是否存在exists

是否存在： exists query
es无法索引或搜索空值null。当字段设置为null（或空数组或空值数组）时，它被视为该字段没有值。

参考：exists query官方文档

Returns documents that contain an indexed value for a field.

An indexed value may not exist for a document’s field due to a variety of reasons:

The field in the source JSON is null or []
The field has "index" : false set in the mapping
The length of the field value exceeded an ignore_above setting in the mapping
The field value was malformed and ignore_malformed was defined in the mapping

GET /_search
{
  "query": {
    "exists": {
      "field": "user"
    }
  }
}

While a field is deemed non-existent if the JSON value is null or [], these values will indicate the field does exist:

Empty strings, such as "" or "-"
Arrays containing null and another value, such as [null, "foo"]
A custom null-value, defined in field mapping

第12组：获取某个字段的去重记录

使用Elasticsearch查询字段的所有唯一值，参考：Query all unique values of a field with Elasticsearch

select distinct full_name from authors;

-- is equivanlent to 

select full_name from authors group by full_name;

Kibana语句

GET index_name/_search
{
  "aggs": {
    "userId": {
      "terms": {
        "field": "userId",
        "size":30
      }
    }
  },
  "size": 0
}

第13组：根据字段长度进行过滤

需求

过滤出client=android并且client_id的长度不小于40

kibana语句

GET user-tags/_search
  {
    "query": {
      "bool":{
        "must": [
          {
            "match":{
              "client":"android"
            }
          },
          {
            "constant_score": {
            "filter": {
                "script": {
                    "script": "doc['client_id'].getValue().length() >=40"
                }
            }
        }
          }
        ]
      }
    }
}

复合语句查询

bool查询，是一个或多个查子句的组合，包含四种子句：should, must, must_not, filter，其中2 种会影响算分，2 种不影响算分

相关性并不只是全文本检索的专利。也适用于yes | no 的子句，匹配的子句越多，相关性评分
越高。如果多条查询子句被合并为一条复合查询语句，比如bool 查询，则每个查询子句计算
得出的评分会被合并到总的相关性评分中。

可以通过嵌套bool，实现should not逻辑

第1组：多fields单值包含 + 过滤条件

需求：title必须包含elasticsearch，content可以包含elasticsearch也可以不包含，包含更好，author_id必须不为111

语句：

GET /website/article/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "title": "elasticsearch"
          }
        }
      ],
      "should": [
        {
          "match": {
            "content": "elasticsearch"
          }
        }
      ],
      "must_not": [
        {
          "match": {
            "author_id": 111
          }
        }
      ]
    }
  }
}

说明：should可以影响相关度评分

第2组多fields多值匹配

需求：

条件1: name是tom
条件2: hired可以是true，也可以是false
条件3: personality要good，不能rude。这个条件满足也行，不满足也行，满足当然好了
至少要匹配一个条件

GET /test_index/_search
{
    "query": {
            "bool": {
                "must": { "match":   { "name": "tom" }},
                "should": [
                    { "match":       { "hired": true }},
                    { "bool": {
                        "must":      { "match": { "personality": "good" }},
                        "must_not":  { "match": { "rude": true }}
                    }}
                ],
                "minimum_should_match": 1
            }
    }
}

minimum_should_match:

第3组多fields多值匹配

需求：年龄必须大于等于30，同时join_date必须是2016-01-01

语句：

GET /company/employee/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "join_date": "2016-01-01"
          }
        }
      ],
      "filter": {
        "range": {
          "age": {
            "gte": 30
          }
        }
      }
    }
  }
}

每个子查询都会计算一个document针对它的相关度分数，然后bool综合所有分数，合并为一个分数，当然filter是不会计算分数的

第4组

需求：title中必须包含java，必须不包含spark，hadoop或者elasticsearch可以包含，也可以不包含，包含更好

语句：

GET /forum/article/_search
{
  "query": {
    "bool": {
      "must":     { "match": { "title": "java" }},
      "must_not": { "match": { "title": "spark"  }},
      "should": [
                  { "match": { "title": "hadoop" }},
                  { "match": { "title": "elasticsearch"   }}
      ]
    }
  }
}

bool组合多个搜索条件，如何计算relevance score

must和should搜索对应的分数，加起来，除以must和should的总数

must是确保说，谁必须有这个关键字，同时会根据这个must的条件去计算出document对这个搜索条件的relevance score

在满足must的基础之上，should中的条件，不匹配也可以，但是如果匹配的更多，那么document的relevance score就会更高

排名第一：java，同时包含should中所有的关键字，hadoop，elasticsearch

排名第二：java，同时包含should中的某个词

排名第三：java，不包含should中的任何关键字

第5组：多个field多个值匹配

需求：多个field多个值匹配

搜索title或content中包含java或solution的帖子

语句：

GET /forum/article/_search
{
    "query": {
        "bool": {
            "should": [
                { "match": { "title": "java solution" }},
                { "match": { "content":  "java solution" }}
            ]
        }
    }
}

特殊需求语句查询

第1组：搜索条件的权重boost

需求：

搜索标题中包含java的帖子
如果标题中包含hadoop或elasticsearch就优先搜索出来
如果一个帖子包含java hadoop，一个帖子包含java elasticsearch，包含hadoop的帖子要比elasticsearch优先搜索出来

语句：

GET /forum/article/_search 
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "title": "blog"
          }
        }
      ],
      "should": [
        {
          "match": {
            "title": {
              "query": "java"
            }
          }
        },
        {
          "match": {
            "title": {
              "query": "hadoop"
            }
          }
        },
        {
          "match": {
            "title": {
              "query": "elasticsearch",
              "boost": 5
            }
          }
        }
      ]
    }
  }
}

默认情况下，搜索条件的boost权重都是一样的，都是1

第2组：dis_max实现best fields策略

需求：搜索title或content中包含java或solution的帖子，并且某一个field中匹配到了尽可能多的关键词，被排在前面

语句：

GET /forum/article/_search
{
    "query": {
        "dis_max": {
            "queries": [
                { "match": { "title": "java solution" }},
                { "match": { "content":  "java solution" }}
            ]
        }
    }
}

best fields策略，就是说，搜索到的结果，应该是某一个field中匹配到了尽可能多的关键词，被排在前面；而不是尽可能多的field匹配到了少数的关键词，排在了前面

dis_max语法，直接取多个query中，分数最高的那一个query的分数即可

第3组：tie_breaker参数优化dis_max搜索效果

需求：搜索title或content中包含java beginner的帖子

语句：

GET /forum/article/_search
{
    "query": {
        "dis_max": {
            "queries": [
                { "match": { "title": "java beginner" }},
                { "match": { "body":  "java beginner" }}
            ],
            "tie_breaker": 0.3
        }
    }
}

dis_max只取某一个query最大的分数，完全不考虑其他query的分数

tie_breaker参数的意义，在于说，将其他query的分数，乘以tie_breaker，然后综合与最高分数的那个query的分数，综合在一起进行计算

除了取最高分以外，还会考虑其他的query的分数

tie_breaker的值，在0~1之间，是个小数

第4组：boost+dis_max+tie_breaker

需求：

搜索title或content中包含java solution的帖子
title权重为content权重的两倍

GET /forum/article/_search
{
  "query": {
    "multi_match": {
        "query":                "java solution",
        "type":                 "best_fields", 
        "fields":               [ "title^2", "content" ],
        "tie_breaker":          0.3,
        "minimum_should_match": "50%" 
    }
  } 
}

长尾，比如你搜索5个关键词，但是很多结果是只匹配1个关键词的，其实跟你想要的结果相差甚远，这些结果就是长尾

minimum_should_match，控制搜索结果的精准度，只有匹配一定数量的关键词的数据，才能返回，去掉长尾

第5组：most_fields策略

语句：

GET /forum/article/_search
{
   "query": {
        "multi_match": {
            "query":  "learning courses",
            "type":   "most_fields", 
            "fields": [ "sub_title", "sub_title.std" ]
        }
    }
}

most-fields策略，主要是说尽可能返回更多field匹配到某个关键词的doc，优先返回回来

第6组：cross-fields技术改善most_fields策略

语句

GET /forum/article/_search
{
  "query": {
    "multi_match": {
      "query": "Peter Smith",
      "type": "cross_fields", 
      "operator": "and",
      "fields": ["author_first_name", "author_last_name"]
    }
  }
}

解决most_fields进行cross-fields搜索存在的3个弊端

问题	解决方案
问题1：只是找到尽可能多的field匹配的doc，而不是某个field完全匹配的doc	解决，要求每个term都必须在任何一个field中出现
问题2: most_fields，没办法用minimum_should_match去掉长尾数据，就是匹配的特别少的结果	解决，既然每个term都要求出现，长尾肯定被去除掉了
问题3：TF/IDF算法，比如Peter Smith和Smith Williams，搜索Peter Smith的时候，由于first_name中很少有Smith的，所以query在所有document中的频率很低，得到的分数很高，可能Smith Williams反而会排在Peter Smith前面	计算IDF的时候，将每个query在每个field中的IDF都取出来，取最小值，就不会出现极端情况下的极大值了

第7组：phrase match 短语匹配

需求：java spark，就靠在一起，中间不能插入任何其他字符，就要搜索出来这种doc

语句：

GET /forum/article/_search
{
    "query": {
        "match_phrase": {
            "content": "java spark"
        }
    }
}

phrase match，就是要去将多个term作为一个短语，一起去搜索，只有包含这个短语的doc才会作为结果返回。

match是处理不了短语这种场景的。使用match搜索java spark，java的doc也会返回，spark的doc也会返回。

第8组：基于slop参数实现proximity match 近似匹配

语句：

GET /forum/article/_search
{
    "query": {
        "match_phrase": {
            "title": {
                "query": "java spark",
                "slop":  1
            }
        }
    }
}

搜索文本中的几个term，要经过几次移动才能与一个document匹配，这个移动的次数，就是slop

match query的性能比phrase match和proximity match（有slop）要高很多。因为后两者都要计算position的距离。

第9组：混合使用match和近似匹配实现召回率与精准度的平衡

需求：我们希望的是匹配到几个term中的部分，就可以作为结果出来，这样可以提高召回率。同时也希望用上match_phrase根据距离提升分数的功能，让几个term距离越近分数就越高，优先返回，提高精准度。

语句：

GET /forum/article/_search
{
  "query": {
    "bool": {
      "must": {
        "match": { 
          "title": {
            "query":"java spark" --> java或spark或java spark，java和spark靠前，但是没法区分java和spark的距离，也许java和spark靠的很近，但是没法排在最前面
          }
        }
      },
      "should": {
        "match_phrase": { --> 在slop以内，如果java spark能匹配上一个doc，那么就会对doc贡献自己的relevance score，如果java和spark靠的越近，那么就分数越高
          "title": {
            "query": "java spark",
            "slop":  50
          }
        }
      }
    }
  }
}

第10组：使用rescoring机制优化近似匹配搜索的性能

需求：近似匹配情况下，仅对前50个doc进行slop移动去匹配，去贡献自己的分数即可，不需要对全部1000个doc都去进行计算和贡献分数

语句：

GET /forum/article/_search 
{
  "query": {
    "match": {
      "content": "java spark"
    }
  },
  "rescore": {
    "window_size": 50,
    "query": {
      "rescore_query": {
        "match_phrase": {
          "content": {
            "query": "java spark",
            "slop": 50
          }
        }
      }
    }
  }
}

第11组：实现前缀搜索

语句：

GET my_index/my_type/_search
{
  "query": {
    "prefix": {
      "title": {
        "value": "C3"
      }
    }
  }
}

前缀搜索，要遍历整个倒排索引，存在性能问题

第12组：实现通配搜索

wildcard需要使用其keyword字段

语句：

GET index_name/_search
{
  "query":{
    "wildcard": {
      "H5Title.keyword": {
        "value": "学习强国-社保*"
      }
    }
  }
}

原理应该是：通配符搜索要使用正排索引，keyword借助doc values，而对于text，没有fielddata=true，无法执行，即便可以执行，也是分词的结果，估计对于通配符也不合适

第13组：实现正则搜索

语句：

GET /my_index/my_type/_search 
{
  "query": {
    "regexp": {
      "title": "C[0-9].+"
    }
  }
}

C[0-9].+

[0-9]：指定范围内的数字

[a-z]：指定范围内的字母

.：一个字符

+：前面的正则表达式可以出现一次或多次

查询长度超过50位的搜索词内容

GET xxx/_search
{
  "query":{
    "bool":{
      "must":{
        "match_all":{
            
          }
      },
      "filter":[
        {
        "regexp":{
              "word":{
                "value":".{50,}"
              }
            }},
         {"range": {
           "datetime": {
             "gte": "2019-01-01T08:00:00.000Z",
             "lte": "2020-01-13T07:59:59.999Z"
           }
         }}
      ]
    }
  },
  "size":111
}

wildcard和regexp，与prefix原理一致，都会扫描整个索引，性能很差

第14组：negative boost

需求：搜索包含java，不包含spark的doc，但是这样子很死板

搜索包含java，尽量不包含spark的doc，如果包含了spark，不会说排除掉这个doc，而是说将这个doc的分数降低

语句：

GET /forum/article/_search 
{
  "query": {
    "boosting": {
      "positive": {
        "match": {
          "content": "java"
        }
      },
      "negative": {
        "match": {
          "content": "spark"
        }
      },
      "negative_boost": 0.2
    }
  }
}

包含了negative term的doc，分数乘以negative boost，分数降低

第15组：function_score自定义分数

需求：对帖子搜索得到的相关性分数，跟follower_num进行运算，由follower_num在一定程度上增强帖子的分数看帖子的人越多，那么帖子的分数就越高

语句：

GET /forum/article/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query": "java spark",
          "fields": ["tile", "content"]
        }
      },
      "field_value_factor": {
        "field": "follower_num",
        "modifier": "log1p",
        "factor": 0.5
      },
      "boost_mode": "sum",
      "max_boost": 2
    }
  }
}

如果只有field，那么会将每个doc的分数都乘以follower_num，如果有的doc follower是0，那么分数就会变为0，效果很不好。因此一般会加个log1p函数，公式会变为，new_score = old_score * log(1 + number_of_votes)，这样出来的分数会比较合理

再加个factor，可以进一步影响分数，new_score = old_score * log(1 + factor * number_of_votes)

boost_mode，可以决定分数与指定字段的值如何计算，multiply，sum，min，max，replace

max_boost，限制计算出来的分数不要超过max_boost指定的值

第16组：fuzzy 模糊搜索

需求：搜索的时候，可能输入的搜索文本会出现误拼写的情况

语句：

GET /my_index/my_type/_search 
{
  "query": {
    "fuzzy": {
      "text": {
        "value": "surprize",
        "fuzziness": 2
      }
    }
  }
}

fuzzy搜索以后，会自动尝试将你的搜索文本进行纠错，然后去跟文本进行匹配

fuzziness，你的搜索文本最多可以纠正几个字母去跟你的数据进行匹配，默认如果不设置，就是2

你可能感兴趣的:(ELK)

Centos使用docker搭建Graylog日志平台 moxiaoran5753 centos docker graylog
日志管理系统有很多，比如ELK,Graylog，Loki+Grafana+Promtail适用场景：1.如果需求复杂，服务器资源不受限制，推荐使用ELK（Logstash+Elasticsearch+Kibana）方案；2.如果需求仅是将不同服务器上的日志采集上来集中展示和检索，且需要一个轻量级的框架，那使用PLG（Promtail+Loki+Grafana）最合适不过了。3.Graylog专注于
Graylog日志系统超详细部署和配置 kim_liao123 部署 elasticsearch docker
Graylog日志系统部署和配置1.软件介绍：Graylog是一个开源的日志聚合、分析、审计、展现和预警工具。功能上和ELK类似，但又比ELK要简单，依靠着更加简洁，高效，部署使用简单；官方文档：https://docs.graylog.org/en/3.3/pages/users_and_roles.html以下所有部署方式都来源与官方文档2.软件准备：服务端：Mongo：存储graylog的一
docker（10、日志管理4）5、Graylog 日志系统(1、部署Graylog日志系统，2、Graylog管理日志) junior1206 k8s docker
部署Graylog日志系统Graylog是与ELK可以相提并论的一款几种式日志管理方案，支持数据收集、检索、可视化Dashboard。将实践用Graylog来管理Docker日志Graylog架构Graylog架构如下图所示：Graylog负责接收来自各种设备和应用的日志，并未用户提供Web访问接口。Elasticsearch用于索引和保存Graylog接收到的日志MongoDB负责保存Grayl
AlphaFolding填补蛋白质动态结构预测空白！复旦大学等提出4D扩散模型，成果入选AAAI 2025 HyperAI超神经 ScienceAI 人工智能深度学习机器学习扩散模型蛋白质结构 AI4S 4D
蛋白质的功能很大程度上取决于其3D结构。19世纪中期，科学界普遍认为蛋白质结构是固定的、刚性的，类似「锁与钥匙」模型(lock-and-keymodel)，即蛋白质与配体的结合是由固定的三维结构决定的。然而，当DanielKoshland提出酶与底物结合时会发生构象变化的观点后，传统思维开始受到挑战。1980年代，分子动力学模拟(MolecularDynamics,MD)兴起，首次从计算角度揭示了
Chapter 9: Using Templates in Practice_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
UsingTemplatesinPracticeStep1:UnderstandTemplateDefinitionsandtheInclusionModelKeyConceptCodeExampleExplanationStep2:TackleLinkerErrorswithExplicitInstantiationKeyConceptCodeExampleTestCaseStep3:Decod
【mysql】mysql之主从部署以及介绍向往风的男子 DBA mysql 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
Rocky Linux安装部署Elasticsearch（ELK日志服务器）_rockylinux elk 2401_83739411 程序员服务器 linux elasticsearch
一、Elasticsearch的简介Elasticsearch是一个强大的开源搜索和分析引擎，可用于实时处理和查询大量数据。它具有高性能、可扩展性和分布式特性，支持全文搜索、聚合分析、地理空间搜索等功能，是构建实时应用和大规模数据分析平台的首选工具。二、RockyLinux系统安装链接：VMwareWorkstation下载安装（含秘钥）链接：VMwareWorkstation创建虚拟机链接：Ro
Lec01-什么是安全？蛋蛋deべ忧桑安全
本文使用人工智能协助翻译，内容仅供参考，可能有错误或遗漏。如果你对内容或超链接有疑问，可以查看原文。参考资料地址：https://github.com/PKUFlyingPig/MIT6.16006.1600课程团队：HenryCorrigan-Gibbs,YaelKalai,BenKettle(TA),NickolaiZeldovich2022年秋季[!warning]免责声明本套笔记为正在进行
Spring boot with ELK(Elasticsearch + Logstash + Kibana) netkiller-BG7NYT 多维度架构 spring boot elk elasticsearch
SpringbootwithELK(Elasticsearch+Logstash+Kibana)节选自《NetkillerSpringCloud手札》将Springboot日志写入ELK有多种实现方式，这里仅提供三种方案：Springboot->logback->Tcp/IP->logstash->elasticsearch这种方式实现非常方便不需要而外包或者软件Springboot->logba
elasticsearch 横向扩展-添加节点 yp2800 elasticsearch elasticsearch
ELKELK运维都会接触到，是一个分布式日志收集平台。logstash收集数据写到elasticsearch里，kibana从elasticsearch里读取数据。数据在elasticsearch里可以被检索，各种查询api,数据聚合等，功能很强大，不多说。environments目前现状：os:centos6.6elasticsearch:2.4cpu:8mem:48disk:8Tindex:4
redis 清理缓存 m0_74823408 面试学习路线阿里巴巴缓存 redis 数据库
----windos方法1，重启redis也能请缓存。方法2，清缓存前确保redis-server.exe进程已经启动，然后打开redis-cli.exe，跳出的CMD里面输入flushall，显示OK就可以了。flushall：清空整个redis服务器的数据(删除所有数据库的所有key)。flushdb：清空当前数据库中的所有key。方法3，清空指定Key，例如：delkey1delkey2方法
Elastic Stack 8.16.0 日志收集平台的搭建 JingAi_jia917 Elastisearch Logstash Filebeat Kibana Elastic stack ELK日志平台
简介1.1ELK介绍ELK是‌Elasticsearch‌、‌Logstash‌、‌Kibana‌三款开源工具的首字母缩写，构成了一套完整的日志管理解决方案，主要用于日志的采集、存储、分析与可视化‌。1）Logstash：数据管道工具，负责从多种来源（如文件、数据库、消息队列）采集日志，进行过滤、格式化后输出到目标（如Elasticsearch）‌；2）Elasticsearch：分布式实时搜索与
《架构300讲》学习笔记（201-250） newProxyInstance 笔记架构
前言内容来自B站IT老齐架构300讲内容。201小心selectforupdate，有效规避索引选择性锁表202设计模式之建造者模式的用途20320分钟上手ELK日志监控系统分类：【ELK】204设计模式之门面模式Facade205设计模式之适配器模式Adapter206经典设计！如何让RabbitMQ支持消息延迟投递207Docker容器基于NFS实现跨容器文件共享208数据向上追溯场景该如何优
ELK traceId 通过A服务调用B服务举例 C18298182575 elk hive hadoop
在分布式系统中，traceId需要在服务之间传递，以确保整个请求链路的日志能够被追踪。下面我们通过一个具体的例子，展示如何通过A服务调用B服务时传递traceId，并确保日志中能够正确记录traceId。实现思路A服务生成traceId：在A服务的HandlerInterceptor中生成traceId，并将其放入MDC。A服务调用B服务时传递traceId：在A服务调用B服务时，将traceId
springboot 整合 elk （Elasticsearch+Logstash+Kibana）高大王竟然被注册 spring 运维
Elasticsearch是个开源分布式搜索引擎，它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。Logstash是一个完全开源的工具，他可以对你的日志进行收集、过滤，并将其存储供以后使用（如，搜索）。Kibana也是一个开源和免费的工具，它Kibana可以为Logstash和ElasticSearch提供的日志分析友好的Web界
elk的相关的基础 weixin_43806846 elk
以下是关于ELK（Elasticsearch,Logstash,Kibana）的200个基础问题及其答案，涵盖了ELK的核心概念、组件、配置、使用场景、优化等方面。Elasticsearch基础**什么是Elasticsearch？**答：Elasticsearch是一个分布式、RESTful的搜索和分析引擎，基于ApacheLucene构建。**Elasticsearch的主要用途是什么？**答
ELK Stack 安装教程 - 构建日志存储告警系统运维
介绍“ELK”是三个开源项目的首字母缩写，这三个项目分别是：Elasticsearch、Logstash和Kibana。Elasticsearch是一个搜索和分析引擎。Logstash是服务器端数据处理管道，能够同时从多个来源采集数据，转换数据，然后将数据发送到诸如Elasticsearch等“存储库”中。Kibana则可以让用户在Elasticsearch中使用图形和图表对数据进行可视化。目前最
使用docker安装elk 吴传逞 docker elk 运维
配置要求：一台Linux服务器，内存不少于2g，centos7以上系统1.安装docker安装教程：CentOSDocker安装|菜鸟教程分以下几个步骤（我只写我使用过的方式）：curl-fsSLhttps://get.docker.com|bash-sdocker--mirrorAliyun安装DockerEngine-Communityyuminstall-yyum-utils\device-
ELK安装配置 hu_wenjie OpsDev OpsDev运维开发
ELK平台介绍日志主要包括系统日志、应用程序日志和安全日志。系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷，性能安全性，从而及时采取措施纠正错误。
docker 安装ELK 8.17.3 离开水的飞鱼 docker elk 容器
ELK是指Elasticsearch、Logstash和Kibana这三个开源软件的组合。Elasticsearch是一个分布式的搜索和分析引擎，用于日志的存储,搜索,分析,查询。Logstash是一个数据收集、转换和传输工具，用于收集过滤和转换数据，然后将其发送到Elasticsearch或其他目标存储中。Kibana是一个数据可视化平台，通过与Elasticsearch的集成，提供了强大的数据
Linux 服務器上安裝和配置 ELK 堆棧（Elasticsearch、Logstash 和 Kibana）蠟筆小新工程師 jenkins 运维
1.安裝Elasticsearch更新您的系統軟件包並安裝必要的工具：bashsudoapt-getupdatesudoapt-getinstallapt-transport-httpsca-certificateswgetcurlgnupg將Elasticsearch的GPG密鑰添加到系統：bashwget-qO-https://artifacts.elastic.co/GPG-KEY-elas
ELK（elasticsearch-7.17.4-windows-x86_64+logstash-7.17.4-windows-x86_64+kibana-7.17.4-windows-x86_64） LongtengGensSupreme elk elasticsearch 大数据
1、下载ELK（elasticsearch-7.17.4-windows-x86_64+logstash-7.17.4-windows-x86_64+kibana-7.17.4-windows-x86_64）2、解压elasticsearch-7.17.4-windows-x86_64，config目录下修改elasticsearch.yml文件，修改elasticsearch.yml内容如下：#
Doris 数据集成 Kafka 不二人生 Doris 实战 doris 数据仓库
Doris数据集成Kafka这是我们Doris数据集成篇的第二篇，前面我们介绍过通过Catalog进行集成的例子Doris基础篇—数据集成Catalog目前公司的很多数据服务都开始使用Doris了，目前使用下来感觉还是很方便的，比起Hadoop那一套少了很多运维的成本，而且整体的效率也不错，现在也要把ELK那一套日志分析的替换掉，后面日志分析也走Doris。关于如何使用Doris做日志分析，可以参
ELK —— Logstash 将 MySQL 数据同步至 ElasticSearch 2301_82242204 程序员 elk mysql elasticsearch
一、搭建环境1.0环境依赖1.1搭建ElasticSearch环境1.1.1ElasticSearch简介1.1.2启动ElasticSearch1.2Logstash（多数据源采集系统）1.3Kibana（可视化面板）二、Logstash配置2.1配置数据库连接2.2配置同步ES2.3重新启动三、下一步更新计划Author：GoritDate：2021/4/7Refer：各种同类文章参考融合+自
Redis学习笔记 ——（3）哈希结构的用法、内部编码、使用场景码农小高 Redis redis 哈希算法学习
Redis学习笔记——（3）哈希结构的用法、内部编码、使用场景几乎所有的编程语言都提供了哈希（hash）类型，他们的叫法可能是哈希、字典、关联数组等。在Redis中，哈希类型是指键值本身又是一个键值对结构，例如value={{filed,value},…{filedn,valuen}}.1.哈希的用法HDELkeyfield1[field2]删除一个或多个哈希表字段HEXISTSkeyfield查
部署Wordpress(LNMP)+ELK 多练项目 Linux 系统架构 linux elk 运维
LNMP+EFK主机软件服务版本主机名192.168.100.100Nginx-1.18、Filebeatnode100192.168.100.101PHP-5.6.27node101192.168.100.102MySQL5.7node102192.168.100.103Kafkakafka103192.168.100.104Kafkanode104192.168.100.105Kafkanod
ELK接入SpringBoot【Docker Compose】 bilibilidicks elk spring boot docker
安装Docker-Composecurl-Lhttps://github.com/docker/compose/releases/download/1.17.1/docker-compose-`uname-s`-`uname-m`-o/usr/local/bin/docker-compose随便找个地，创建docker-compose.yml文件，把这坨文本复制进去version:'3'servi
elk+redis+logstash+kibana保姆式教程 weixin_51711897 elk redis jenkins
主机名ip描述elasticsearch-1192.168.5.94es集群elasticsearch-2192.168.5.95es集群elasticsearch-1192.168.5.96es集群redis192.168.5.97redis存储收集日志logstash192.168.5.98将redis数据传到es中kibana192.168.5.99将日志数据显示出来报错Couldnotin
windows10 ELK保姆级教程以及踩坑记录适用于新版8.1.3 bug柯南 ELK java
elk其实就是ElasticSearch（ES）、Logstash和Kibana三个开源的工具组成。1.ES是个开源的分布式搜索引擎，它的特点是：分布式、零配置、自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。2.Logstash是一个完全开源的工具，开源对日志进行收集、分析、并将其储存以后使用。3.Kibana也是一个完全开源的免费的工具，它为Logsta
如何收集k8s pod的服务日志（rancher）一方有点方 kubernetes rancher 容器
一、环境情况说明当前环境是k8s+rancher+filebeat+es+kibana本文只讲解部署filebeat收集容器日志的过程、使用daemonset的方式部署filebeat，es+kibana+k8s已提前创建好的二、部署安装1、在已创建完成的k8s环境中，用kubectl先创建一个命名空间elk-log，新增一个filebeat目录,上传一下4个代码文件filebeat.daemon
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不