EricFRQ

ElasticSearch学习使用(含ELK)

ElasticSearch学习使用

一、基础概念
二、安装使用
三、其他概念
四、分词（ik分词器）的使用
五、Springboot项目使用
- 1、原生驱动操作es，灵活操作es语句
- 2、spring-boot-starter-data-elasticsearch使用，规范es增删改查接口
六、
十三、ES常用查询语句总结
十四、ELK环境搭建
- ①、logstash采集日志
- - 案例一：采集tomcat或springboot工程log
  - 案例二：采集nginx日志
  - 案例三：采集自定义json文件
- ②、metricbeat监控服务器，采集服务器数据
- ③启动elasticsearch-head，访问http://localhost:8080/elasticsearch-head/
- ④启动elasticsearch-curator，管理es索引，清理es过期数据
十五、logstash采集数据延迟八小时

一、基础概念

ES的每个版本差别很大，在ES7之前，使用的是下面的架构：
跟mysql相比，索引=库名、类型=表名、文档=数据

ES7版本之后

二、安装使用

安装ElasticSearch和可视化界面kibana。
Windows开箱即用，增删改查皆为restful接口

如果需要用真实IP而不仅仅是localhost连接ES，则需要修改一下config下的elasticsearch.yml内容

如果要给es加密码，参考设置elasticsearch 7.x用户名和密码
安装成功后直接启动，访问http://localhost:9200和http://localhost:5601，分别出现以下界面表示成功
利用postman测试添加数据

添加使用post和put（一定要带ID）请求都可以，es6版本格式为http://localhost:9200/索引/类型/(可选参数文档ID)，参数为文档（跟mysql相比索引=库名、类型=表名、文档=数据）

返回结果

es7之后不用指定类型了http://localhost:9200/索引/(可选参数文档ID)，可以使用映射指定存储的数据类型

测试查询

根据ID查询某一条：格式为http://localhost:9200/索引/类型/ID
根据条件检索 customer/_search?q=*&sort=age:asc，其他API参照https://www.elastic.co/guide/en/elasticsearch/reference/current/getting-started.html#qs-search-data

测试更新
删除（不可删除类型，就像MySQL只能删除库和数据，不能删除表一样）
批量插入,bulk批量API
格式为http://localhost:9200/索引/类型/_bulk

用kibanad的dev tools测试批量插入

三、其他概念

聚合（avg）映射（mapping）等
参考官方文档：elastic search官方文档

简单说明：（映射）mapping：我理解的就相当于mysql的表结构

创建映射
更新映射。要求更新映射后数据不变，比如修改某个映射从integer改成text
（1）先新建新的索引

（2）再查看原映射关系，Ctrl+C\V粘贴映射关系，没有直接更新映射还保持数据的方法

（3）迁移数据命令

四、分词（ik分词器）的使用

（1）下载跟据es版本下载对应ik并解压到如下目录下

（2）下载并启动nginx，在nginx下建自定义分词文件，目录如下

访问地址http://localhost/ElasticSearch/fenci.txt能看到数据
（3）在分词器插件里修改配置


（4）重启es，再次请求

POST _analyze
{
  "analyzer": "ik_max_word",
  "text": "艾瑞克电商项目"
}

可以看到自定义分词已经成功

五、Springboot项目使用

1、原生驱动操作es，灵活操作es语句

引入依赖


<dependency>
    <groupId>org.elasticsearch.clientgroupId>
    <artifactId>elasticsearch-rest-high-level-clientartifactId>
    <version>7.13.4version>
dependency>

新建config包下的ElasticSearchconfig，编写配置，给spring容器中注入一个RestHighLevelClient，具体代码内容如下
更多解释参考官方文档

import org.apache.http.HttpHost;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class ElasticSearchConfig {

    @Bean
    RestHighLevelClient esRestClient(){
        RestHighLevelClient client = new RestHighLevelClient(
                RestClient.builder(
                        new HttpHost("localhost", 9200, "http"),
                        new HttpHost("localhost", 9201, "http")));
        return client;
    }
}

如果需要安全验证，在每次请求时都带上请求头，就在上面的配置类里加上
，更多内容参考官方文档

import org.apache.http.HttpHost;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class GulimallElasticSearchConfig {

    @Bean
    RestHighLevelClient esRestClient(){
        RestHighLevelClient client = new RestHighLevelClient(
                RestClient.builder(
                        new HttpHost("localhost", 9200, "http"),
                        new HttpHost("localhost", 9201, "http")));
        return client;
    }

    public static final RequestOptions COMMON_OPTIONS;
    static {
        RequestOptions.Builder builder = RequestOptions.DEFAULT.toBuilder();
//        builder.addHeader("Authorization", "Bearer " + TOKEN);
//        builder.setHttpAsyncResponseConsumerFactory(
//                new HttpAsyncResponseConsumerFactory
//                        .HeapBufferedResponseConsumerFactory(30 * 1024 * 1024 * 1024));
        COMMON_OPTIONS = builder.build();
    }
}

测试使用
（1）测试添加。更多内容参考官方文档

@Test
    void test() throws IOException {

        IndexRequest indexRequest=new IndexRequest("user");
        indexRequest.id("1");
        String jsonStr="{\"name\":\"Eric FRQ\",\"age\":23}";
        indexRequest.source(jsonStr, XContentType.JSON);
        IndexResponse index = client.index(indexRequest, GulimallElasticSearchConfig.COMMON_OPTIONS);
        System.out.println(index);
    }

（2）测试批量添加。更多内容参考官方文档

    @Test
    void testBulkAdd() throws IOException {
        BulkRequest request = new BulkRequest();
        request.add(new IndexRequest("user").id("2")
                .source("{\"name\":\"Stefan Zhou\",\"age\":53}",XContentType.JSON));
        request.add(new IndexRequest("user").id("3")
                .source("{\"name\":\"Bulus Li\",\"age\":63}",XContentType.JSON));
        request.add(new IndexRequest("user").id("4")
                .source("{\"name\":\"Jack Chen\",\"age\":55}",XContentType.JSON));
        client.bulk(request, GulimallElasticSearchConfig.COMMON_OPTIONS);
    }

（3）测试检索。更多内容参考官方文档

 @Test
    void testSearch() throws IOException {
        SearchRequest searchRequest = new SearchRequest();
        //索引
        searchRequest.indices("user");
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        //searchSourceBuilder.query(QueryBuilders.matchQuery("name","Eric"));
        //按照年龄聚合
        TermsAggregationBuilder size = AggregationBuilders.terms("aggAgg").field("age").size(3);
        searchSourceBuilder.aggregation(size);
        //按照年龄平均值聚合
        AvgAggregationBuilder field = AggregationBuilders.avg("balanceAvg").field("age");
        searchSourceBuilder.aggregation(field);
        
        searchRequest.source(searchSourceBuilder);
        SearchResponse search = client.search(searchRequest, GulimallElasticSearchConfig.COMMON_OPTIONS);
        System.out.println(search.toString());
    }

（4）一个复杂查询的案例：

2、spring-boot-starter-data-elasticsearch使用，规范es增删改查接口

1、引入依赖

        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-starter-data-elasticsearchartifactId>
        dependency>

2、application文件加上配置

spring.elasticsearch.rest.uris=http://localhost:9200
spring.elasticsearch.rest.username=admin
spring.elasticsearch.rest.password=123456

3、实体类加上@Document(indexName = "location", type = "geo_point")，其中indexName为索引名称，type为映射类型，如果有空间数据geo_point的话，需要声明为GeoPoint类并且加上注解 @GeoPointField

package com.domain.module.geocode.geosearch.entity;

import org.springframework.data.elasticsearch.annotations.Document;
import org.springframework.data.elasticsearch.annotations.GeoPointField;
import org.springframework.data.elasticsearch.core.geo.GeoPoint;

import javax.persistence.Entity;
import javax.persistence.Table;

/**
 * @ClassName: ModelEntity
 * @描述: shp存es
 * @author: Eric
 * @date: 2021年10月9日
 */
@Document(indexName = "location", type = "geo_point")
public class ShpEntity {

    @GeoPointField
    private GeoPoint location;

    private String text;
    private String id;

    public GeoPoint getLocation() {
        return location;
    }

    public void setLocation(GeoPoint location) {
        this.location = location;
    }

    public String getText() {
        return text;
    }

    public void setText(String text) {
        this.text = text;
    }

    public String getId() {
        return id;
    }

    public void setId(String id) {
        this.id = id;
    }
}

4、Dao层继承ElasticsearchRepository

package com.domain.module.geocode.geosearch.dao;

import com.domain.framework.dao.BaseDao;
import com.domain.module.geocode.geosearch.entity.ShpEntity;
import org.springframework.data.elasticsearch.repository.ElasticsearchRepository;
/**
 * @author: Eric
 * @date: 2021年11月4日
 */
public interface ShpDao extends ElasticsearchRepository<ShpEntity, String> {

    //自定义查询语句
    @Query("{\"bool\" : {\"must\" : {\"field\" : {\"firstCode.keyword\" : \"?\"}}}}")
    Page<DocBean> findByFirstCode(String firstCode, Pageable pageable);

    @Query("{\"bool\" : {\"must\" : {\"field\" : {\"secordCode.keyword\" : \"?\"}}}}")
    Page<DocBean> findBySecordCode(String secordCode, Pageable pageable);
}

5、service层使用

    @Autowired
    ShpDao shpDao;
    //这里基本的增删改查和jpa、mybaitisplus都一样
    shpDao.saveAll(list);

六、

十三、ES常用查询语句总结

查看所有索引：GET /_cat/indices
创建索引tomcat-logstash：put tomcat-logstash
查询某索引元数据、数据类型：get tomcat-logstash
删除某索引：DELETE springboot-logstash-2021.09.22
查询某索引存入的数据：get /tomcat-logstash/_search
es开启可动态创建索引

PUT /_cluster/settings
{
    "persistent" : {
        "action": {
          "auto_create_index": "true"
        }
    }
}

7.聚合查询text类型字段时候，不支持text做为查询字段，需要将类型设置下
比如username字段，也可以直接将查询的字段加上.keyword关键字

#方案一：设置此字段可以聚合查询再做普通查询
# 设置
PUT /action-log-*/_mapping
{
  "properties": {
    "username": {
      "type": "text",
      "fielddata": true
    }
  }
}
# 查询
POST action-log-*/_search
{
  "aggs": {
    "username": {
      "terms": {
        "field": "username"
      }
    }
  }
}
#方案二：直接在查询字段上加上.keyword关键字
POST action-log-*/_search
{
  "aggs": {
    "username_agg": {
      "terms": {
        "field": "username.keyword",
        "order": {
          "_key": "desc"//跟据key值倒序
        },
        "size": 10//分组后查询十条
      }
    }
  }
}

8.嵌套多聚合查询，实现按照日期date字段分组，并在分组后的数据基础上对耗时time字段再次进行分组，最后显示分组后的日期date、出现的次数、第二次分组的耗时time字段和出现的次数

POST action-log-*/_search
{
  "aggs": {
    "date_agg": {
      "terms": {
        "field": "date.keyword",
        "order": {
          "_key": "desc"
        }
      },
      "aggs": {
        "time_agg": {
          "terms": {
            "field": "time.keyword"
          }
        }
      }
    }
  }
}
//======执行结果如下=========
{
    "aggregations": {
        "date_agg": {
            "doc_count_error_upper_bound": 0,
            "sum_other_doc_count": 0,
            "buckets": [
                {
                    "key": "2022-05-12",
                    "doc_count": 8,
                    "time_agg": {
                        "doc_count_error_upper_bound": 0,
                        "sum_other_doc_count": 0,
                        "buckets": [
                            {
                                "key": "1",
                                "doc_count": 6
                            },
                            {
                                "key": "3",
                                "doc_count": 2
                            }
                        ]
                    }
                },
                {
                    "key": "2022-05-11",
                    "doc_count": 1,
                    "time_agg": {
                        "doc_count_error_upper_bound": 0,
                        "sum_other_doc_count": 0,
                        "buckets": [
                            {
                                "key": "1000",
                                "doc_count": 1
                            }
                        ]
                    }
                },
                {
                    "key": "2022-05-10",
                    "doc_count": 1,
                    "time_agg": {
                        "doc_count_error_upper_bound": 0,
                        "sum_other_doc_count": 0,
                        "buckets": [
                            {
                                "key": "999",
                                "doc_count": 1
                            }
                        ]
                    }
                }
            ]
        }
    }
}

复杂查询案例：

# 按时间范围查询
post tomcat-logstash/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "range": {
            "@timestamp": {
              "gte": "2021-02-01 00:40:39",
              "lte": "2021-12-21 23:42:59",
              "format": "yyyy-MM-dd HH:mm:ss",
              "time_zone": "+08:00"
            }
          }
        }
      ]
    }
  },
  "size": 0,
  "aggs": {
    "groups": {
      "terms": {
        "field": "@timestamp",
        "size":3,
        "order" : {  "_count" : "desc" }
      }
    }
  }
}

# 按时间范围查询并将时间数据格式化yyyy-MM-dd HH:mm:ss
post /tomcat-logstash/_search
{
    "query": {
        "bool": {
            "must": [
                {
                    "range": {
                        "accessTime": {
                            "format": "yyyy-MM-dd HH:mm:ss"
                        }
                    }
                }
            ]
        }
    },
    "script_fields": {
        "@timestamp": {
            "script": {
                "lang": "painless",
                "inline": "doc['@timestamp'].value.toString('yyyy-MM-dd HH:mm:ss')"
            }
        }
    }
}

# 将存在metricset.name.actual.free的数据按时间倒序查询出来
post /metricbeat-*/_search
{
    "query": {
        "exists": {
            "field": "metricset.name.actual.free"
        }
    },
    "from": 1,
    "size": 2,
    "sort": [
        {
            "timestamp": {
                "order": "desc"
            }
        }
    ]
}

# 将"metricset.name"等于 "memory"的数据按时间倒序查出来
post /metricbeat-*/_search
{
    "query": {
        "match_phrase": {
            "metricset.name": "memory"
        }
    },
    "from": 1,
    "size": 1,
    "sort": [
        {
            "timestamp": {
                "order": "desc"
            }
        }
    ]
}

# 将"system.filesystem.mount_point"等于"C"
# 并且"system.filesystem.mount_point"等于"D"
# 并且"metricset.name"等于"filesystem"的数据查出五条来
post /metricbeat-*/_search 
{
    "query": {
        "bool": {
            "should": [
                {
                    "match_phrase": {
                        "system.filesystem.mount_point": "C"
                    }
                },
                {
                    "match_phrase": {
                        "metricset.name": "filesystem"
                    }
                },
                {
                    "match_phrase": {
                        "system.filesystem.mount_point": "D"
                    }
                }
            ]
        }
    },
    "from": 1,
    "size": 5
}

# 在10条数据内，以system.filesystem.device_name.keyword分组
# 查询system.filesystem.total的数据
post /metricbeat-*/_search     
{
    "size": 0,
    "query": {
        "match_phrase": {
            "metricset.name": "filesystem"
        }
    },
    "aggs": {
        "system.filesystem.device_name.keyword": {
            "terms": {
                "field": "system.filesystem.total",
                "size": 10,
                "order": {
                    "_count": "asc"
                }
            }
        }
    }
}

#跟据经纬度查名称
GET location/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match_all": {}
        }
      ],
      "filter": [
        {
          "geo_distance": {
            "distance": "1m",
            "location": {
              "lat": 31.33255,
              "lon": 118.89937
            }
          }
        }
      ]
    }
  }
}
#跟据多个经纬度查多个名称
GET location/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "geo_distance": {
            "distance": "0.1m",
            "location": {
              "lat": "30.178091",
              "lon": "111.772789"
            }
          }
        },{
          "geo_distance": {
            "distance": "0.1m",
            "location": {
              "lat": "30.69611",
              "lon": "111.285332"
            }
          }
        }
      ]
    }
  }
}

#跟据矩形范围查范围内的点
POST /location/_search
{
  "query": {
    "geo_bounding_box": {
      "location": {
        "top_left": {
          "lat": 31.33255,
          "lon": 118.89937
        },
        "top_right":{
          "lat" : 31.228873,
         "lon" : 121.451312
        },
        "bottom_right": {
          "lat": 30.63613,
          "lon": 114.392626
        },
        "bottom_left": {
           "lat" : 31.174893,
            "lon" : 121.499176
        }
      }
    }
  },
  "from": 0,
  "size": 3
}

#跟据名称和经纬度共同筛选地点
POST location/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match_phras": { "text": "南京"}
        }
      ],
      "filter": [
        {
          "geo_distance": {
            "distance": "0.1m",
            "location": {
               "lat" : 32.092119,
            "lon" : 118.516568
            }
          }
        }
      ]
    }
  }
}

#跟据名称和经纬度范围共同筛选点
POST location/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match_phrase": {
            "text": "南京"
          }
        }
      ],
      "filter": [
        {
          "geo_bounding_box": {
            "location": {
              "top_left": {
                "lat": 31.33255,
                "lon": 118.89937
              },
              "top_right": {
                "lat": 31.228873,
                "lon": 121.451312
              },
              "bottom_right": {
                "lat": 30.63613,
                "lon": 114.392626
              },
              "bottom_left": {
                "lat": 31.174893,
                "lon": 121.499176
              }
            }
          }
        }
      ]
    }
  },
  "from": 0,
  "size": 3
}

#跟区域和经纬度范围共同筛选点并将最大数据量全部查询出来，而不是默认的10000
{
  "query": {
    "bool": {
      "should": [{
          "match_phrase": {
            "area": "高淳区"
          }
        }
      ],
      "filter": [
        {
          "geo_bounding_box": {
            "location": {
              "top_left": {
                "lat": 32.092119,
                "lon": 118.516568
              },
              "top_right": {
                "lat": 38.022301,
                "lon": 114.464499
              },
              "bottom_right": {
                "lat": 39.126758,
                "lon": 117.202227
              },
              "bottom_left": {
                "lat": 31.329422,
                "lon": 118.881401
              }
            }
          }
        }
      ]
    }
  },
  "from": 0,
  "size": 10,
"track_total_hits":true #去掉一万条的限制
}

# 跟据名称查经纬度
POST /location/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match_phrase": {
            "text": "高淳"
          }
        }
      ]
    }
  },
  "from": 0,
  "size": 30
}

# 跟据多个名称完全匹配查经纬度
post /location/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match_phrase": {
            "text": "蔡甸区奓山街"
          }
        },
        {
          "match_phrase": {
            "text": "黄陂"
          }
        }
      ]
    }
  },
  "from": 0,
  "size": 100
}

# 跟据多个名称模糊匹配查经纬度
post /location/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match_phrase": {
            "text": "蔡甸区奓山街"
          }
        },
        {
          "match_phrase": {
            "text": "黄陂"
          }
        }
      ]
    }
  },
  "from": 0,
  "size": 100
}

查询品牌名称为”华为“,并且品牌类型id为225，其中，must参与评分，filter不参与评分

排序和范围查询

如果数据类型是nested，则直接检索是检索不出来的，需要使用nested包含

设置查询后must中匹配到的数据在另一个属性中高亮显示

聚合分析语句（分组查询）

通过catalogId聚合

聚合嵌套，分组查询后再查询此数据的某属性，可嵌套一次聚合

如果聚合数据的类型是嵌入式nested，查询、聚合、分析都得用嵌入式

十四、ELK环境搭建

①、logstash采集日志

案例一：采集tomcat或springboot工程log

1、官网下载、解压、使用。我这里使用的都是7.13.0版本。

1、elasticsearch（存放数据）、
2、metricbeat（监控服务器cpu、内存等）、
3、kibana（界面化工具，对es的操作等）、
4、Logstash（日志采集）、
5、elasticsearch-head（数据展示，比kibana更直观）
6、elasticsearch-curator（es数据索引管理工具，用于定期清理es索引数据等）

2、按序启动

1、es，在ELK\elasticsearch-7.13.0\bin下双击elasticsearch.bat

2、kibana，在\ELK\kibana-7.13.0-windows-x86_64\bin下双击kibana.bat

3、logstash，在ELK\Logstash\bin下新建logstash.conf，粘贴如下内容。
在Logstash\bin下cmd输入命令logstash -f logstash.conf
说明：input.file.path=项目的日志文件路径，比如tomcat日志或者springboot输出到文件的日志

logstash.conf内容如下

如果生成固定es的索引，参考下面配置

# Sample Logstash configuration for creating a simple
# Beats -> Logstash -> Elasticsearch pipeline.

input {
    file{
        path =>"E:/Work/2021/target/logs/access_log.*.log"
        type => "tomcat_access_log"
        start_position=>"beginning"
    }
}

input {
 beats {
        port => "5044"
        type => "metricbeat"
    }
}

filter{
    grok{
        match=>{
            "message"=>"%{DATA:ip} - - \[%{HTTPDATE:accessTime}\] \"%{DATA:method} %{DATA:access} %{DATA:httpversion}\" %{DATA:retcode} %{DATA:flow} %{DATA:retTime} \"%{DATA:fromHtml}\" \"%{DATA:useragent}\""
        }

        remove_field=>"message"
        remove_field=> "path"
    }
    date{
        match=>["accessTime","yyyy-MM-dd-HH:mm:ss"]
    }

 ruby { 
    code => "event.set('timestamp', event.get('@timestamp').time.localtime + 8*60*60)" 
  }
  mutate {
    remove_field => ["@timestamp","ecs"]
  }
}

output {
if "tomcat_access_log" in [type] {
 elasticsearch {
    hosts => ["http://127.0.0.1:9200"]
    index => "tomcat-logstash"
  }
}

if "metricbeat" in [type] {
 elasticsearch {
    hosts => ["http://127.0.0.1:9200"]
    index => "metricbeat-logstash"
  }
}
 
}

如果要生成es带时间戳的索引，参考下面配置：(如果要索引后面加时间戳，一定要有@timestamp字段，所以注释掉了删除此字段的配置)

# Sample Logstash configuration for creating a simple
# Beats -> Logstash -> Elasticsearch pipeline.

input {
    file{
        path =>"E:/Work/2021/target/logs/access_log.*.log"
        type => "tomcat_access_log"
        start_position=>"beginning"
    }
}

input {
 beats {
        port => "5044"
        type => "metricbeat"
    }
}

filter{
    grok{
        match=>{
            "message"=>"%{DATA:ip} - - \[%{HTTPDATE:accessTime}\] \"%{DATA:method} %{DATA:access} %{DATA:httpversion}\" %{DATA:retcode} %{DATA:flow} %{DATA:retTime} \"%{DATA:fromHtml}\" \"%{DATA:useragent}\""
        }

        remove_field=>"message"
        remove_field=> "path"
    }
    date{
        match=>["accessTime","yyyy-MM-dd-HH:mm:ss"]
    }

 ruby { 
    code => "event.set('timestamp', event.get('@timestamp').time.localtime + 8*60*60)" 
  }
  #mutate {
    #remove_field => ["@timestamp","ecs"]
  #}
}

output {
if "tomcat_access_log" in [type] {
 elasticsearch {
    hosts => ["http://127.0.0.1:9200"]
    index => "tomcat-logstash-%{+YYYY.MM.dd}"
  }
}

if "metricbeat" in [type] {
 elasticsearch {
    hosts => ["http://127.0.0.1:9200"]
    index => "metricbeat-logstash-%{+YYYY.MM.dd}"
  }
}
 
}

补充说明：（配置属性说明：start_position
是监听的位置，默认是end，即一个文件如果没有记录它的读取信息，则从文件的末尾开始读取，也就是说，仅仅读取新添加的内容。对于一些更新的日志类型的监听，通常直接使用end就可以了；相反，beginning就会从一个文件的头开始读取。但是如果记录过文件的读取信息，这个配置也就失去作用了。）

案例二：采集nginx日志

1、修改nginx配置，使nginx的日志按天保存，打开nginx.conf,在http标签内添加以下内容

修改前：

log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';

修改后：

    log_format  main  '$remote_addr - $remote_user [$time_iso8601] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';

    access_log  logs/access.log  main;

然后在server标签里添加：

if ($time_iso8601 ~ '(\d{4}-\d{2}-\d{2})') {
                set $time $1;
		}
		access_log  logs/$time.access.log  main;

完整配置（参考）：

user  root;
worker_processes  1;

#error_log  logs/error.log;
#error_log  logs/error.log  notice;
error_log  logs/error.log  debug;

#pid        logs/nginx.pid;


events {
    worker_connections  1024;
}


http {
    include       mime.types;
    default_type  application/octet-stream;

    log_format  main  '$remote_addr - $remote_user [$time_iso8601] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';

    #access_log  logs/$tttt.access.log  main; 

    access_log  logs/access.log  main;

    sendfile        on;
    #tcp_nopush     on;

    #keepalive_timeout  0;
    keepalive_timeout  65;

    #gzip  on;
	
	upstream testTomcat{
        server 192.168.175.170:8880 weight=1;
        server 192.168.175.171:8880 weight=1;
	}
	
    server {
        listen       8888;
        server_name  localhost;

        #charset koi8-r;

	   if ($time_iso8601 ~ '(\d{4}-\d{2}-\d{2})') {
                set $time $1;
        }
        access_log  logs/$time.access.log  main;
        #access_log  logs/host.access.log  main;

        location / {
            #root   html;
            #index  index.html index.htm;#root   html;
            index  index.html index.htm;
            proxy_pass http://testTomcat/ssm/;
        }
    }
}

测试效果：这时启动nginx，访问地址后可以看到日志文件已经按天分开了

2、logstash采集，和采集tomcat日志一样的，修改下logstash的配置即可，如下图。
说明：input {file{path =>"F:/nginx/logs/*.access.log"这里改成nginx的log存放文件，如果同时采集tomcat和nginx，
直接将下面的input标签配置和output标签配置追加进去即可

# Sample Logstash configuration for creating a simple
# Beats -> Logstash -> Elasticsearch pipeline.

input {
    file{
        path =>"F:/nginx/logs/*.access.log"
        type => "nginx_access_log"
        start_position=>"beginning"
    }
}

filter{
    grok{
        match=>{
            "message"=>"%{DATA:ip} - - \[%{HTTPDATE:accessTime}\] \"%{DATA:method} %{DATA:access} %{DATA:httpversion}\" %{DATA:retcode} %{DATA:flow} %{DATA:retTime} \"%{DATA:fromHtml}\" \"%{DATA:useragent}\""
        }

        remove_field=>"message"
        remove_field=> "path"
    }
    date{
        match=>["accessTime","yyyy-MM-dd-HH:mm:ss"]
    }

 ruby { 
    code => "event.set('timestamp', event.get('@timestamp').time.localtime + 8*60*60)" 
  }
  #mutate {
    #remove_field => ["@timestamp","ecs"]
  #}
}

output {
	if "nginx_access_log" in [type] {
	 elasticsearch {
		hosts => ["http://127.0.0.1:9200"]
		index => "nginx-logstash-%{+YYYY.MM.dd}"
	  }
	}
}

测试效果，启动logstash输入命令：logstash -f logstash.conf
用elasticsearch-head看下数据

案例三：采集自定义json文件

新建json文件，每条自己的json数据得换行，比如下图：

2.启动配置 logstash.conf的编写，内容如下：只用添加第二个input（#库管操作记录收集），output第二个（if "datahub_action_log" in [type]），其他的配置都是采集nginx日志的配置，包括filter{}的全部内容，不用管

input{
    file{
        path =>"${LOGSTASH_HOME}/logs/access-*.log"
        type => "tomcat_access_log"
        start_position=>"beginning"
    }

}
#库管操作记录收集
input {
    file{
        path =>"${LOGSTASH_HOME}/logs/action-log-*.log"
        type => "datahub_action_log"
		codec => json {
            charset => "UTF-8"
		}    
        start_position=>"beginning"
    }
}

output{
	if "tomcat_access_log" in [type] {
		elasticsearch {
			hosts => ["localhost:9200"]
			index => "filebeat-log"
		}
		# stdout { codec => rubydebug } 
	}
	
	if "datahub_action_log" in [type] {
		 elasticsearch {
			hosts => ["localhost:9200"]
			index => "action-log-%{+YYYYMMdd}"
		  }
	}
   
}

filter {
        grok{
            match=>{
                "message"=>"%{DATA:client_ip} - - \[%{HTTPDATE:timestamp}\] \"%{DATA:request_method} %{DATA:request_url} %{DATA:httpversion}\" %{DATA:status_code} %{DATA:bytes} %{DATA:response_time} \"%{DATA:referrer}\" \"%{DATA:agent}\""
            }
        }

        grok {
             match => { "request_url" => [ "request_url", "%{URIPATH:url_path}%{URIPARAM:url_params}?" ]}
        }

        if "role" in [message] and "username" in [message] {
            mutate {
                add_field => { 
                    "log_type" => "operation"
                }
            }
        }else{
            mutate { 
                add_field => { 
                    "log_type" => "access"
                }
            }
        }

        if "\x" in [message]{
            drop {}
        }

        mutate {
            rename => { "verb" => "request_method" }
            rename => { "request" => "request_url" }
            rename => { "clientip" => "client_ip" }
            rename => { "response" => "status_code" }
            rename => { "host" => "host_info" }
            convert => [ "bytes","integer" ]
            convert => [ "response_time","integer" ]
            convert => [ "status_code","integer" ]
            gsub =>  ["url_params","\?","" ]
        }

        urldecode{
            field  => "url_path"
        }
        urldecode{ 
            field  => "url_params"
        }
        urldecode{ 
            field  => "url_params_hash"
        }

        kv {
            field_split => "&"
            source => "url_params"
            target => "url_params_hash"
        }

		date {
            match => [ "timestamp" , "dd/MMM/yyyy:HH:mm:ss Z" ]
        }
}

②、metricbeat监控服务器，采集服务器数据

1、metricbeat，在上面三个都启动好了之后，编辑metricbeat.yml，搜索关键字Output，关闭直接输出到es的配置，如下图

2、搜索关键字Logstash Output，打开输出到logstash，使用端口5044，和上面的logstash.conf5044对应上，如下图

3、在ELK\metricbeat-7.13.0-windows-x86_64下cmd输入 metricbeat.exe -e

③启动elasticsearch-head，访问http://localhost:8080/elasticsearch-head/

1、将elasticsearch-head丢到tomcat的webapp下，直接启动tomcat即可
2、开启es动态创建索引，这样logstash就能跟据配置动态创建索引了

PUT /_cluster/settings
{
    "persistent" : {
        "action": {
          "auto_create_index": "true"
        }
    }
}

访问路径后页面如下：

④启动elasticsearch-curator，管理es索引，清理es过期数据

1、下载elasticsearch-curator
官网地址：https://packages.elastic.co/curator/5/windows/elasticsearch-curator-5.8.4-amd64.msi

2、安装。安装目录自选（说明：此安装其实就相当于一个解压过程，安装后的文件夹随意拷贝到其他服务器就能直接用），安装成功后是个文件夹elasticsearch-curator，然后手动创建下面两个文件config.yml、action.yml

3、配置
官网config,yml配置如下，无特殊需求，直接粘贴即可使用

client:
  hosts:
    - 127.0.0.1
  port: 9200
  url_prefix:
  use_ssl: False
  certificate:
  client_cert:
  client_key:
  ssl_no_validate: False
  http_auth:
  timeout: 30
  master_only: False

logging:
  loglevel: INFO
  logfile:
  logformat: default
  blacklist: ['elasticsearch', 'urllib3']

配置action.yml,内容如下；其中：
actions下的1、2代表多个事件动作，delete_indices代表删除索引事件，其他事件比如关闭索引、合并索引等事件参考官网 ==>action配置说明
description：此事件的描述
options：continue_if_exception遇到异常是否继续
filters：配置删除什么样子的索引，- filtertype:pattern的索引名称模型，kind: prefix索引的前缀，
value: tomcat-logstash-前缀值是什么， - filtertype: age过期时间设置，
timestring: '%Y.%m.%d'索引前缀后面的日期格式，unit: days过期时间的单位，unit_count: 1过期时间的值

actions:
  1:
    action: delete_indices
    description: >-
      Close indices older than 1days (based on index name), forlogstash-
      prefixed indices.
    options:
      continue_if_exception: False
      ignore_empty_list: True
      disable_action: False
    filters:
    - filtertype: pattern
      kind: prefix
      value: metricbeat-logstash-
    - filtertype: age
      source: name
      direction: older
      timestring: '%Y.%m.%d'
      unit: days
      unit_count: 1
  2:
    action: delete_indices
    description: >-
      Close indices older than 7days (based on index name), forlogstash-
      prefixed indices.
    options:
      continue_if_exception: False
      ignore_empty_list: True
      disable_action: False
    filters:
    - filtertype: pattern
      kind: prefix
      value: tomcat-logstash-
    - filtertype: age
      source: name
      direction: older
      timestring: '%Y.%m.%d'
      unit: days
      unit_count: 7

4、启动命令：curator --config config.yml action.yml
运行结果：两个事件动作都完成！

5、结果验证：可以看到设置删除时间为删除一天前的，我的索引metricbeat-logstash-2021.09.27已经被删除了
设置为七天前的，tomcat-logstash-2021.09.27、tomcat-logstash-2021.09.28两个都还在

十五、logstash采集数据延迟八小时

场景：
通过metricbeat收集服务器系统日志，metricbeat中的日志发送到kafka中
Logstash中的时间为格林威治时间，因此通过logstash采集到的数据和我们的时间会有8小时的时差
如果在后续代码中处理很有可能会处理遗漏掉，造成数据的时间错误。
版本
logstash 7.6.0
解决方案如下

input {
  tcp {
    mode => "server"
    host => "0.0.0.0"
    port => 4560
    codec => json_lines
  }
}
filter {
        ruby {
                code => "event.set('timestamp', event.get('@timestamp').time.localtime + 8*3600)"
        }
        ruby {
                code => "event.set('@timestamp',event.get('timestamp'))"
        }
        mutate {
                remove_field => ["timestamp"]
        }
}
output {
  elasticsearch {
    hosts => "localhost:9200"
    index => "springboot-logstash-%{+YYYY.MM.dd}"
  }
}

logstash生成文件名中的日期是从@timestamp字段的值中获取，通过设置filter将timestamp中的时间转换成系统时间，问题解决

你可能感兴趣的:(java高阶相关技术,elasticsearch,elk)

vue-cropper实现图片裁剪鸡吃丸子 vue.js 前端 javascript
一、什么是vue-cropper？Vue-Cropper是一个基于Vue.js的图片裁剪组件库，专为Web应用设计。当你在网上搜索的时候发现还有一个叫cropper的库，下面是他们的区别：特性cropper.jsvue-cropper框架依赖纯JavaScript，无框架依赖专为Vue.js设计包体积~200KB(含样式)~45KB(压缩后)API调用方式原生DOM操作Vue组件式API响应式支持
Flutter编译安卓应用时遇到的compileDebugJavaWithJavac和compileDebugKotlin版本不匹配的问题悠等生2018 前端 flutter android
记一次flutter应用，编译安卓时，报的一个compileDebugJavaWithJavac和compileDebugKotlin版本本匹配的问题。最终定位的原因是项目一来了audioplayers组件。audioplayers组件有依赖了audioplayers_android，它使用1.8编译的。版本过低。后来更新了audioplayers:^6.5.0(默认以来的audioplayers
Android补全计划 TextView添加删除线、下划线、更新字体等效果 Greenland_12 Android补全计划 android
1可在布局中直接更新可在布局中直接更新的：加粗、斜体、字体;其中字体文件需要放在res/font/your_font.ttf下2java动态设置需动态设置的:删除线、下划线，加粗和字体也可动态设置，且需要放于app/src/main/assets/fonts/xxx.ttf下java中txt1=((TextView)findViewById(R.id.txt1));txt2=((TextView)
金山wps支持java接口开发吗_金山wps开放平台使用踩坑实录
使用接口/v1/3rd/file/info获取excel文件信息时，发生获取文件信息失败错误GetFileInfoFailed原因排查：一、开放平台没有回调到接口，原因是回调接口url被对接项目的登录过滤器拦截到，没有登录对接项目不让访问接口，但是对接项目返回的提示登录信息在wps平台没有显示，解决：将回调接口的url前缀添加到对接项目过滤器的例外url前缀配置列表中，不让登录过滤器拦截到，这样，
华为OD机试 2025B卷 - 字符串序列判定(C++&Python&JAVA&JS&C语言) YOLO大师华为od 华为OD机试2025B卷华为OD2025B卷华为OD机试华为OD机考2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型题目描述：字符串序列判定/最后一个有效字符（本题分值100）输入两个字符串S和L，都只包含英文小写字母。S长度<=100，L长度<=500,000。判定S是否是L的有效子串。判定规则：S中的每个字符在L中都能找到（可以不连续），且S在Ｌ中字符的前后顺序与S中顺序要保持一致。（例如，S=”a
wpsOffice文件在线预览-java接入似夜晓星辰 java 初级 java wps
wpsOffice文件在线预览wpsoffice开发文档地址：https://wwo.wps.cn/docs/hint：申请服务通过后需填写回调地址，请填写你的服务器公网可访问的地址。并且项目需要部署到你的公网可访问的服务器上。一：添加model类由于官方demo是完全无需引入依赖的，所以可将model包下类直接复制到自己项目中//model类1@ComponentpublicclassAppli
华为OD机试E卷 - 分糖果（Java & Python& JS & C++ & C ）算法大师最新华为OD机试真题华为OD机试真题 (Java/JS/Py/C)java python javascript c++华为OD2025A卷华为od
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述小明从糖果盒中随意抓一把糖果，每次小明会取出一半的糖果分给同学们。当糖果不能平均分配时，小明可以选择从糖果盒中（假设盒中糖果足够）取出一个糖果或放回一个糖果。小明最少需要多少次（取出、放回和平均分配均记一次），能将手中糖果分至只剩一颗。输入描述抓取的糖果数（<10000000000）：15输出描述最少分至一颗糖果的次数
Java 并发编程：ReentrantLock原理与实战详解
一、引言在多线程编程中，线程安全始终是一个关键议题。Java在早期版本中提供了synchronized关键字作为内置锁机制，以支持基本的同步控制。然而，随着并发程序复杂度的提高，synchronized的局限性日益显现，主要体现在以下几个方面：功能受限：synchronized不支持尝试加锁、超时获取、可中断获取等高级功能。缺乏灵活性：一旦进入临界区就只能等待，无法主动退出。可观测性差：开发者无法
华为OD机试 2025B卷 - 小明减肥(C++&Python&JAVA&JS&C语言) YOLO大师华为od c++python 华为OD2025B卷华为OD机试华为机试2025B卷华为OD机试2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述小明有n个可选运动，每个运动有对应卡路里，想选出其中k个运动且卡路里和为t。k，t，n都是给定的。求出可行解数量输入描述第一行输入ntk第一行输入每个运动的卡路里按照空格进行分割备注00,00输出描述求出可行解
【华为OD机试真题 2025B卷】130、最多获得的短信条数、云短信平台优惠活动 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KFickle 最新华为OD机试(C++Java Py C JS)+OJ 华为od c++java javascript 华为OD机试真题 c语言最多获得的短信条数
文章目录一、题目题目描述输入输出样例1样例2二、代码与思路参考C++代码Java代码Python代码C语言代码JS代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题，使用C++，Java，Python，C语言，JS五种语言进行解答，每个题目都包含解题思路，五种语言的解法，每日持续更新中，订阅后支持开通在线OJ测试刷题！！！一次订阅永久享受更新，有代
【华为OD机试真题 2025B卷】128、判断一组不等式是否满足约束并输出最大差 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KFickle 最新华为OD机试(C++Java Py C JS)+OJ 华为od c++java 华为OD机试真题 c语言 javascript
文章目录一、题目题目描述输入输出样例1样例2二、代码与思路参考C++代码Java代码Python代码C语言代码JS代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题，使用C++，Java，Python，C语言，JS五种语言进行解答，每个题目都包含解题思路，五种语言的解法，每日持续更新中，订阅后支持开通在线OJ测试刷题！！！一次订阅永久享受更新，有代
proto3默认值与可选项代码羊羊 java java
proto3特性proto3相较于proto2支持更多语言但在语法上更为简洁。去除了一些复杂的语法和特性，更强调约定而弱化语法。删除原始值字段的presence字段逻辑，删除required字段以及删除默认值。这使得proto3更容易实现如在AndroidJava，ObjectiveC或Go等语言中的开放式结构化表示。移除unknown关键字.去掉extensions类型，使用Any新标准类型替换
AntDesignPro动态路由配置全攻略 bemyrunningdog 前后端
目录AntDesignPro前后端动态路由配置指南(TypeScript+Java)一、整体架构二、Java后端实现1.数据库设计(MySQL)2.实体类定义3.DTO对象4.服务层实现5.控制器三、前端实现(TypeScript)1.定义路由类型2.路由转换器3.应用配置(app.tsx)4.路由加载优化四、权限控制整合1.Java端权限检查2.前端权限整合五、部署优化方案六、生产环境建议七、完
Java高级工程师面试模拟：高并发电商秒杀系统设计与技术解析搞Java的小码农 Java技术场景题 Java 面试技术面试后端开发 Spring Redis Kafka
《Java高级工程师面试模拟：高并发电商秒杀系统设计与技术解析》场景设定面试地点：某互联网大厂的现代化办公区，面试室宽敞明亮，面试官坐在主位，表情严肃而专注，小兰则坐在对面，自信满满但内心略显紧张。第1轮：Java核心、基础框架与数据库问题1：Java中的ConcurrentHashMap是如何保证线程安全的？面试官：小兰，ConcurrentHashMap是Java中常用的线程安全集合，请简单说
怎么安装自定义分词器思静鱼 #elasticsearch es
安装自定义分词器的完整步骤在Elasticsearch中安装自定义分词器，通常需要修改索引配置或开发插件。以下是详细方法：一、基于配置实现自定义分词器（无需插件）适用于通过组合Elasticsearch内置的CharacterFilters、Tokenizers和TokenFilters实现的分词器。1.定义分词规则在创建索引时，通过settings.analysis配置自定义分词器：PUT/my
Docker快速部署Hive服务长路 ㅤ 运维 Docker配置 Hive环境大数据远程调试
文章目录前言Docker快速配置hive环境资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿里云平台优质作者、专注于Java后端技术领域。涵盖技术内容：Java后端、大数据、算法、分布式微服务、中间件、前端、运维等。博主所有博客文件目录索引：博客目录索引(持续更新)CSDN搜索：长路视频平台：b站-Coder长路Docker快速配置hive环境Ap
SpringBoot3+Vue3+AntDesign无人机场台管理系统 | 小蚂蚁云小蚂蚁开源后端 vue 架构低代码
项目介绍基于SpringBoot3、SpringSecurity、MybatisPlus、Vue3、TypeScript、Vite、AntDesign、MySQL等技术栈实现的单体前后端分离后台管理系统；后端基于Java语言采用SpringBoot3、SpringSecurity、MybatisPlus、MySQL等主流技术栈，前端基于Vue3、TypeScript、Vite等技术栈实现，采用An
Java 反射基础
文章目录反射：框架设计的灵魂一、获取Class对象的方式1、Class.forName("全类名")2、类名.class3、对象.getClass()注意：二、class对象功能1、获取成员变量们2、获取构造方法们3、获取成员方法们4、获取全类名三、Field：成员变量1、设置值2、获取值3、忽略访问权限修饰符的安全检查四、Constructor：构造方法1、创建对象：2、忽略访问权限修饰符的安全
java安全策略禁止反射_初探java安全之反射小宏i java安全策略禁止反射
什么是反射反射机制在java中可以说是非常强大的，很多优秀的开源框架都是通过反射完成的。在java的运行状态中，对于任意一个类，都能够知道这个类的所有属性和方法，都能够调用它的任意一个方法和属性，这种动态获取的信息以及动态调用对象的方法的功能称为java语言的反射机制。下面介绍下基于反射技术的函数方法。与反射相关的，其实主要就是几个关键的函数方法。可以先从这一段简单的代码看起publicvoide
java:实现温度转换（摄氏度和华氏度）（附带源码） Katie。 Java 实战项目 java 开发语言
1.项目背景详细介绍在软件开发中，温度转换是测量与控制系统、气象应用、物联网终端、科学计算等场景的基础功能之一。不同地区和行业习惯使用摄氏度（℃）或华氏度（℉）两种温标：摄氏度：以水的冰点0℃、沸点100℃划分为100等份；华氏度：以水的冰点32℉、沸点212℉划分为180等份。在Java项目中，需要提供准确、方便的温度转换工具类，以便在业务代码中随时调用。一个良好的温度转换组件应具备以下特点：支
【转载】python json
概念序列化（Serialization）：将对象的状态信息转换为可以存储或可以通过网络传输的过程，传输的格式可以是JSON、XML等。反序列化就是从存储区域（JSON，XML）读取反序列化对象的状态，重新创建该对象。JSON（JavaScriptObjectNotation）：一种轻量级数据交换格式，相对于XML而言更简单，也易于阅读和编写，机器也方便解析和生成，Json是JavaScript中的
Excel java 多线程导入
ExcelJava多线程导入优化在处理大量数据时，使用Excel进行数据导入是常见的需求。然而，当数据量庞大时，单线程读取和导入Excel文件会显得非常慢。为了解决这个问题，可以借助Java的多线程特性来优化导入速度。本文将介绍如何使用Java多线程技术来导入Excel数据，并提供代码示例。类图在实现多线程导入功能时，我们可以设计以下几个类。ExcelImporter+readExcel(file
SpringBoot-18-企业云端开发实践之web开发基础皮皮冰燃 SpringBoot spring boot 后端
文章目录1环境准备1.1Web应用概念介绍1.2开发环境配置2SpringBoot快速上手2.1SpringBoot介绍2.2新建项目示例2.2.1Springinitializr2.2.2pom.xml2.2.3HelloController.java2.3开发环境热部署2.3.1pom.xml2.3.2application.properties(可选)2.3.3IDEA工具设置热部署3web
XSLT模版注入漏洞
XSLT模版注入漏洞模版注入漏洞根因（SSTI，服务器端模版注入）XSLT介绍XSLT模版注入漏洞关键点漏洞触发场景漏洞复现环境引入依赖poc修复方案限制document读取路径限制使用`xsl:include`、`xsl:import`引用外部实体避免暴露java的危险类和方法完整代码（包含修复）参考模版注入漏洞根因（SSTI，服务器端模版注入）由于模版内容部分或全部被外部控制，导致在模版加载或
Java结构型模式---适配器模式
适配器模式基础概念适配器模式是一种结构型设计模式，其核心思想是将一个类的接口转换成客户希望的另一个接口。适配器模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。适配器模式就像一个"转换器"，将两个不兼容的接口进行适配。适配器模式的核心组件目标接口(Target)-客户端所期望的接口适配者类(Adaptee)-现有的、需要被适配的类适配器类(Adapter)-连接目标接口和适配者类的桥梁
【华为OD机试真题 2025B卷】2025华为OD机试 B卷目录，考点说明，持续收录中，已更新700+ 哪吒搬砖工逆袭Java架构师华为od 华为OD机试 2025B卷 python javascript
专栏导读本专栏收录于《华为OD机试（JAVA）真题（B卷+A卷+C卷+D卷+E卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
Java创建型模式---建造者模式
建造者模式基础概念建造者模式是一种创建型设计模式，其核心思想是将一个复杂对象的构建与表示分离，使得同样的构建过程可以创建不同的表示。建造者模式允许你分步构建一个复杂对象，通过相同的构建步骤可以得到不同的表示形式。建造者模式的核心组件产品类(Product)-要构建的复杂对象抽象建造者(Builder)-定义构建产品各个部分的抽象接口具体建造者(ConcreteBuilder)-实现抽象建造者接口，
【JavaScript】setTimeout和setInterval中的陷阱秀秀_heo JavaScript javascript 前端 vue.js
✅一、核心区别回顾setTimeout(fn,delay)//delay毫秒后执行fn，一次setInterval(fn,delay)//每隔delay毫秒执行fn，循环执行⚠️二、常见陷阱和注意事项1.定时不准（延时不准确）现象：你设置了setTimeout(fn,1000)，但实际执行时间可能远远大于1000ms。原因：JavaScript是单线程的，setTimeout和setInterva
经典面试题 - LAZYMAN (HARDMAN / 懒汉) 秀秀_heo 小轮子 javascript
主要考察JavaScript异步编程、事件循环、链式调用和任务调度的综合能力。题目要求实现一个hardMan函数，支持链式调用study()、rest()和restFirst()方法，并满足特定时序逻辑。一、题目要求与行为分析hardMan('潘潘')//输出:Hi!Iam潘潘.hardMan('潘潘').study('敲码')//输出:Hi!Iam潘潘.→Iamstudying敲码.hardMa
Java结构型模式---代理模式
代理模式基础概念代理模式是一种结构型设计模式，其核心思想是通过创建一个代理对象来控制对另一个真实对象的访问。代理对象在客户端和真实对象之间起到中介作用，允许在不改变真实对象的前提下，对其进行增强或控制。代理模式的核心组件主题接口(Subject)-定义真实对象和代理对象的共同接口，客户端通过该接口访问真实对象真实主题(RealSubject)-实现主题接口，是实际要被代理的对象代理(Proxy)-
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默