Generalzy

filebeat配置解析

filebeat概览
- filebeat是如何工作的
- 工作原理
- - 采集日志
  - 注册表
  - 发送日志
容器日志采集的三种方式
- 方式一：Filebeat 与应用运行在同一容器（不推荐）
- 方式二：Filebeat 与应用运行不在同一容器
- 方式三：通过 Kubernetes Filebeat DaemonSet
配置解析——以7.10.2为例
- 性能分析与调优
- 全部配置
- - output
  - processors
  - 文件日志
  - 容器日志
源码解析
- 待续
FAQ
- 配置了过滤不起作用

filebeat概览

Filebeat 是一个用于转发和集中日志数据的轻量级传送器。Filebeat 作为agent安装在服务器上，监视指定的日志文件或位置，收集日志事件，并将它们转发到Elasticsearch或 Logstash进行索引。

Filebeat 的工作原理如下：当启动 Filebeat 时，它会启动一个或多个input查找指定的日志数据位置。对于 Filebeat 找到的每个日志，Filebeat 都会启动一个harvester。每个harvester都会读取单个日志以获取新内容，并将新日志数据发送到 libbeat，libbeat 会聚合事件并将聚合数据发送到您为 Filebeat 配置的输出。

filebeat是如何工作的

Filebeat 由两个主要组件组成：input和harvester。这些组件协同工作来跟踪文件并将事件数据发送到指定的output。

什么是harvester：

harvester负责读取单个文件的内容。
harvester逐行读取每个文件，并将内容发送到输出。
每个文件启动一个harvester。
harvester负责打开和关闭文件，这意味着harvester运行时文件描述符保持打开状态。

什么是input：

input负责管理harvester并查找所有可供读取的源。
如果input类型为log，则input会查找驱动器上与定义的全局路径匹配的所有文件，并为每个文件启动harvester。每个input都在自己的 Go 协程中运行。

以下示例将 Filebeat 配置为从与指定 glob 模式匹配的所有日志文件中收集行：

filebeat.inputs:
- type: log
  paths:
    - /var/log/*.log
    - /var/path2/*.log

不同的harvester goroutine采集到的日志数据都会发送至一个全局的队列queue中，filebeat默认启用的是基于内存的缓存队列。

每当队列中的数据缓存到一定的大小或者超过了定时的时间（默认1s)，会被注册的client从队列中消费，发送至配置的后端。目前可以设置的client有kafka、elasticsearch、redis等。

工作原理

采集日志

filebeat 每采集一条日志文本，都会保存为 JSON 格式的对象，称为日志事件（event）。
filebeat 的主要模块：
- input ：输入端。
- output ：输出端。
- harvester ：收割机，负责采集日志。
filebeat 会定期扫描（scan）日志文件，如果发现其最后修改时间改变，则创建 harvester 去采集日志。
- 对每个日志文件创建一个 harvester ，逐行读取文本，转换成日志事件，发送到输出端。
  - 每行日志文本必须以换行符分隔，最后一行也要加上换行符才能视作一行。
- harvester 开始读取时会打开文件描述符，读取结束时才关闭文件描述符。
  - 默认会一直读取到文件末尾，如果文件未更新的时长超过 close_inactive ，才关闭。
假设让 filebeat 采集日志文件 A 。轮换日志文件时，可能经常出现将文件 A 重命名为 B 的情况，比如 mv A B 。filebeat 会按以下规则处理：
- 如果没打开文件 A ，则以后会因为文件 A 不存在而采集不了。
  - 在类 Unix 系统上，当 filebeat 打开文件时，允许其它进程重命名文件。而在 Windows 系统上不允许，因此总是这种情况。
- 如果打开了文件 A ，则会继续读取到文件末尾，然后每隔 backoff 时间检查一次文件：
  - 如果在 backoff 时长之内又创建文件 A ，比如 touch A 。则 filebeat 会认为文件被重命名（renamed）。
    - 默认配置了 close_renamed: false ，因此会既采集文件 A ，又采集文件 B ，直到因为 close_inactive 超时等原因才关闭文件 B 。
    - 此时两个文件的状态都会记录在 registry 中，文件路径 source 相同，只是 inode 不同。
  - 如果在 backoff 时长之后，依然没有创建文件 A 。则 filebeat 会认为文件被删除（removed）。
    - 默认配置了 close_removed: true ，因此会立即关闭文件 B 而不采集，而文件 A 又因为不存在而采集不了。此时 filebeat 的日志如下：
      2021-02-02T15:49:49.446+0800 INFO log/harvester.go:302 Harvester started for file: /var/log/A.log # 开始采集文件 A 2021-02-02T15:50:55.457+0800 INFO log/harvester.go:325 File was removed: /var/log/A.log. Closing because close_removed is enabled. # 发现文件 A 被删除了，停止采集

注册表

filebeat 通常会监听多个日志文件，当有新增日志时，就自动采集。
- 监听日志文件时，需要记录一些重要信息，比如：日志文件的路径、inode 、已采集到第几行日志（表示为字节偏移量）
- filebeat 将它采集的所有日志文件的状态信息（state）记录在内存中，统称为注册表（registry）。
为了避免 filebeat 重启时丢失内存中的 registry 数据，filebeat 还会将 registry 数据备份到 data/registry/ 磁盘目录下。如下：
```
data/registry/filebeat/
├── 237302.json         # registry 快照文件，记录所有日志文件的当前状态，采用最后一次动作的编号作为文件名
├── active.dat          # 记录最新一个快照文件的绝对路径
├── log.json            # registry 日志文件，记录最近执行的一连串动作的日志
└── meta.json           # registry 的元数据
```
- filebeat 可能每秒采集多个日志文件，也就是执行大量动作。每执行一个动作，就记录日志到 log.json 文件中，代表某个日志文件的状态发生变化（主要是已采集的 offset 变化）。
- 为了避免 log.json 文件体积过大，默认当 log.json 文件达到 10MB 时，filebeat 会清空该文件，重新写入。并将所有日志文件的当前状态记录成快照文件 xxx.json 。
- 如果删除该目录，则 filebeat 会重新采集所有日志文件，这会导致重复采集。

filebeat 每执行一个动作，会在 log.json 文件中记录两行 JSON 日志，如下：

{"op":"set", "id":237302}                             // 本次动作的编号
{
  "k": "filebeat::logs::native::778887-64768",        // key ，由 beat 类型、日志文件的 id 组成
  "v": {
    "id": "native::778887-64768",                     // 日志文件的 id ，由 identifier_name、inode、device 组成
    "prev_id": "",
    "ttl": -1,                                        // -1 表示永不失效
    "type": "log",
    "source": "/var/log/supervisor/supervisord.log",  // 日志文件的路径（文件被重命名之后，并不会更新该参数）
    "timestamp": [2061628216741, 1611303609],         // 日志文件最后一次修改的 Unix 时间戳
    "offset": 1343,                                   // 当前采集的字节偏移量，表示最后一次采集的日志行的末尾位置
    "identifier_name": "native",                      // 识别日志文件的方式，native 表示原生方式，即根据 inode 和 device 编号识别
    "FileStateOS": {                                  // 文件的状态
      "inode": 778887,                                // 文件的 inode 编号
      "device": 64768                                 // 文件所在的磁盘编号
    }
  }
}

filbeat 采集每个日志文件时，会通过 registry 记录已采集的字节偏移量（bytes offset）。
- 每次 harvester 读取日志文件时，会从 offset 处继续采集。
- 如果 harvester 发现文件体积小于已采集的 offset ，则认为文件被截断了，会从 offset 0 处重新开始读取。这可能会导致重复采集。

发送日志

filebeat 将采集的日志事件经过处理之后，会发送到输出端，该过程称为发布事件（publish event）。
- event 保存在内存中，不会写入磁盘。
- 每个 event 只有成功发送到输出端，且收到 ACK 回复，确认被接收，才视作发送成功。
  - 如果发送 event 到输出端失败，则会自动重试。直到发送成功，才更新记录。
  - 因此，采集到的 event 至少会被发送一次。但如果在 ACK 之前重启 filebeat ，则可能重复发送。

一个 event 的内容示例：

{
  "@timestamp":"2021-02-02T12:03:21.027Z",  // 自动加上时间戳字段
  "@metadata":{
    "beat": "filebeat",
    "type": "_doc",
    "version": "7.14.0"
  },
  "agent": {                                // Beats 的信息
    "type": "filebeat",
    "version": "7.14.0",
    "name": "CentOS-1",
    "hostname": "CentOS-1",
    "ephemeral_id": "ed02583b-0823-4e25-bed3-e8af69ad7d82",
    "id": "49f74a3e-bfec-452c-b119-32c8014b19b2"
  },
  "log": {
    "file": {                               // 采集的日志文件的路径
        "path": "/var/log/nginx/access.log"
    },
    "offset": 765072                        // 采集的偏移量
  },
  "message": "127.0.0.1 - [2/Feb/2021:12:02:34 +0000] GET /static/bg.jpg HTTP/1.1 200 0", // 日志的原始内容，之后可以进行解析
  "fields": {},                             // 可以给 event 加上一些字段
  "tags": [],                               // 可以给 event 加上一些标签，便于筛选
  ...
}

容器日志采集的三种方式

方式一：Filebeat 与应用运行在同一容器（不推荐）

部署Filebeat：首先，在Kubernetes中或Docker环境中，部署 Filebeat 作为一个从属容器，它将与应用容器一起运行（在同一个容器/POD中运行）。
配置Filebeat：在Filebeat的配置文件（filebeat.yml）中，定义日志路径，以告诉 Filebeat 从哪里采集容器日志。
输出设置：配置Filebeat将采集到的日志数据发送到所需的目的地，如Elasticsearch、Logstash或Kafka。
启动Filebeat：启动Filebeat容器，它将开始采集容器的日志，并将其发送到配置的目的地。

方式二：Filebeat 与应用运行不在同一容器

部署Filebeat：同样，在Kubernetes中或Docker环境中，部署 Filebeat作为一个独立的 Sidecar 容器。
配置Filebeat：在Filebeat的配置文件中，使用Docker日志驱动来采集容器日志。
输出设置：配置Filebeat的输出，以将采集到的日志数据发送到目标。
启动Filebeat：启动Filebeat容器，它将开始采集容器的日志。

方式三：通过 Kubernetes Filebeat DaemonSet

部署 Filebeat：在Kubernetes中，可以使用Filebeat DaemonSet部署Filebeat作为一个集群级别的日志采集器。
Filebeat配置：在Filebeat的配置中，设置输入插件以采集容器的日志。
Filebeat输出：配置Filebeat的输出插件，以将采集到的日志数据发送到目标，如Elasticsearch或其他存储。
启动Filebeat：启动Filebeat DaemonSet，它将在Kubernetes集群中采集容器的日志。

配置解析——以7.10.2为例

filebeat 的 input 和 filebeat.autodiscover 是用于配置数据输入的两种不同方式，它们有一些区别：

静态配置 vs 动态发现:
- Input: 静态配置方式，你需要在 filebeat.yml（或者其他配置文件）中明确指定每个要监视的文件、路径或日志源。
- Autodiscover: 动态发现方式，通过配置自动发现规则，filebeat 可以动态地识别和监视符合规则的日志源。这对于动态环境（例如容器化环境）非常有用，因为新的容器可以自动添加到监视列表中。
简单性 vs 灵活性:
- Input: 相对简单，适用于静态和固定的日志源。配置直截了当，适合那些你事先就知道路径的场景。
- Autodiscover: 更为灵活，适用于动态环境或者在日志源可能随时间变化的情况。可以定义规则来自动识别新的日志源，而无需手动修改配置。
单一输入源 vs 多源发现:
- Input: 配置文件通常涉及指定单个输入源（文件、目录、TCP 端口等）。
- Autodiscover: 可以配置多个自动发现规则，允许 filebeat 同时监视多个来源，并根据规则动态添加新的来源。
适用场景:
- Input: 适用于静态或者不太变化的环境，对输入源的配置要求较为明确。
- Autodiscover: 适用于动态环境，例如容器化环境，或者对于那些可能在运行时动态添加或删除日志源的场景。

示例 filebeat.yml 中使用 filebeat.autodiscover 的配置：

filebeat.autodiscover:
  providers:
    - type: docker
      hints.enabled: true

这个配置示例中，filebeat 使用 Docker 提供的元数据来动态发现并监视容器日志。

并且，在autodiscover模式下，filebeat在启动时就会去调用kubernetes API来获取当前集群下所有的namespace、pod、container等元数据的信息，然后根据这些元数据再去指定的目录采集对应的日志。

下面给出一个可用的限定采集源的filebeat.yml：

filebeat.autodiscover:
  providers:
    - type: kubernetes
      hints.enabled: true
      templates:
        - condition:
            and:
              - or:
                  - equals:
                      kubernetes.namespace: testa
                  - equals:
                      kubernetes.namespace: testb
              - equals:
                  kubernetes.container.name: nginx
                  kubernetes.labels:
                    k8s-app: nginx
          config:
             - type: container
               paths:
                - /var/log/containers/${data.kubernetes.pod.name}_${data.kubernetes.namespace}_${data.kubernetes.container.name}-*.log
output.elasticsearch:
  hosts: ['x.x.x.x:9200']
  username: "xxx"
  password: "xxx"

上述配置中，用于限定采集源的就是condition模块下的部分，用于限定只采集testa 或者 testb命名空间下的nginx容器的日志。可以根据kubernetes元数据来限定采集源，可用的元数据有以下这些：

host
port (if exposed)
kubernetes.labels
kubernetes.annotations

kubernetes.container.id
kubernetes.container.image
kubernetes.container.name
kubernetes.namespace
kubernetes.node.name
kubernetes.pod.name
kubernetes.pod.uid

kubernetes.node.name
kubernetes.node.uid

kubernetes.namespace
kubernetes.service.name
kubernetes.service.uid
kubernetes.annotations

上述配置中，condition可以根据需求定义更复杂的限定条件，可以参考Conditions进行填写。

其他autodiscover详情参考：https://www.elastic.co/guide/en/beats/filebeat/current/configuration-autodiscover.html

下面给出一个综合的filebeat的helm values.yaml文件：

filebeatConfig:
  filebeat.yml: |
    processors:
      # 不采集filebeat自身日志
      - drop_event:
           when:
             regexp:
               kubernetes.pod.name: "filebeat.*"
      # 添加k8s元信息
      - add_kubernetes_metadata:
          in_cluster: true
          host: ${NODE_NAME}
          matchers:
            - logs_path:
                logs_path: "/var/lib/docker/containers/"
            - logs_path:
                logs_path: "/var/log/containers/"
      # 删除无用字段
      - drop_fields:
          fields:
            - agent.ephemeral_id
            - agent.hostname
            - agent.name
            - agent.id
            - agent.type
            - agent.version
            - ecs.version
            - input.type
            - log.offset
            - version
            - 
    # 配置集群自动发现
    filebeat.autodiscover:
      providers:
        - type: kubernetes
          hints.enabled: true
          templates:
            - condition:
              or:
                - equals:
                  kubernetes.namespace: tets1
                - equals:
                  kubernetes.namespace: test2
              config:
                - type: container
                  paths:
                    - /var/lib/docker/containers/*/*.log
                    - /var/log/containers/*.log
                  # 日志json化处理
                  # 适用于日志文件的每一行本来就是json字符串的格式
                  json.keys_under_root: true
                  json.overwrite_keys: true
             
    logging.level: error
    logging.to_stderr: false
    logging.json: true

    output.elasticsearch:
      username: '${ELASTICSEARCH_USERNAME}'
      password: '${ELASTICSEARCH_PASSWORD}'
      protocol: https
      hosts: []
      ssl.verification_mode: none

性能分析与调优

正常启动filebeat，一般确实只会占用3、40MB内存，但是偶发性的也会发现某些节点上的filebeat容器内存占用超过配置的pod limit限制（一般设置为200MB），并且不停的触发的OOM。

究其原因，一般容器化环境中，特别是裸机上运行的容器个数可能会比较多，导致创建大量的harvester（协程）去采集日志。

如果没有很好的配置filebeat，会有较大概率导致内存急剧上升。

当然，filebeat内存占据较大的部分还是memqueue，所有采集到的日志都会先发送至memqueue聚集，再通过output发送出去。

每条日志的数据在filebeat中都被组装为event结构，filebeat默认配置的memqueue缓存的event个数为4096，可通过queue.mem.events设置。

默认最大的一条日志的event大小限制为10MB，可通过max_bytes设置。4096 * 10MB = 40GB，可以想象，极端场景下，filebeat至少占据40GB的内存。

特别是配置了multiline多行模式的情况下，如果multiline配置有误，单个event误采集为上千条日志的数据，很可能导致memqueue占据了大量内存，致使内存爆炸。

所以，合理的配置日志文件的匹配规则，限制单行日志大小，根据实际情况配置memqueue缓存的个数，才能在实际使用中规避filebeat的内存占用过大的问题。

全部配置

所有类型的 beats 都支持以下 General 配置项（这些参数可以配置全局的，也可以给某个日志源单独配置。）：

name: 'filebeat-001'        # 该 Beat 的名称，默认使用当前主机名
tags: ['json']              # 给每条日志加上标签，保存到一个名为 tags 的字段中，便于筛选日志
fields:                     # 给每条日志加上字段，这些字段默认保存为一个名为 fields 的字段的子字段
  project: test
fields_under_root: false    # 是否将 fields 的各个字段保存为日志的顶级字段，此时如果与已有字段重名则会覆盖

filebeat.yml 的基本配置：

# path.config: ${path.home}                     # 配置文件的路径，默认是项目根目录
# filebeat.shutdown_timeout: 0s                 # 当 filebeat 关闭时，如果有 event 正在发送，则等待一定时间直到其完成。默认不等待
# filebeat.registry.path: ${path.data}/registry # registry 磁盘目录
# filebeat.registry.file_permissions: 0600      # registry 文件的权限
# filebeat.registry.flush: 0s                   # 每当 filebeat 发布一个 event 到输出端，等多久才记录到 registry 日志文件。v8.3 版本将默认值从 0s 改为 1s

# 配置 filebeat 自身的日志
logging.level: info                     # 只记录不低于该级别的日志
logging.json: true                      # 输出的日志采用 JSON 格式
logging.to_files: true                  # 将日志保存到文件 ./logs/filebeat
# logging.to_stderr: true               # 将日志输出到终端
# logging.metrics.enabled: true         # 是否在日志中记录监控信息，包括 filebeat 的状态、系统负载
# logging.metrics.period: 30s           # 记录监控信息的时间间隔

filebeat.config.modules:                # 加载模块
  path: ${path.config}/modules.d/*.yml

output

filebeat 支持多种输出端，同时只能启用一种输出端。

# 输出到终端，便于调试
# output.console:
#   pretty: true

# 输出到 Logstash
output.logstash:
  hosts: ['localhost:5044']

# 输出到 ES
# output.elasticsearch:
#   hosts: ['10.0.0.1:9200']
#   username: 'admin'
#   password: '******'
#   index: 'filebeat-%{[agent.version]}-%{+yyyy.MM.dd}-%{index_num}'   # 用于存储 event 的索引名

# 输出到 kafka
# output.kafka:
#   hosts:
#     - 10.0.0.1:9092
#   topic: '%{[fields.project]}_log'
#   partition.random:             # 随机选择每个消息输出的 kafka 分区
#     reachable_only: true        # 是否只输出到可访问的分区。默认为 false ，可能输出到所有分区，如果分区不可访问则阻塞
#   compression: gzip             # 消息的压缩格式，默认为 gzip ，建议采用 lz4 。设置为 none 则不压缩
#   keep_alive: 10                # 保持 TCP 连接的时长，默认为 0 秒
#   max_message_bytes: 10485760   # 限制单个消息的大小为 10M ，超过则丢弃

processors

可以配置 processors ，在输出 event 之前进行处理：

processors:
  - add_host_metadata:                  # 添加当前主机的信息，包括 os、hostname、ip 等
      when.not.contains.tags: forwarded # 如果该日志不属于转发的
  - add_docker_metadata: ~            # 如果存在 Docker 环境，则自动添加容器、镜像的信息。默认将 labels 中的点 . 替换成下划线 _
  - add_kubernetes_metadata: ~        # 如果存在 k8s 环境，则自动添加 Pod 等信息
  - drop_event:                         # 丢弃 event ，如果它满足条件
      when:
        regexp:
          message: "^DEBUG"
  - drop_fields:                        # 丢弃一些字段
      ignore_missing: true              # 是否忽略指定字段不存在的错误，默认为 false
      fields:
        - cpu.user
        - cpu.system
  - rate_limit:
      limit: 1000/m                     # 限制全局发送 event 的速率，时间单位可以是 s、m、h 。超过阈值的 event 会被丢弃
      # fields:                         # 设置 fields 时，则考虑指定的所有字段的组合值，对每组不同的值分别限制速率
      #   - log.file.path

可以配置全局的 processors ，作用于采集的所有日志事件，也可以给某个日志源单独配置。

配置了多个 processors 时，会按顺序执行。

支持声明 processors 的触发条件：

processors:
  - :
      >
      when:
        >
  - if:
      >
    then:
      - :
          >
      - :
          >
    else:
      - :
          >

文件日志

采集文件日志的配置示例（配置时间时，默认单位为秒，可使用 1、1s、2m、3h 等格式的值。）：

filebeat.inputs:                  # 关于输入项的配置
- type: log                       # 定义一个输入项，类型为普通的日志文件
  paths:                          # 指定日志文件的路径
  - /var/log/mysql.log
  - '/var/log/nginx/*'            # 可以使用通配符

- type: log
  # enabled: true                 # 是否启用该输入项
  paths:
    - '/var/log/nginx/*'

  # fields:                       # 覆盖全局的 General 配置项
  #   project: test
  #   logformat: nginx
  # fields_under_root: true

  # 如果启用任何一个以 json 开头的配置项，则会将每行日志文本按 JSON 格式解析，解析的字段默认保存为一个名为 json 的字段的子字段
  # 解析 JSON 的操作会在 multiline 之前执行。因此建议让 filebeat 只执行 multiline 操作，将日志发送到 Logstash 时才解析 JSON
  # 如果 JSON 解析失败，则会将日志文本保存在 message 字段，然后输出
  # json.add_error_key: true      # 如果解析出错，则给 event 添加 error.message 等字段
  # json.message_key: log         # 指定存储日志内容的字段名。如果指定了该字段，当该字段为顶级字段、取值为字符串类型时，会进行 multiline、include、exclude 操作
  # json.keys_under_root: false   # 是否将解析出的 JSON 字段保存为 event 的顶级字段
  # json.overwrite_keys: false    # 在启用了 keys_under_root 时，如果解析出的字段与原有字段冲突，是否覆盖

  # 默认将每行日志文本视作一个 event ，可以通过 multiline 规则将连续的多行文本记录成同一个 event
  # multiline 操作会在 include_lines 之前执行
  # multiline.type: pattern       # 采用 pattern 方式，根据正则匹配处理多行。也可以采用 count 方式，根据指定行数处理多行
  # multiline.pattern: '^\s\s'    # 如果一行文本与 pattern 正则匹配，则按 match 规则与上一行或下一行合并
  # multiline.negate: false       # 是否反向匹配
  # multiline.match: after        # 取值为 after 则放到上一行之后，取值为 before 则放到下一行之前
  # multiline.max_lines: 500      # 多行日志最多包含多少行，超过的行数不会采集。默认为 500

  # exclude_files: ['\.tgz$']           # 排除一些正则匹配的文件
  # exclude_lines: ['^DEBUG', '^INFO']  # 排除日志文件中正则匹配的那些行
  # include_lines: ['^WARN', '^ERROR']  # 只采集日志文件中正则匹配的那些行。默认采集所有非空的行。该操作会在 exclude_lines 之前执行

  # encoding: utf-8               # 编码格式
  # scan_frequency: 10s           # 每隔多久扫描一次日志文件，如果有变动则创建 harvester 进行采集
  # ignore_older: 0s              # 不扫描最后修改时间在多久之前的文件，默认不限制时间。其值应该大于 close_inactive
  # harvester_buffer_size: 16384  # 每个 harvester 在采集日志时的缓冲区大小，单位 bytes
  # max_bytes: 102400             # 每条日志的 message 部分的最大字节数，超过的部分不会发送（但依然会读取）。默认为 10 M ，这里设置为 100 K
  # tail_files: false             # 是否从文件的末尾开始，倒序读取
  # backoff: 1s                   # 如果 harvester 读取到文件末尾，则每隔多久检查一次文件是否更新

  # 配置 close_* 参数可以让 harvester 尽早关闭文件，但不利于实时采集日志
  # close_timeout: 0s             # harvester 每次读取文件的超时时间，超时之后立即关闭。默认不限制
  # close_eof: false              # 如果 harvester 读取到文件末尾，则立即关闭
  # close_inactive: 5m            # 如果 harvester 读取到文件末尾之后，超过该时长没有读取到新日志，则立即关闭
  # close_removed: true           # 如果 harvester 读取到文件末尾之后，检查发现日志文件被删除，则立即关闭
  # close_renamed: false          # 如果 harvester 读取到文件末尾之后，检查发现日志文件被重命名，则立即关闭

  # 配置 clean_* 参数可以自动清理 registry 快照文件，避免它体积过大，但可能导致遗漏采集，或重复采集
  # clean_removed: true           # 如果某个日志文件在磁盘中被删除，则从 registry 快照文件中删除它
  # clean_inactive: 0s            # 如果某个日志文件长时间未活动，则从 registry 快照文件中删除它。默认不限制时间。其值应该大于 scan_frequency + ignore_older

  # 给该日志源单独配置 processors
  # processors:
  # - drop_event: ...

filebeat v7.14 弃用了输入类型 type: log ，建议用户改用 type: filestream 。

type: log 的特点：
- 每次成功发布日志事件到输出端，就会重写一次 registry 快照文件，从而更新日志文件的当前状态（主要是 offset ）。因此需要频繁 fsync 到磁盘，开销较大。
- 解析日志文本时，只能采用 json 或 multiline 格式。
type: filestream 的特点：
- 将 offset 更新信息以 append 方式写入 registry 日志文件，默认达到 10MB 时才重写一次 registry 快照文件，因此大幅减少了 fsync 的次数。
- 解析日志文本时，可依次采用多个 parsers 。

例：

- type: filestream
  id: mysql-filestream        # 每个 filestream 需要配置一个唯一 ID
  paths:
  - /var/log/mysql.log
  # fields:
  #   project: test
  #   logformat: nginx
  # fields_under_root: true
  # exclude_lines: ...
  # include_lines: ...
  parsers:                    # 配置一组解析日志文本的规则
  - ndjson:                   # 按 JSON 格式解析
      target: ""              # 将解析出的 JSON 字段保存为哪个字段的子字段，取值为空表示保存为顶级字段
      # overwrite_keys: true  # 如果解析出的字段与原有字段冲突，是否覆盖
      # add_error_key: true   # 如果解析出错，则给 event 添加 error.message 等字段
      # message_key: msg      # 可选，对 JSON 中某个字段执行 multiline 规则
  - multiline:
      type: pattern
      pattern: '^\s\s'
  # - container:              # 解析容器的日志文件
  #     stream: all           # 默认会读取 stdout 和 stderr
  #     format: auto          # 表示容器日志的格式是 docker 还是 cri ，默认为 auto ，会自动识别
  # - syslog:                 # 解析系统日志
  #     format: auto

可启用 filebeat 的一些内置模块，自动采集一些系统或流行软件的日志文件，此时不需要用户自行配置。

命令：

./filebeat modules
                  enable  [module]...   # 启用一些模块
                  disable [module]...   # 禁用一些模块
                  list                  # 列出启用、禁用的所有模块

filebeat 支持的模块列表 (opens new window)

容器日志

采集容器日志的配置示例：

filebeat.inputs:
- type: container
  paths:
    - /var/lib/docker/containers/*/*.log
  # stream: all                   # 从哪个流读取日志，可以取值为 stdout、stderr、all ，默认为 all
  # 兼容 type: log 的配置参数

注意 docker 的日志文件默认需要 root 权限才能查看。

上述配置会采集所有容器的日志，而使用以下自动发现（autodiscover）的配置，可以只采集部分容器的日志：

filebeat 支持对容器的自动发现（autodiscover），还支持从容器的元数据中加载配置，称为基于提示（hints）的自动发现。

filebeat.autodiscover:
  providers:
    # - type: docker              # 声明一个自动发现的日志源，为 docker 类型。这会调用内置 docker 变量模板
    #   templates:
    #     - condition:            # 只采集满足该条件的日志
    #         contains:
    #           docker.container.name: elasticsearch
    #       config:
    #         - type: container   # 该 container 是指 filebeat.inputs 类型，不是指 providers 类型
    #           paths:
    #             - /var/lib/docker/containers/${data.docker.container.id}/*.log
    #   hints.enabled: false      # 是否启用 hints ，从 Docker 容器的 Labels 加载配置
    #   hints.default_config:     # 设置默认的 hints 配置
    #     enabled: true           # 是否采集容器的日志，默认为 true 。如果禁用，则需要容器启用 co.elastic.logs/enabled 配置
    #     type: container
    #     paths:
    #       - /var/lib/docker/containers/${data.docker.container.id}/*.log  # Docker 引擎的日志路径

    - type: kubernetes
      node: ${NODE_NAME}
      hints.enabled: true     # 从 k8s Pod 的 Annotations 加载配置
      hints.default_config:
        type: container
        paths:
          - /var/log/containers/*-${data.kubernetes.container.id}.log   # CRI 标准的日志路径
        fields_under_root: true

provider 为 docker 类型时，可引用一些变量，比如：

docker.container.id
docker.container.image
docker.container.name
docker.container.labels

使用 hints 功能时，可以在容器的 Labels 或 Annotations 中添加配置参数：

co.elastic.logs/enabled: true     # 是否采集容器的日志，默认为 true
co.elastic.logs/json.*: ...
co.elastic.logs/multiline.*: ...
co.elastic.logs/exclude_lines: '^DEBUG'
co.elastic.logs/include_lines: ...
co.elastic.logs/processors.dissect.tokenizer: "%{key2} %{key1}"

源码解析

下载源码，filebeat github源码地址：https://github.com/elastic/beats/tree/v7.10.2

然后在beats目录下执行：

go mod tidy

待续

FAQ

配置了过滤不起作用

可以考虑删掉input和全局processor，直接用自动发现：

filebeatConfig:
  filebeat.yml: |
    filebeat.autodiscover:
      providers:
        - type: kubernetes
          hints.enabled: false
          templates:
            - condition:
                equals:
                  kubernetes.namespace: "xxxx"
              config:
                - type: container
                  paths:
                    - /x/xx/docker/containers/*/*.log
                    - /var/log/containers/*.log
                  json.keys_under_root: true
                  json.overwrite_keys: true
                  processors:
                    - drop_event:
                       when:
                         or:
                           - regexp:
                              kubernetes.pod.name: "filebeat.*"
                           - regexp:
                              kubernetes.pod.name: "xx.*"
                    
            - condition:
                equals:
                  kubernetes.namespace: "xxx"
              config:
                - type: container
                  paths:
                    - /x/xx/docker/containers/*/*.log
                    - /var/log/containers/*.log
                  processors:
                    - drop_event:
                       when:
                         or:
                           - regexp:
                              kubernetes.pod.name: "simple.*"
                           - regexp:
                              kubernetes.pod.name: "xx.*"
                          
    logging.level: error
    logging.to_stderr: false
    logging.json: true
    
    output.elasticsearch:
      username: '${ELASTICSEARCH_USERNAME}'
      password: '${ELASTICSEARCH_PASSWORD}'
      protocol: https
      hosts: []
      ssl.verification_mode: none

然后将processors改为局部processors，对应每一种配置进行特殊处理。

你可能感兴趣的:(elasticsearch,golang,elk)

Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
Elasticsearch混合搜索深度解析（下）：执行机制与完整流程 GeminiJM ES学习笔记 elasticsearch jenkins 大数据
引言在上篇中，我们发现了KNN结果通过SubSearch机制被保留的关键事实。本篇将继续深入分析混合搜索的执行机制，揭示完整的处理流程，并解答之前的所有疑惑。深入源码分析1.SubSearch的执行机制1.1KnnScoreDocQueryBuilder的实现KNN结果被转换为KnnScoreDocQueryBuilder，这个类负责在查询阶段重新执行KNN搜索：//server/src/main
Golang面试题二（slice,map,chan） os-lee go高级 golang 开发语言后端
目录1.slice的底层实现1.结构体定义2.slice四种初始化方式3.底层函数2.Go语言当中数组和slice的区别是什么？1.长度不同2.函数传参不同3.计算长度方式不同3.slice的扩容机制，有什么注意点扩容机制总结4.扩容前后的Slice是否相同5.深拷贝和浅拷贝浅拷贝（ShallowCopy）深拷贝（DeepCopy）总结6.slice为什么不是线程安全的7.map底层实现8.map
Golang map m0_67393686 java golang java 数据结构后端 apache
前言哈希表是一种巧妙并且实用的数据结构。它是一个无序的key/value对的集合，其中所有的key都是不同的，然后通过给定的key可以在常数时间复杂度内检索、更新或删除对应的value。在Go语言中，一个map就是一个哈希表的引用，map类型可以写为map[K]V，其中K和V分别对应key和value。map中所有的key都有相同的类型，所有的value也有着相同的类型，但是key和value之间
【go基础】4.基本数据结构之map 喝醉的小喵 go语言原理 golang 数据结构哈希算法后端
目录哈希表map-主要思想-特点-哈希函数-数据结构-map初始化-mapvalue为什么不能寻址-map为什么是无序的-map为什么是o(1)的-开发时应注意的哈希表map理解Golang哈希表Map的原理|Go语言设计与实现彻底理解GolangMap-知乎-主要思想1、桶map的底层存储结构式hmap,里面有一个桶数组，所有kv都是存在这些桶里的，每个桶的结构是bmap每个桶中最多可以存8个k
map数据结构在Golang中是无序的，并且键值对的查找效率较高的原因
map，map在Go语言中是无序的，是因为在Go语言中，map基于哈希表实现，它的遍历顺序依赖于哈希表内部存储状态，对并发编程的潜在影响包括可能引发数据一致性问题，也就是并发度写实易导致读到不一样的数据或遍历出错；还会导致结果可重复性的问题，即每次运行程序得到的依赖遍历顺序的计算结果可能不同。map的键值对查找效率高是由于：（1）哈希表的时间复杂度，哈希表的平均复杂度为O（1），最欢情况下为O（n
【ceph】坏盘更换，osd的具体操作向往风的男子 ceph ceph
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
Windows下的redis 517 redis 数据库缓存
1:在配置path后：redis-cli默认16个数据库2然后再验证set和get命令，如果一切正常便安装部署成功。一、键（Key）的增删改查操作命令示例说明增SETkeyvalueSETusername"john"设置字符串键值删DELkeyDELusername删除键（可多键：DELk1k2）改SETkeynew_valueSETusername"mike"覆盖原有值查GETke
Golang 数据类型有哪些？
一个完整的项目需要更复杂的逻辑，不是简单的“Hello世界”可相比的。这些逻辑通过变量、常量、类型、函数方法、接口、结构体组成，这节课我就将带你认识它们，让你的Go语言程序变得更加生动。内置类型值类型boolint(32or64),int8,int16,int32,int64uint(32or64),uint8(byte),uint16,uint32,uint64float32,float64st
深入解析Golang中的defer机制：从cch123/golang-notes看实现原理
深入解析Golang中的defer机制：从cch123/golang-notes看实现原理golang-notesGosourcecodeanalysis(zh-cn)项目地址:https://gitcode.com/gh_mirrors/go/golang-notes前言在Go语言中，defer语句是一种非常实用的特性，它允许我们在函数返回前执行某些操作。本文将基于cch123/golang-n
Golang defer 的编译器实现细节 Golang编程笔记 golang 开发语言后端 ai
Golangdefer的编译器实现细节：从语法糖到运行时的全链路解析关键词：Go语言、defer、编译器优化、运行时、延迟执行摘要：本文将深入解析Go语言中defer关键字的底层实现细节。我们将从defer的基础用法出发，逐步拆解编译器如何将defer语法转换为机器可执行的代码，并结合Go编译器的优化历史（如开放编码优化）、运行时关键结构体（_defer）以及实际汇编代码，揭示defer从“语法糖
探索 Golang 与 Docker 集成的无限可能 Golang编程笔记 golang docker 开发语言 ai
探索Golang与Docker集成的无限可能关键词：Golang、Docker、容器化、微服务、云原生、镜像优化、CI/CD摘要：本文将带你走进Golang与Docker集成的奇妙世界。我们会从“为什么需要这对组合”讲起，用生活故事类比核心概念，拆解Go静态编译与Docker容器化的“天作之合”，通过实战案例演示如何用Docker高效打包Go应用，并探讨它们在云原生时代的无限可能。无论你是Go开发
Golang类型断言在反射中的应用：深入源码分析 Golang编程笔记 Golang编程笔记 golang 网络服务器 ai
Golang类型断言在反射中的应用：深入源码分析关键词：Golang、类型断言、反射、运行时、接口、类型系统、源码分析摘要：本文深入探讨Golang中类型断言与反射机制的底层关联，通过解析Go运行时源码和反射包实现，揭示类型断言在反射场景中的核心作用。从接口类型的内存布局出发，分析类型断言的两种实现形式（安全断言与暴力断言）在反射API中的具体应用，结合实际案例演示如何通过反射动态获取类型信息并进
以下哪种类型在Golang中不是内置类型？小高Baby@ go
A.intB.stringC.structD.array首先，内置类型是指不需要引入任何关于这些数据类型的包，就可以引用的数据类型。那么，内置类型主要包括基本类型，复合类型，控制并发，高级抽象，特殊类型。基本类型包括，整型，浮点型，布尔型，字符串，复数型（complex64，complex128）复合型包括，数组，切片，map，slice控制通道，channel高级抽象包括，interface，f
Go中使用wire进行统一依赖注入管理卜锦元 golang 高可用性编程语言 golang 开发语言后端
前言本文通过代码示例，详细的讲述了在Golang中如何通过goole/wire来进行项目整体的依赖注入管理的管理和维护，通过wire为我们的项目依赖树有一个统一维护的地方，全局统一管理依赖。wire最大的价值正是在复杂项目里，把依赖关系集中在一个地方（通常是wire.go），做到：全局统一管理依赖编译期安全（不像fx在运行期才报错）避免到处写构造&注入逻辑，让模块更专注业务wire管理目录的方式其
【ceph】ceph集群更换osd时，找不到坏盘位置，怎么查找坏盘对应的序列号---业内称“点灯”
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
SkyWalking + Logstash全链路追踪系统详细实施方案 @淡定 skywalking
SkyWalking+Logstash全链路追踪系统详细实施方案一、系统架构与数据流向核心流程：数据采集：SkyWalkingAgent埋点收集调用链路数据日志增强：应用程序通过MDC注入TraceID日志收集：Logstash采集应用日志并发送至Elasticsearch数据存储：SkyWalking指标数据与日志数据分别存储可视化分析：SkyWalkingUI展示链路追踪，Kibana分析日志
自建ELK vs 云商日志服务：成本对比分析亲爱的非洲野猪 elk
在当今数据驱动的时代，日志管理已成为企业IT基础设施中不可或缺的一部分。面对日益增长的日志数据，许多团队都在纠结：是自建ELK（Elasticsearch、Logstash、Kibana）堆栈，还是直接使用云服务商提供的日志服务？本文将从成本角度对这两种方案进行详细对比分析。自建ELK方案成本分析1.硬件/基础设施成本服务器成本：至少需要3个节点（生产环境推荐）实现高可用中等规模部署：3台16核6
【spring boot】三种日志系统对比：ELK、Loki+Grafana、Docker API ladymorgana 日常工作总结 spring boot elk grafana
文章目录**方案1：使用ELK（Elasticsearch+Logstash+Kibana）****适用场景****搭建步骤****1.修改SpringBoot日志输出****2.创建DockerCompose文件****3.配置Logstash****4.启动服务****方案2：使用Loki+Grafana****适用场景****搭建步骤****1.修改SpringBoot日志驱动****2.配
Semantic text 就是那么强大，还附带一包（ BBQ ）薯片！配有可配置的分块设置和索引选项。 Elastic 中国社区官方博客 Elasticsearch AI 大数据 elasticsearch 搜索引擎全文检索人工智能 ai 图搜索
作者：来自ElasticKathleenDeRusso语义文本搜索现在可以自定义，支持可配置的分块设置和索引选项，用于自定义向量量化，使semantic_text在专业用例中更强大。Elasticsearch拥有大量新功能，帮助你为你的用例构建最佳搜索解决方案。深入查看我们的示例笔记本以了解更多信息，开始免费云试用，或者立即在本地机器上体验Elastic。随着Elasticsearch8.18和9
Elasticsearch 高可用实战：架构设计与场景化解决方案辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch wpf 大数据全文检索搜索引擎 restful java
Elasticsearch高可用实战：架构设计与场景化解决方案本文深入探讨Elasticsearch在高并发、大数据量场景下的高可用架构设计，结合电商搜索、日志分析等真实案例，提供可落地的技术方案与Java实现。一、高可用架构设计原则1.分布式架构核心要素客户端负载均衡层协调节点数据节点-分片1数据节点-分片2数据节点-分片3副本分片副本分片副本分片2.高可用黄金法则冗余设计：至少3节点集群+1副
Elasticsearch RESTful API入门：基础搜索与查询DSL 辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch restful 大数据搜索引擎全文检索 spring boot
ElasticsearchRESTfulAPI入门：基础搜索与查询DSL本文为Elasticsearch初学者详细解析RESTfulAPI的核心操作与查询DSL语法，包含大量实战示例及最佳实践。一、Elasticsearch与RESTfulAPI简介Elasticsearch（ES）作为分布式搜索分析引擎，其RESTfulAPI是与集群交互的核心方式。通过HTTP协议实现：✅索引文档的CRUD操作
Elasticsearch入门（二）：document数据格式、简单的es restful api m0_50134014 Elasticsearch elasticsearch java
目录一、document数据格式1.1面向文档的搜索分析引擎1.1.1对象数据存储到数据库中1.1.2对象数据存储到ES中二、电商网站商品管理案例背景介绍2.1简单的集群管理2.1.1快速检查集群的健康状况:`GET/_cat/health?v`2.1.2快速查看集群中有哪些索引:`GET/_cat/indices?v`2.1.3创建索引：`PUT/test_index?pretty`2.1.4删
Elasticsearch RESTful API入门：全文搜索实战（Java版）辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch restful java 大数据搜索引擎全文检索
ElasticsearchRESTfulAPI入门：全文搜索实战（Java版）本文结合Java客户端API，深入讲解Elasticsearch全文搜索的实现。包含10+个实战示例及对应的Java代码，涵盖match、multi_match、高亮显示等核心功能。一、环境准备1.添加Maven依赖org.elasticsearch.clientelasticsearch-rest-high-level
【Elasticsearch】function_score risc123456 Elasticsearch elasticsearch
如果你希望在Elasticsearch查询中降低某些特定`id`的文档评分，可以通过`function_score`查询结合`script_score`函数来实现。`script_score`允许你使用自定义脚本对文档的评分进行调整。以下是一个示例，展示如何降低某些特定`id`的文档评分：示例场景假设我们有一个索引`my_index`，其中包含一些文档，每个文档都有一个`id`字段。我们希望降低某
Elasticsearch RESTful API入门：索引的增删改查完全指南辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch restful 大数据 java 架构搜索引擎全文检索
ElasticsearchRESTfulAPI入门：索引的增删改查完全指南本文专为Java开发初学者设计，将手把手教你掌握Elasticsearch索引的核心操作一、环境准备与基本概念1.1安装Elasticsearch（Windows版） 1.访问官网下载ZIP包 2.解压后进入bin目录，双击elasticsearch.bat启动 3.验证安装：浏览器访问http://localhost
golang的defer hwg985 Golang golang 开发语言后端
文章目录把defer想象成"临时便签"用生活例子理解：更直观的对比：**没有defer的代码：****有defer的代码：**执行时机的详细说明：关键理解点：用计时器例子：把defer想象成"临时便签"当你写defer时，Go会把这个函数调用写在一张"便签"上，等到当前函数结束时，再执行这些便签上的内容。用生活例子理解：func回家(){fmt.Println("1.进门")deferfmt.Pr
golang的各种原生类型之间赋值是原子的吗无用程序员~ Linux应用编程 golang 开发语言后端
原始代码我在项目里写了这样一段代码packageid2nameimport("time")typeId2Namestruct{mmap[int]string}funcNew()(*Id2Name,error){m,err:=getId2NameMap()iferr!=nil{returnnil,err}ins:=&Id2Name{m:m,}goins.reload()returnins,nil}f
Redis 实现同步锁
1、技术方案1.1、redis的基本命令1）SETNX命令（SETifNoteXists）语法：SETNXkeyvalue功能：当且仅当key不存在，将key的值设为value，并返回1；若给定的key已经存在，则SETNX不做任何动作，并返回0。2）expire命令语法：expireKEYseconds功能：设置key的过期时间。如果key已过期，将会被自动删除。3）DEL命令语法：DELkey
Go - 项目收藏
1、谷歌官方维护了一个基于go语言的开源项目列表：https://github.com/golang/go/wiki/Projects2、[知乎网]有哪些值得学习的Go语言开源项目？3、[知乎用户：hackstoic]看过awesome-go项目，汇总了很多go开源项目。但是awesome-go收集了太全了，而且每个项目没有描述。因此我自己根据go语言中文社区提供的资料，还有互联网企业架构设计中的
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分