love6a6

AIOPS探针部署说明书

Linux服务器rsyncd服务配置说明

查看服务器资源剩余量

# linux 可通过如下命令查看
free -m
top
df -Th

ansible部署步骤

建立用于启动服务的用户

useradd logmanager -u 500 -M -L -G group1,group2
# -M 不创建用户家目录
# -L 锁定用户，拥有root权限才可以切换至该用户
# -G 指定用户附加组，多个组可用','分割

如果被采集的日志文件存放在logmanger用户无法进入的目录下，可使用如下方式为用户授权

# 1. 如果组内用户可以进入目标目录下，可以将logmanager用户添加至目标组内
[root@localhost /home]$ ll -al
...
drwxr-x---@   3 user  group    96B  1 29 23:03 Directory
...
[root@localhost /home]$ usermod logmanager -G group
# 2. 为logmanager用户对该目录设置facl权限
[root@localhost /home]$ setfacl -m u:logmanager:rx /path/to/Directory

检查/usr/bin/jps是否存在

ls -l /usr/bin/jps

如果该命令不存在可以使用如下命令设置软连接解决

ln -s $JAVA_HOME/bin/jps /usr/bin/jps

集中采集服务器中需要配置kafka集群本地解析，

如果不添加，会出现flume因无法解析到kafka集群导致启动失败。

# 使用vim命令添加如下内容，kafka集群节点的主机名需要与ansible部署时主机名及ip地址对应
vim /etc/hosts
1.1.1.1   node-1 
1.1.1.2   node-2 
1.1.1.3   node-3

确保如下位置配置文件已被正确配置

# 切换至部署文件所在目录
cd /path/to/deployFilePath

服务器组配置文件

./inventory/inventory.ini

确保存在如下内容，并且内容为本次部署服务器的相关配置

[all] # 对所有节点定义ansible连接时对应的IP地址
node-1 ansible_host=1.1.1.1
node-2 ansible_host=1.1.1.2
node-3 ansible_host=1.1.1.3

[kafka] # 数据有flume或filebeat采集，传输到logstash，再有logstash放入kafka,如果kafka集群和flume节点不在相同集群中，需要在此处或单出创建一个组定义没台服务器对应的IP地址
node-1 kafka_id=1
node-2 kafka_id=2
node-3 kafka_id=3

# master节点建议每次部署时仅配置一台有效的服务器，并在slave节点中配置同步至该服务器的节点
[flume-master] # flume 日志集中采集服务器，JAVA_HOME需要被正确配置
node-2 javaHome='/usr/java/jdk1.8.0_261-amd64'

[flume-slave] # 被采集日志的服务器，JAVA_HOME需要被正确配置
node-1 skipToEnd=true javaHome='/usr/java/jdk1.8.0_261-amd64'
node-3 skipToEnd=true javaHome='/usr/java/jdk1.8.0_261-amd64'

[rsyncd] # flume 日志集中采集节点，用于配置同步探针状态信息的仓库
node-2

[flume:children] # 设置主机组的集合，勿动
flume-master
flume-slave

确保入口文件存在并被正确配置

``./agent.yml`：CentOS7系统部署探针入口文件

---
# 对指定节点执行创建用户，安装java操作
- hosts: flume-slave
  gather_facts: true
  max_fail_percentage: 0
  roles:
  - agent-java
# 在指定节点安装flume
- hosts: flume-slave
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent
# 对master节点执行创建用户
- hosts: flume-master
  gather_facts: true
  max_fail_percentage: 0
  roles:
  - agent-java
# 在master节点安装flume
- hosts: flume-master
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent
# 在master节点配置rsyncd服务，设置agent-status仓库，接受日志路径在/data/agent-status
- hosts: flume-master
  gather_facts: true
  max_fail_percentage: 0
  roles:
  - rsyncd
# 对flume-master角色的flume-conf.properties进行配置，并配置检查flume状态定时任务、agent-statua状态日志定时清理等任务
- hosts: flume-master
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent-master
# 在master节点配置logstash服务，接受探针传输的数据，并传送至kafka
- hosts: flume-master
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent-logstash
# 对flume-mslave角色的flume-conf.properties进行配置，并配置检查flume状态定时任务、agent-statua状态日志定时清理等任务
- hosts: flume-slave
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent-slave

./agent6.yml CentOS6 服务器探针部署入口文件（master节点必须为CentOS7）

---
# 部署CentOS 6 系统服务器java程序，创建用户操作
- hosts: flume-slave6
  gather_facts: true
  max_fail_percentage: 0
  roles:
  - agent6-java
# 部署CentOS6服务器flume组件
- hosts: flume-slave6
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent6

- hosts: flume-master
  gather_facts: true
  max_fail_percentage: 0
  roles:
  - rsyncd

- hosts: flume-master
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent-master

- hosts: flume-master
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent-logstash
# 部署CentOS6服务器flume配置文件、启动服务器、配置清理日志，检查监控状态定时任务
- hosts: flume-slave6
  gather_facts: false
  max_fail_percentage: 0
  roles:
  - agent6-slave

ansible文件模板的变量定义文件

./inventory/group_vars/flume.yml

# flume variable
flumeBase: '/opt'
dataPathBase: '/opt'
flumeInstallBase: '{{flumeBase}}/flume'
flumeuser: logmanager
flumegroup: logmanager
flume:
  pkgName: apache-flume-1.7.0-bin.tgz
  javahomeconfig: java
  flumeDir: '{{flumeInstallBase}}'
  dataDir: '{{flumeInstallBase}}/data'
  logDir: '{{flumeInstallBase}}/logs'
  jdkversion: 'java-1.8.0-openjdk-1.8.0.262.b10-0.el7_8.x86_64'
  logMasterDir: '{{dataPathBase}}/agent-status'
  logRetentionDays: '{{ defaultLogRetentionDays }}'
  user: '{{ flumeuser }}'
  group: '{{ flumegroup }}'
  server: '172.20.3.248'
  jvmHeapSize: 512m
  # 配置文件中变量值连接符需使用"_"
  masterPort: 4541

rsync:
  rsyncdPath: /data/agent-status
  rsyncPort: 873
  logRetentionDays: 7

flumeLogstash:
  version: 7.8.0
  pkgName: logstash-7.8.0.tgz
  Xms: '512m'
  user: '{{ flumeuser }}'
  group: '{{ flumegroup }}'
  checkPoint: 256
  nodeName: 'logmanager'
  dataPath: '{{dataPathBase}}/logstash/data'
  logPath: '{{dataPathBase}}/logstash/logs'
  port: 5044
  id: 'logmanager-filebeat'
  topic_id: 'logmanager-filebeat'
  pipelineItem:
    'logmanager-filebeat': '/opt/logstash/config/conf.d/filebeat.yml'
  logRetentionDays: 7

./inventory/host_vars/%hostname%.yml master 节点主机变量定义文件

注意执行的%hostname%.yml需要与inventory.ini中需要执行的服务器名称对应，否则执行过程中回报错。

sourcedefine:
  - name: r1
    type: avro
    channels: c1
    bind: '{{ ansible_hostname }}'
    port: 4541
    selectorenable: true
    selector:
      type: multiplexing
      header: kafkaTopic
      kafkatopic: ogmanager-flume
      channels: c1
  - name: r2
    type: 'com.cyclone.data.flume.source.TaildirRecursiveSource'
    channels: c1
    udfenable: false
    filegroup:
      - name: fg
        path: '/data/agent-status/.*\\.log'
    skiptoend: false
  - name: r3
    type: 'com.cyclone.data.flume.source.TaildirRecursiveSource'
    filegroup:
      - name: flume
        path: '{{flumeBase}}/flume/logs/.*\\.log'
        rulename: flume
        storename: agent_proxy
      - name: logstash
        path: '/opt/logstash/logs/.*\\.log'
        rulename: logstash
        storename: agent_proxy
      - name: webservice
        path: '/data/webservice/.*'
        rulename: webservice
        storename: webservice
    udfenable: true
    interceptorsenable: true
    skiptoend: false
    interceptors:
      - name: i1
        kv:
          - type: timestamp
      - name: i2
        kv:
          - type: host
          - hostHeader: '@ip'
      - name: i3
        kv:
          - type: com.cyclone.data.flume.interceptor.TimezoneInterceptor$Builder
          - timezoneHeader: '@time_zone'
      - name: i4
        kv:
          - type: static
          - key: '@store_name'
          - value: agent-proxy
      - name: i5
        kv:
          - type: static
          - key: '@log_identifier'
          - value: 'hostname:{{ ansible_hostname }}##ip:{{ ansible_host }}'
      - name: i6
        kv:
          - type: static
          - key: key
          - value: '{{ ansible_host }}'
sinkdefine:
  - name: k1
    channel: c1
    type: 'com.cyclone.data.flume.sink.KafkaLightSink'
    bindingname: "{{ groups['kafka'] | list }}"
    bindingport: '{{ kafka.port }}'
    kafkatopic: logmanager-flume
    producerack: all
    producerlinger: 'linger.ms'
    producercompression: snappy
  - name: k2
    channel: c2
    type: 'org.apache.flume.sink.kafka.KafkaSink'
    bindingname: "{{ groups['kafka'] | list }}"
    bindingport: '{{ kafka.port }}'
    kafkatopic: agent-status
    producerack: all
    producerlinger: 'max.in.flight.requests.per.connection'
    #producercompression: snappy
  - name: k3
    channel: c3
    type: 'com.cyclone.data.flume.sink.KafkaLightSink'
    bindingname: "{{ groups['kafka'] | list }}"
    bindingport: '{{ kafka.port }}'
    kafkatopic: logmanager-flume
    producerack: all
    producerlinger: 'linger.ms'
    producercompression: snappy

channeldefine:
  - name: c1
    type: file
  - name: c2
    type: file
  - name: c3
    type: file

./inventory/host_vars/%hostname%.yml slave 节点主机变量定义文件

注意执行的%hostname%.yml需要与inventory.ini中需要执行的服务器名称对应，否则执行过程中回报错。

sourcedefine:
  - name: r1
    tochannel: c1
    interceptors: true
    filegroups:
      - path: '/home/lsj/logs/test\\.log'
        filegroup: test1
        kafkatopic: logmanager-flumeA
    rulename: test1
    storename: bigdata
    skiptoend: false

sinkdefine:
  - name: k1
    tochannel: c1
    type: avro
    bindingname: "{{ groups['kafka'] | list }}"
    bindingport: 4541

channeldefine:
  - name: c1
    type: file
    checkpointdir: '/opt/flume/checkpointDir/c1'
    dataDirs: '/opt/flume/fileChannel/c1'

ansible文件执行的部署角色

安装目录/roles/agent：针对centos7系统安装flume
安装目录/roles/agent-master：针对centos7系统部署flume master节点配置文件，并启动服务（可选，如果需要启动可在roles/agent-slave/tasks/main.yml中解除名称为start service的步骤的注释）
安装目录/roles/agent-slave：针对centos7系统部署flume slave节点配置文件，并启动服务（可选，如果需要启动可在roles/agent-slave/tasks/main.yml中解除名称为start service的步骤的注释）
安装目录/roles/agent-java：针对centos系统创建服务器启动用户、安转java组件
安装目录/roles/agent-logstash：针对centos7系统，安装logstash组件配置并启动服务
安装目录/roles/rsyncd：针对centos7系统，安装并配置rsync 仓库用于接受服务器日志
安装目录/roles/agent6：针对centos6系统
安装目录/roles/agent6-java：针对centos6系统
安装目录/roles/agent6-slave：针对centos6系统

执行部署角色

sudo ansible-playbook -i inventory/inventory.ini flume.yml

部署完成后检查flume、logstash等组件安装目录的权限

[user@hostname-2 opt]$ ll
total 513268
...
drwxr-xr-x 15 logmanager logmanager      4096 Mar  4 16:37 flume
drwxr-xr-x 14 logmanager logmanager      4096 Feb  3 19:57 logstash
...

部署完成后不会自动启动服务，需要确认flume-conf中配置项后，使用如下命令启动flume

# 启动服务命令
sudo systemctl start flume
sudo systemctl enable flume
# 启动服务后log文件路径
安装目录/flume/logs/flume.log

Linux 服务器 flume组件部署流程

linux服务器flume组件

上传``apache-flume-1.7.0-bin.tgz至服务器/opt目录中，并使用命令tar xfapache-flume-1.7.0-bin.tgz`解压缩。

解压缩后会在/opt目录中生成flume目录，目录内容如下

[user@hostname-3 flume]$ tree /opt/flume
/opt/flume
├── bin
│   ├── flume-ng
│   ├── flume-ng.cmd
│   └── flume-ng.ps1
├── CHANGELOG
├── conf
│   ├── flume-conf.properties.template
│   ├── flume-env.ps1.template
│   ├── flume-env.sh.template
│   └── log4j.properties
├── DEVNOTES
├── doap_Flume.rdf
├── docs
│   └── ...
├── lib
│   └── ...
├── LICENSE
├── NOTICE
├── README.md
├── RELEASE-NOTES
└── tools
    └── ...

在 安装目录/flume/conf中创建配置文件flume-conf.properties

# slave节点配置文件
[user@hostname-3 conf]$ cat flume-conf.properties
# example.conf: A single-node Flume configuration

# Name the components on this agent a1
a1.sources = r1 r2
a1.sinks = k1
a1.channels = c1

# ===================r1:tail dir recursive source1=================
# 定义使用的channel管道
a1.sources.r1.channels = c1
# 定义使用的组件类型
a1.sources.r1.type = com.cyclone.data.flume.source.TaildirRecursiveSource
# 空格分隔的文件组列表，每个分组代表一系列的文件
a1.sources.r1.filegroups =  flume  hadoop
a1.sources.r1.filegroups.flume = /opt/flume/logs/.*\\.log
a1.sources.r1.headers.flume.kafkaTopic = logmanager-flume
a1.sources.r1.headers.flume.@rule_name = flume
a1.sources.r1.filegroups.hadoop = /data/hadoop/logs/.*\\.log
a1.sources.r1.headers.hadoop.kafkaTopic = logmanager-flume
a1.sources.r1.headers.hadoop.@rule_name = hadoop
# 定义是否使用递归方式读取文件
a1.sources.r1.custom.recursive.read = true
# 是否从末尾读取文件
a1.sources.r1.skipToEnd = true
# 为了方便清理测试数据
# 以json格式记录读取文件的inode和对应文件的最后读取位置
a1.sources.r1.positionFile = /opt/flume/tailDirRecursiveSource/r1/taildir_position.json
# 设置拦截器
a1.sources.r1.interceptors = i1 i2 i3 i4 i5 i6
# 设置时间戳
a1.sources.r1.interceptors.i1.type = timestamp
# 设置hostname
a1.sources.r1.interceptors.i2.type = host
a1.sources.r1.interceptors.i2.hostHeader = @ip
# 设置时区
a1.sources.r1.interceptors.i3.type = com.cyclone.data.flume.interceptor.TimezoneInterceptor$Builder
a1.sources.r1.interceptors.i3.timezoneHeader = @time_zone
# 设置store_name（内容要用_进行连接）
a1.sources.r1.interceptors.i4.type = static
a1.sources.r1.interceptors.i4.key = @store_name
a1.sources.r1.interceptors.i4.value = cap_dev
# 设置自定义字段
a1.sources.r1.interceptors.i5.type = static
a1.sources.r1.interceptors.i5.key = @log_identifier
a1.sources.r1.interceptors.i5.value = hostname:cyclone-analytics-3##ip:172.20.3.249
# 设置topic的key
a1.sources.r1.interceptors.i6.type = static
a1.sources.r1.interceptors.i6.key = key
a1.sources.r1.interceptors.i6.value = 172.20.3.249


# ==========================k1:kafka sink========================
# 定义使用的channel管道
a1.sinks.k1.channel = c1
# 定义使用的组件类型
a1.sinks.k1.type = avro
# 绑定的hostname
a1.sinks.k1.hostname = cyclone-analytics-2
#
# 绑定额端口
a1.sinks.k1.port = 4541

# ========================c1:file channel=========================
# 定义管道类型
a1.channels.c1.type = file
# 为了方便清理测试数据
# checkpoint文件的存储位置
a1.channels.c1.checkpointDir = /opt/flume/checkpointDir/c1
# 用逗号分隔的存储文件的目录，使用不同磁盘上的不同目录可以提升性能
a1.channels.c1.dataDirs = /opt/flume/fileChannel/c1

# master节点配置文件样例文件

# Name the components on this agent a1
a1.sources = r1 r2 r3
a1.sinks = k1 k2 k3
a1.channels = c1 c2 c3

# ===================r1:tail dir recursive source1=================
# 定义使用的channel管道
a1.sources.r1.channels = c1
# 定义使用的组件类型
a1.sources.r1.type = avro
# 绑定的hostname
a1.sources.r1.bind = cyclone-analytics-2
# 文件组的绝对路径，支持文件名的正则表达式
a1.sources.r1.port = 4541

a1.sources.r1.selector.type = multiplexing
a1.sources.r1.selector.header = kafkaTopic
a1.sources.r1.selector.mapping.logmanager-flume = c1

# ==========================k1:kafka sink========================
# 定义使用的channel管道
a1.sinks.k1.channel = c1
# 定义使用的组件类型
a1.sinks.k1.type = com.cyclone.data.flume.sink.KafkaLightSink
# 定义连接的kafka broker的列表，建议使用两个作为高可用，以逗号隔开
a1.sinks.k1.kafka.bootstrap.servers = cyclone-analytics-1:9092,cyclone-analytics-2:9092,cyclone-analytics-3:9092
#
# 定义向kafka发送信息的topic
a1.sinks.k1.kafka.topic = logmanager-flume
# 等待ISR列表中所有的副本完成同步后才算发送成功
a1.sinks.k1.kafka.producer.acks = all
# 
a1.sinks.k1.kafka.producer.linger.ms = 1
# 设置消息压缩方式
a1.sinks.k1.kafka.producer.compression.type = snappy

# ========================c1:file channel=========================
# 定义管道类型
a1.channels.c1.type = file
# 为了方便清理测试数据
# checkpoint文件的存储位置
a1.channels.c1.checkpointDir = /opt/flume/checkpointDir/c1
# 用逗号分隔的存储文件的目录，使用不同磁盘上的不同目录可以提升性能
a1.channels.c1.dataDirs = /opt/flume/fileChannel/c1

# ===================r2:tail dir recursive source2=================
# 定义使用的channel管道
a1.sources.r2.channels = c2
# 定义使用的组件类型
a1.sources.r2.type = com.cyclone.data.flume.source.TaildirRecursiveSource
# 空格分隔的文件组列表，每个分组代表一系列的文件
a1.sources.r2.filegroups = fg
# 文件组的绝对路径，支持文件名的正则表达式
a1.sources.r2.filegroups.fg = /data/agent-status/.*\\.log
#a1.sources.r2.filegroups.fg = /opt/flume/data/agent-status/.*\\.log
# 定义是否使用递归方式读取文件
a1.sources.r2.custom.recursive.read = true
# 为了方便清理测试数据
# 以json格式记录读取文件的inode和对应文件的最后读取位置
a1.sources.r2.positionFile = /opt/flume/tailDirRecursiveSource/r2/taildir_position.json

# ==========================k2:kafka sink========================
# 定义使用的channel管道
a1.sinks.k2.channel = c2
# 定义使用的组件类型
a1.sinks.k2.type = org.apache.flume.sink.kafka.KafkaSink
# 定义连接的kafka broker的列表，建议使用两个作为高可用，以逗号隔开
a1.sinks.k2.kafka.bootstrap.servers = cyclone-analytics-1:9092,cyclone-analytics-2:9092,cyclone-analytics-3:9092
#
# 定义向kafka发送信息的topic
a1.sinks.k2.kafka.topic = agent-status
# 等待ISR列表中所有的副本完成同步后才算发送成功
a1.sinks.k2.kafka.producer.acks = all
a1.sinks.k2.kafka.producer.max.in.flight.requests.per.connection = 1

# ========================c2:file channel=========================
# 定义管道类型
a1.channels.c2.type = file
# 为了方便清理测试数据
# checkpoint文件的存储位置
a1.channels.c2.checkpointDir = /opt/flume/checkpointDir/c2
# 用逗号分隔的存储文件的目录，使用不同磁盘上的不同目录可以提升性能
a1.channels.c2.dataDirs = /opt/flume/fileChannel/c2

#====================================================代理机 agent日志 + webservice=============================================

# ===================r3:tail dir recursive source3=================
# 定义使用的channel管道
a1.sources.r3.channels = c3
# 定义使用的组件类型
a1.sources.r3.type = com.cyclone.data.flume.source.TaildirRecursiveSource
# 空格分隔的文件组列表，每个分组代表一系列的文件
a1.sources.r3.filegroups = flume logstash webservice
# flume
a1.sources.r3.filegroups.flume = /opt/flume/logs/.*\\.log
a1.sources.r3.headers.flume.@rule_name = flume
a1.sources.r3.headers.flume.@store_name = agent_proxy
# logstash
a1.sources.r3.filegroups.logatash = /opt/logstash/logs/.*\\.log
a1.sources.r3.headers.logstash.@rule_name = logstash
a1.sources.r3.headers.logstash.@store_name = agent_proxy
# webservice
a1.sources.r3.filegroups.webservice = /data/webservice/.*
a1.sources.r3.headers.webservice.@rule_name = webservice
a1.sources.r3.headers.webservice.@store_name = webservice
# 定义是否使用递归方式读取文件
a1.sources.r3.custom.recursive.read = true
# 是否从末尾读取文件
a1.sources.r3.skipToEnd = true
# 为了方便清理测试数据
# 以json格式记录读取文件的inode和对应文件的最后读取位置
a1.sources.r3.positionFile = /opt/flume/tailDirRecursiveSource/r3/taildir_position.json
# 设置拦截器
a1.sources.r3.interceptors = i1 i2 i3 i5 i6
# 设置时间戳
a1.sources.r3.interceptors.i1.type = timestamp
# 设置hostname
a1.sources.r3.interceptors.i2.type = host
a1.sources.r3.interceptors.i2.hostHeader = @ip
# 设置时区
a1.sources.r3.interceptors.i3.type = com.cyclone.data.flume.interceptor.TimezoneInterceptor$Builder
a1.sources.r3.interceptors.i3.timezoneHeader = @time_zone
# 设置store_name（内容要用_进行连接）
#a1.sources.r3.interceptors.i4.type = static
#a1.sources.r3.interceptors.i4.key = @store_name
#a1.sources.r3.interceptors.i4.value = agent-proxy
# 设置自定义字段
a1.sources.r3.interceptors.i5.type = static
a1.sources.r3.interceptors.i5.key = @log_identifier
a1.sources.r3.interceptors.i5.value = hostname:cyclone-analytics-2##ip:172.20.3.248
# 设置topic的key
a1.sources.r3.interceptors.i6.type = static
a1.sources.r3.interceptors.i6.key = key
a1.sources.r3.interceptors.i6.value = 172.20.3.248

# ==========================k3:kafka sink========================
# 定义使用的channel管道
a1.sinks.k3.channel = c3
# 定义使用的组件类型
a1.sinks.k3.type = com.cyclone.data.flume.sink.KafkaLightSink
# 定义连接的kafka broker的列表，建议使用两个作为高可用，以逗号隔开
a1.sinks.k3.kafka.bootstrap.servers = cyclone-analytics-2:9092
# 定义向kafka发送信息的topic
a1.sinks.k3.kafka.topic = logmanager-flume
# 等待ISR列表中所有的副本完成同步后才算发送成功
a1.sinks.k3.kafka.producer.acks = all
# 
a1.sinks.k3.kafka.producer.linger.ms = 1
# 设置消息压缩方式
a1.sinks.k3.kafka.producer.compression.type = snappy

# ========================c3:file channel=========================
# 定义管道类型
a1.channels.c3.type = file
# 为了方便清理测试数据
# checkpoint文件的存储位置
a1.channels.c3.checkpointDir = /opt/flume/checkpointDir/c3
# 用逗号分隔的存储文件的目录，使用不同磁盘上的不同目录可以提升性能
a1.channels.c3.dataDirs = /opt/flume/fileChannel/c3

以及flume启动时的环境变量文件flume-env.sh

export FLUME_HOME=/opt/flume
export JAVA_HOME=/usr/java/jdk1.8.0_261-amd64
export JAVA_OPTS="-Xms512m -Xmx512m -Dcom.sun.management.jmxremote"

上传flume插件压缩文件至 安装目录/flume/ ，并解压缩至 安装目录/flume/plugins.d 目录下

添加flume service文件至 /lib/systemd/system/flume.service

[user@hostname-3 ~]$ cat /lib/systemd/system/flume.service 
[Unit]
Description=Apache Flume
Wants=network-online.target
After=network-online.target

[Service]
EnvironmentFile=-/opt/flume/conf/flume.env
WorkingDirectory=/opt/flume

User=cyclone
Group=cyclone

ExecStart=/opt/flume/bin/flume-ng agent \
    --name a1 \
    -c conf \
    -f conf/flume-conf.properties \
    -Dflume.root.logger=INFO,LOGFILE

LimitNOFILE=65536
LimitNPROC=2048
KillSignal=SIGTERM
KillMode=process
SendSIGKILL=no
Restart=always
TimeoutStopSec=60

[Install]
WantedBy=multi-user.target

[user@hostname-3 ~]$ systemctl daemon-reload

启动flume服务，并设置为开启启动

[user@hostname-3 ~]$ systemctl start flume
[user@hostname-3 ~]$ systemctl enable flume

Linux rsync server端

如果需要使用重启组件的功能，需要执行脚本的用户拥有免密使用sudo命令的权限

使用root用户执行 visudo 命令，在文件最后添加以下内容后依次输入Esc : wq Enter 保存退出，其中username为需要添加sudo权限的用户的用户名

username ALL=(ALL) NOPASSWD: ALL

在集中采集服务器中安装rsync

sudo yum install rsync

编辑rsyncd服务的配置文件

sudo vi /etc/rsyncd.conf
log file = /var/log/rsyncd.log
pidfile = /var/run/rsyncd.pid
lock file = /var/run/rsync.lock
secrets file = /etc/users
[agent-status]
    path = /data/agent-status
    comment = sync agent file
    uid = root
    gid = root
    port = '873'
    ignore errors
    use chroot = yes
    read only = no
    list = no
    max connections = 200
    timeout = 600
    auth users = logmanager

启动rsyncd服务并设置服务为开机启动

sudo systemctl start rsyncd

sudo systemctl enable rsyncd

创建用于同步数据的目录

sudo make -p /data/agent-status

配置用于定时清理agent状态检查日志的定时任务

使用命令

cron -e

添加如下内容

# agent-statue log cleaner
1 1 * * * find /data/agent-status \( -name "*.out.*" -o -name '*.log.*' \) -type f -mtime +6 -delete

Windows服务器agent节点部署流程

部署filebeat：

服务器安装完成java并配置好JAVA_HOME和PATH环境变量后，上传filebeat安装文件，进行安装。

修改配置文件

filebeat:
  inputs:
    - type: log
      enabled: true
      paths:
        - C:\logs\**\*.log*  
      encoding: utf-8 
      scan_frequency: 1s
      recursive_glob.enabled: true
      backoff: 1s # 当读到文件末尾时，检查文件是否有新内容的间隔时间
      close_inactive: 10m 
      close_renamed: false
      close_removed: true 
      clean_inactive: 0
      clean_removed: true
      fields:
        log_identifier: hostname:arvin##ip:127.0.0.1
        rule_name: test
        store_name: test
      fields_under_root: true
      tail_files: true # 读取新文件时，会在文件的末尾开始读取
      max_bytes: 102400 # 单条日志的最大值100KB


#output.file:
#  path: C:\Users\edz\Desktop\filebeat
#  filename: filebeat.log
  
output.logstash:
  hosts: [172.20.3.248:5044]
  bulk_max_size: 512 # 一个单独的logstash请求中事件的最大数量
  slow_start: true # 如果启用，每个事务只传输一批事件中的事件子集。如果没有发生错误，事件的数量将会增长到bulk_max_size.如果发生错误，将会减少。
  
# 日志
logging.level: info
logging.to_file: true
logging.files: 
  name: filebeat.log
  keepfiles: 7
  permissions: 0644

# 内存队列
queue.mem:
  events: 512
  flush.min_events: 512
  flush.timeout: 1s
  
# 设置同时执行的cpu数量
max_procs: 1

# filebeat关闭前等待的时间，可以发送内存中的数据并且接受相应写入registry中
filebeat.shutdown_timeout: 5s

配置filebeat为系统服务

sc create filebeat binPath= “FILEBEAT_HOME\filebeat.exe -c FILEBEAT_HOME\filebeat.yml" start= delayed-auto

部署rsync

上传rsync安装文件，并进行安装，建议安装在c盘或d盘根目录下。方便调用.调用时，可使用C:\ICW\bin\rsync.exe [--args]

上传agent健康状态检查脚本
编辑bat文件内容：

# 探针状态检查脚本
rem 获取探针状态
for /f "tokens=4" %%i in ('sc query filebeat ^| find /i "STATE"') do set agent_status=%%i
rem 获取日期
set date=%date:~0,4%-%date:~5,2%-%date:~8,2%
rem 获取时间
set time=%date:~0,4%-%date:~5,2%-%date:~8,2% %time:~0,2%:%time:~3,2%:%time:~6,2%
rem 获取机器名
set hostname=%COMPUTERNAME%
rem 获取ip
for /f "delims=: tokens=2" %%i in ('ipconfig ^| find /i "ipv4"') do set ip=%%i
set "ip=%ip: =%"
rem 对ip和hostname进行判空
if "%hostname%" == "" set hostname=localhost
if "%ip%" == "" set ip=127.0.0.1
rem 获取当前路径
set path=%~dp0
set path=%path:~0,-1%
rem 获取探针类型
set agent_type=filebeat
rem 获取探针状态
if "%agent_status%" == "RUNNING" (
    set status=normal
) else (
    rem 如果探针状态为STOPPED，则进行重启
    set status=error
	if "%agent_status%" == "STOPPED" (
	    rem 需要以管理员权限进行执行
	    sc start filebeat
	)
)
rem 获取日志名
set log_name=filebeat-status-%date%.log
rem 获取日志全路径，需要提前创建相关目录
set log_path=%path%\agent-status\%log_name%
rem 获取日志内容
set log=%time%,%hostname%,%ip%,%path%,%agent_type%,%status%
rem 将日志内容输出到文件中
echo %log% >> %log_path%

探针状态日志同步脚本

cd C:\Users\testuser\Desktop\filebeat\agent-status
C:\ICW\bin\rsync.exe -av --append ./* [email protected]::agent-status/172.0.0.4/

配置健康状态检测脚本：

配置exe4j需要的环境变量EXE4J_JAVA_HOME,

set EXE4J_JAVA_HOME

部署timezone.exe

运行后生成配置文件所需的信息。生成如下txt文件，内含修改配置文件所需参数。

修改配置文件信息 filebeat.yml

修改相应配置：
log_identifier rule_name store_name tail_file encoding等
将filebeat配置为系统服务

运行图中install-service-filebeat.ps1 脚本即可将filebeat配置为系统服务

设置agent-status.bat定时任务

进入计划任务设置面板，创建定时任务

设置探针状态检查定时任务

在下图步骤中设置完成后点击确定

设置rsync定时任务

在下图步骤中设置完成后点击确定

安装kafka-tools检查数据是否进入消息队列

Linux服务器agent节点部署流程

再服务器中部署好java，并配置好JAVA_HOME、PATH等变量,并创建logmanager用户。

sudo yum install openjdk-1.8.0
rpm -qa|grep jdk
 java-1.8.0-openjdk-headless-1.8.0.262.b10-0.el7_8.x86_64

sudo vim /etc/profile.d/flume.sh
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.262.b10-0.el7_8.x86_64
export FLUME_HOME=/opt/flume
export PATH=$JAVA_HOME/bin:$FLUME_HOME/bin:$PATH

sudo cp /etc/profile.d/flume.sh /opt/flume/conf/flume.env
sudo cp /etc/profile.d/flume.sh /opt/flume/conf/flume-env.sh

部署flume

上传flume安装包及flume插件安装包至服务器中/opt目录下,并将flume配置为系统服务

sudo tar -zxf /path/to/apache-flume-1.7.0-bin.tgz -C /opt/
sudo tar -zxf /path/to/plugins.d.tar -C /opt/pludins.d/
# 将flume配置为系统服务
sudo cat << EOF
[Unit]
Description=Apache Flume
Wants=network-online.target
After=network-online.target

[Service]
EnvironmentFile=-/opt/flume/conf/flume.env
WorkingDirectory=/opt/flume

User=logmanager
Group=logmanager

ExecStart=/opt/flume/bin/flume-ng agent \
    --name a1 \
    -c conf \
    -f conf/flume-conf.properties \
    -Dflume.root.logger=INFO,LOGFILE

LimitNOFILE=65536
LimitNPROC=2048
KillSignal=SIGTERM
KillMode=process
SendSIGKILL=no
Restart=always
TimeoutStopSec=60

[Install]
WantedBy=multi-user.target
EOF > /usr/lib/systemd/system/flume.service

# 如设置flume的数据目录和日志目录为/data/flume/{data,logs}
sudo mkdir -p /data/flume/{data,logs}

修改flume配置文件

sudo vim /opt/flume/conf/flume-conf.property
# example.conf: A single-node Flume configuration

# Name the components on this agent a1
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# ===================r1:tail dir recursive source1=================
# 定义使用的channel管道
a1.sources.r1.channels = c1
# 定义使用的组件类型
a1.sources.r1.type = pi.dev.flume.source.TaildirRecursiveSource
# 空格分隔的文件组列表，每个分组代表一系列的文件
a1.sources.r1.filegroups = fg
# 文件组的绝对路径，支持文件名的正则表达式
# 设置文件组的key

a1.sources.r1.filegroups.fg = /data/hadoop/logs/.*\\.log /data/flume/logs/.*\\.log
a1.sources.r1.headers.fg.kafkaTopic = logmanager-flume

# 定义是否使用递归方式读取文件
a1.sources.r1.custom.recursive.read = true
# 是否从末尾读取文件
a1.sources.r1.skipToEnd = true
# 为了方便清理测试数据
# 以json格式记录读取文件的inode和对应文件的最后读取位置
a1.sources.r1.positionFile = /opt/flume/tailDirRecursiveSource/r1/taildir_position.json
# 设置拦截器
a1.sources.r1.interceptors = i1 i2 i4 i5 i6
# 设置时间戳
a1.sources.r1.interceptors.i1.type = timestamp
# 设置hostname
a1.sources.r1.interceptors.i2.type = host
a1.sources.r1.interceptors.i2.hostHeader = hostname
#a1.sources.r1.interceptors.i3.type = static
#a1.sources.r1.interceptors.i3.key = @rule_name
#a1.sources.r1.interceptors.i3.value =
# 设置store_name（内容要用_进行连接）
a1.sources.r1.interceptors.i4.type = static
a1.sources.r1.interceptors.i4.key = @store_name
a1.sources.r1.interceptors.i4.value = cap_dev
# 设置自定义字段
a1.sources.r1.interceptors.i5.type = static
a1.sources.r1.interceptors.i5.key = @log_identifier
a1.sources.r1.interceptors.i5.value = hostname:cyclone-analytics-1##ip:172.20.3.247
# 设置topic的key
a1.sources.r1.interceptors.i6.type = static
a1.sources.r1.interceptors.i6.key = key
a1.sources.r1.interceptors.i6.value = 172.20.3.247

# ==========================k1:kafka sink========================
# 定义使用的channel管道
a1.sinks.k1.channel = c1
# 定义使用的组件类型
a1.sinks.k1.type = avro
# 绑定的hostname
a1.sinks.k1.hostname = cyclone-analytics-2
#
# 绑定额端口
a1.sinks.k1.port = 4541

# ========================c1:file channel=========================
# 定义管道类型
a1.channels.c1.type = file
# 为了方便清理测试数据
# checkpoint文件的存储位置
a1.channels.c1.checkpointDir = /opt/flume/checkpointDir/c1
# 用逗号分隔的存储文件的目录，使用不同磁盘上的不同目录可以提升性能
a1.channels.c1.dataDirs = /opt/flume/fileChannel/c1


sudo vim log4j.property
# Define some default values that can be overridden by system properties.
#
# For testing, it may also be convenient to specify
# -Dflume.root.logger=DEBUG,console when launching flume.

#flume.root.logger=DEBUG,console
flume.root.logger=INFO,LOGFILE
flume.log.dir=/opt/flume/logs
flume.log.file=flume.log

log4j.logger.org.apache.flume.lifecycle = INFO
log4j.logger.org.jboss = WARN
log4j.logger.org.mortbay = INFO
log4j.logger.org.apache.avro.ipc.NettyTransceiver = WARN
log4j.logger.org.apache.hadoop = INFO
log4j.logger.org.apache.hadoop.hive = ERROR

# Define the root logger to the system property "flume.root.logger".
log4j.rootLogger=${flume.root.logger}


# Stock log4j rolling file appender
# Default log rotation configuration
log4j.appender.LOGFILE=org.apache.log4j.RollingFileAppender
log4j.appender.LOGFILE.MaxFileSize=100MB
log4j.appender.LOGFILE.MaxBackupIndex=10
log4j.appender.LOGFILE.File=${flume.log.dir}/${flume.log.file}
log4j.appender.LOGFILE.layout=org.apache.log4j.PatternLayout
log4j.appender.LOGFILE.layout.ConversionPattern=%d{dd MMM yyyy HH:mm:ss,SSS} %-5p [%t] (%C.%M:%L) %x - %m%n


# Warning: If you enable the following appender it will fill up your disk if you don't have a cleanup job!
# This uses the updated rolling file appender from log4j-extras that supports a reliable time-based rolling policy.
# See http://logging.apache.org/log4j/companions/extras/apidocs/org/apache/log4j/rolling/TimeBasedRollingPolicy.html
# Add "DAILY" to flume.root.logger above if you want to use this
log4j.appender.DAILY=org.apache.log4j.rolling.RollingFileAppender
log4j.appender.DAILY.rollingPolicy=org.apache.log4j.rolling.TimeBasedRollingPolicy
log4j.appender.DAILY.rollingPolicy.ActiveFileName=${flume.log.dir}/${flume.log.file}
log4j.appender.DAILY.rollingPolicy.FileNamePattern=${flume.log.dir}/${flume.log.file}.%d{yyyy-MM-dd}
log4j.appender.DAILY.layout=org.apache.log4j.PatternLayout
log4j.appender.DAILY.layout.ConversionPattern=%d{dd MMM yyyy HH:mm:ss,SSS} %-5p [%t] (%C.%M:%L) %x - %m%n


# console
# Add "console" to flume.root.logger above if you want to use this
log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.target=System.err
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=%d (%t) [%p - %l] %m%n

启动flume服务

sudo systemctl start flume
sudo systemctl enable flume

部署flume节点健康状态检查脚本

sudo mkdir /data/agent-status
sudo touch /data/agent-status/agent-status.sh
sudo chmod +x /data/agent-status/agent-status.sh
sudo vim /data/agent-status/agent-status.sh
@echo off
rem 获取探针状态
for /f "tokens=4" %%i in ('sc query filebeat ^| find /i "STATE"') do set agent_status=%%i
rem 获取日期
set date=%date:~0,4%-%date:~5,2%-%date:~8,2%
rem 获取时间
set time=%date:~0,4%-%date:~5,2%-%date:~8,2% %time:~0,2%:%time:~3,2%:%time:~6,2%

rem 获取当前路径
set path=%~dp0
set path=%path:~0,-1%

rem 将hostname的值输出到文件中
set hostname_file="%path%\hostname.txt"
rem 获取机器名
set hostname=%COMPUTERNAME%
if not exist %hostname_file% (
	echo %hostname%>%hostname_file%
)
rem 设置hostname的值
set /p hostname=<%hostname_file%

rem 将ip的值输出到文件中
set ip_file="%path%\ip.txt"
rem 获取ip
for /f "delims=: tokens=2" %%i in ('ipconfig ^| find /i "ipv4"') do set ip=%%i
set "ip=%ip: =%"
if not exist %ip_file% (
	echo %ip%>%ip_file%
)
rem 设置ip的值
set /p ip=<%ip_file%

rem 创建bat错误日志的目录
set bat_log_path=%path%\agent-status-bat-log
if not exist "%log_path%" ( 
   md %bat_log_path%
)

rem 设置bat脚本日志的文件
set bat_log=%bat_log_path%\agent-status.log

rem 对ip和hostname进行判空
if "%hostname%" == "" set hostname=localhost
rem ip为空，则输出日志信息推出脚本 
if "%ip%" == "" (
	echo "IP can not be empty.">> %bat_log%
	goto end
)

rem 获取探针类型
set agent_type=filebeat
rem 获取探针状态
if "%agent_status%" == "RUNNING" (
    set status=normal
) else (
    rem 如果探针状态为STOPPED，则进行重启
    set status=error
	if "%agent_status%" == "STOPPED" (
	    rem 需要以管理员权限进行执行
	    sc start filebeat
	)
)

rem 获取时区信息
SET time_zone_file="%path%\timezone.txt"

if not exist %time_zone_file% (
	echo "%time% timezone.txt does not exit. Please run timezone.exe.">> %bat_log%
	goto end
)
set /p timezone=<%time_zone_file%

rem 获取创建时间
SET create_time_file="%path%\create-time.txt"

rem 如果不存在将当前时间写入文件中
if not exist %create_time_file% (
	echo %time%> %create_time_file%
)
set /p create_time=<%create_time_file%

if "%create_time%"=="" (
	echo "%time% create time is empty."> %bat_log%
	goto end
)

rem 获取日志名
set agent_log_name=filebeat-status-%date%.log
rem 获取日志全路径，需要提前创建相关目录
set agent_log_path=%path%\agent-status\%agent_log_name%
rem 获取日志内容
set agent_log=%time%,%hostname%,%ip%,%path%,%agent_type%,%status%,%timezone%,%create_time%
rem 将日志内容输出到文件中
echo %agent_log%>> %agent_log_path%
:end
exit

配置定时检查健康状态、定时同步健康状态检查日志、定时清理flume日志、定时清理健康检查日志

部署rsync同步agent状态日志脚本

sudo vim /data/flume/shell/rsyncClient.sh
work_path=$(dirname $0)
work_path="$(cd "${work_path}"; pwd)"
User={{ flume.user }}
Server={{ flume.server }}
/usr/bin/rsync -av --append log_name=${work_path}/flume-status $User@$Server::agent-status/{{ ansible_env.SSH_CLIENT.split() | first }}/

使用命令

cron -e

添加如下内容

# flume logs cleaner
1 1 * * * find /data/flume/logs \( -name "*.out.*" -o -name '*.log.*' \) -type f -mtime +6 -delete > /dev/null
# agent-statue log cleaner
1 1 * * * find /data/agent-status \( -name "*.out.*" -o -name '*.log.*' \) -type f -mtime +6 -delete > /dev/null
# agent healthy check
* * * * * sh -c "/opt/flume/agent-status/agent-status.sh"
# rsync transfer healthy check log
* * * * * sh -c "/opt/flume/rsyncClient.sh"

探针修改配置文件

方法1：

在对应服务器的ansible主机变量中添加目标文件定义

# example file: inventory/host_vars/hostname-1.yml
# sourcedefine 定义需要采集的文件
sourcedefine:
    # 定义第一组采集的文件 名字定义为r1
  - name: r1
    # 该组文件内容采集完毕后传输至 channel 的名字，对channel的定义见下方 channeldefine 内容
    tochannel: c1
    # logmanager系统中配置的采集数据的label
    storename: network_core
    rulename: hadoop_log
    # 具体需要被采集的文件的定义
    filegroups:
        # 被采集的文件路径
      - path: '/data/example1/logs/.*\\.log'
        # 日志文件所属组
        filegroup: example1
        # 文件传输至kafka时使用的topic
        kafkatopic: logmanager-flume
    # 是否只读取新增内容
    skiptoend: false
  #- name: r2
  #  storename: network_core
  #  tochannel: c1
  #  rulename: hadoop_log
  #  filegroups:
  #    - path: '/data/example2/logs/.*\\.log'
  #      filegroup: example2
  #      kafkatopic: logmanager-flumes
  #  skiptoend: false

# 数据传输目的地定义
sinkdefine:
    # 自定义名称
  - name: k1
    # 读取队列配置，对应channeldefine 中的内容
    tochannel: c1
    # avro是一个数据接收服务
    type: avro
    # 配置kafka链接地址列表
    bindingname: "{{ groups['kafka'] | list }}"
    # 为flume绑定一个端口
    bindingport: 4541
  #- name: k2
  #  type: avro
  #  bindingname: "{{ groups['kafka'] | list }}"
  #  bindingport: 4541

# 数据传输队列定义
channeldefine:
    # 自定义队列名称
  - name: c1
    # 配置数据队列类型为file
    type: file
    # 数据传输检查点定义
    checkpointdir: '/opt/flume/checkpointDir/c1'
    # 数据传输中间过程临时存储
    dataDirs: '/opt/flume/fileChannel/c1'
  #- name: c2
  #  type: file
  #  checkpointdir: '/opt/flume/checkpointDir/c1'
  #  dataDirs: '/opt/flume/fileChannel/c1'

方法2：

手动安装flume

安装java

# 通过 yum 安装 openjdk
[root@hostname bin]# yum install java-1.8.0-openjdk.x86_64 java-1.8.0-openjdk-devel.x86_64 java-1.8.0-openjdk-headless.x86_64
# 查找 openjdk 的 JAVA_HOME
[root@hostname bin]# which java
/usr/bin/java
[root@hostname bin]# ls -lrt /usr/bin/java
lrwxrwxrwx. 1 root root 22 4月  12 13:50 /usr/bin/java -> /etc/alternatives/java
[root@hostname bin]# ls -lrt /etc/alternatives/java
lrwxrwxrwx. 1 root root 73 4月  12 13:50 /etc/alternatives/java -> /usr/lib/jvm/java-1.8.0-openjdk-1.8.0.282.b08-1.el7_9.x86_64/jre/bin/java

安装flume

# 创建用户logmanager
[root@hostname bin]# groupadd logmanager -g 552
[root@hostname bin]# useradd logmanager -u 552 -g 552 -M  -s /sbin/nologin
# 下载 flume 安装包 bin解压压缩包
[root@hostname bin]# wget https://archive.apache.org/dist/flume/1.7.0/apache-flume-1.7.0-bin.tar.gz
[root@hostname bin]# tar -zxf apache-flume-1.7.0-bin.tar.gz
[root@hostname bin]# mv flume /opt/
# 配置 flume 运行使用的环境变量
[root@hostname bin]# cat /opt/flume/conf/flume.env
FLUME_HOME=/opt/flume
JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.282.b08-1.el7_9.x86_64/jre
JAVA_OPTS="-Xms512m -Xmx512m -Dcom.sun.management.jmxremote"
PATH=${JAVA_HOME}/bin:${FLUME_HOME}/bin:$PATH
[root@hostname bin]# source /opt/flume/conf/flume.env

配置flume配置文件

# /${FLUME_HOME}/conf/flume-conf.properties
Agent的配置文件最好根据Flume的拓扑架构，依次写好每个节点的配置文件；
一.Agent

开头都是先要定义agent，sorce，channel，sink名

# Name the components on this agent（ 描述这个Agent，给各个组件取名字）
a1.sources = r1
a1.sinks = k1 k2
a1.channels = c1 c2

二.Source
taildir

# Describe/configure the source
a1.sources.r3.type = TAILDIR
#维护这每个文件读取到的最新的位置
a1.sources.r3.positionFile = /opt/module/flume/tail_dir.json
#可配置多目录
a1.sources.r3.filegroups = f1 f2
#正则匹配文件名
a1.sources.r3.filegroups.f1 = /opt/module/flume/files/.*file.*
a1.sources.r3.filegroups.f2 = /opt/module/flume/files/.*log.*

arvo

# Describe/configure the source
# source端的avro是一个数据接收服务
a1.sources.r1.type = avro
#接收的主机
a1.sources.r1.bind = hadoop102
#要和上级的avro的sink的端口一致
a1.sources.r1.port = 4141

netstat

# Describe/configure the source
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444

exec

# Describe/configure the source
a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /opt/module/hive/logs/hive.log
a1.sources.r1.shell = /bin/bash -c

spooldir

# Describe/configure the source
a1.sources.r3.type = spooldir
# 指定文件夹
a1.sources.r3.spoolDir = /opt/module/flume/upload
#指定文件上传后的后缀
a1.sources.r3.fileSuffix = .COMPLETED
a1.sources.r3.fileHeader = true
#忽略所有以.tmp结尾的文件，不上传
a1.sources.r3.ignorePattern = ([^ ]*.tmp)

三.Sink
hdfs

# Describe the sink
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://hadoop102:8020/flume/%Y%m%d/%H
#上传文件的前缀
a1.sinks.k1.hdfs.filePrefix = logs-
#是否对时间戳取整
a1.sinks.k1.hdfs.round = true
#多少时间单位创建一个新的文件夹
a1.sinks.k1.hdfs.roundValue = 1
#创建文件夹的时间单位
a1.sinks.k1.hdfs.roundUnit = day
#是否使用本地时间戳
a1.sinks.k1.hdfs.useLocalTimeStamp = true
#积攒多少个Event才flush到HDFS一次
a1.sinks.k1.hdfs.batchSize = 100
#设置文件类型，可支持压缩
a1.sinks.k1.hdfs.fileType = DataStream
#多久生成一个新的文件，单位:s
a1.sinks.k1.hdfs.rollInterval = 3600
#设置每个文件的滚动大小,一般略小于128M
a1.sinks.k1.hdfs.rollSize = 134217700
#文件的滚动与Event数量无关
a1.sinks.k1.hdfs.rollCount = 0

## 控制输出文件是原生文件。LZO压缩
a1.sinks.k1.hdfs.fileType = CompressedStream
a1.sinks.k1.hdfs.codeC = lzop

kafka(待续)
hbase(待续)
arvo

# Describe the sink
# sink端的avro是一个数据发送者
a1.sinks.k1.type = avro
#发送的目的主机ip
a1.sinks.k1.hostname = hadoop102 
a1.sinks.k1.port = 4141

logger

# Describe the sink
a1.sinks.k1.type = logger

本地目录(file_roll)

# Describe the sink
a3.sinks.k1.type = file_roll
a3.sinks.k1.sink.directory = /opt/module/datas/flume3

注意：输出的本地目录必须是已经存在的目录，如果该目录不存在，并不会创建新的目录。
四.Channel

# Describe the channel
#channel的类型为memory或者file
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

五.组件绑定

# Bind the source and sink to the channel
#组件绑定，1个source，2个channel
a1.sources.r1.channels = c1 c2 
a1.sinks.k1.channel = c1
a1.sinks.k2.channel = c2

六.自定义拦截器和channle选择器

channel选择器有两种：replicating(默认)，multiplexing

a1.sources.r1.interceptors = i1
#自定义拦截器的全类名
a1.sources.r1.interceptors.i1.type = com.atguigu.interceptor.TypeInterceptor$Builder
#channel选择器选用multiplexing类型
a1.sources.r1.selector.type = multiplexing
a1.sources.r1.selector.header = type
a1.sources.r1.selector.mapping.hello = c1
a1.sources.r1.selector.mapping.nohello = c2

七.负载均衡和故障转移

# Name the components on this agent
a1.sources = r1
a1.channels = c1
#添加sink组
a1.sinkgroups = g1
a1.sinks = k1 k2

# Describe/configure the source
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444
#配置为故障转移(failover)
a1.sinkgroups.g1.processor.type = failover
a1.sinkgroups.g1.processor.priority.k1 = 5
a1.sinkgroups.g1.processor.priority.k2 = 10
a1.sinkgroups.g1.processor.maxpenalty = 10000

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
#sink组的绑定
a1.sinkgroups.g1.sinks = k1 k2
a1.sinks.k1.channel = c1
a1.sinks.k2.channel = c1

启动flume

#启动脚本           flume的conf目录   agent名字       执行的配置文件
[root@hostname flume]# bin/flume-ng agent -c conf/ -n a1 -f job/flume-netcat-logger.conf

logger 打印控制台

[root@hostname flume]# bin/flume-ng agent --conf conf/ --name a1 --conf-file job/flume-netcat-logger.conf -Dflume.root.logger=INFO,console

#缩写形式
[root@hostname flume]# bin/flume-ng agent -c conf/ -n a1 -f job/flume-netcat-logger.conf -Dflume.root.logger=INFO,console

配置用于服务自启动的service文件

[root@hostname bin]#  cat /lib/systemd/system/flume.service
[Unit]
Description=Apache Flume
Wants=network-online.target
After=network-online.target

[Service]
EnvironmentFile=-/opt/flume/conf/flume.env
WorkingDirectory=/opt/flume
User=logmanager
Group=logmanager
ExecStart=/opt/flume/bin/flume-ng agent \
    --name a1 \
    -c conf \
    -f conf/flume-conf.properties \
    -Dflume.root.logger=INFO,LOGFILE
LimitNOFILE=65536
LimitNPROC=2048
KillSignal=SIGTERM
KillMode=process
SendSIGKILL=no
Restart=always
TimeoutStopSec=60

[Install]
WantedBy=multi-user.target
# 启动系统服务，需保证flume使用的端口未被占用
[root@hostname bin]# systemctl daemon-reload
[root@hostname bin]# systemctl enable --now flume

探针卸载

将 agent-destroy 角色添加至 ansible 的 roles 目录中, 在 inventory 文件中添加 [destroy] 组，将需要卸载探针的服务器添加至该组，确保 inventory 存在该服务器的连接信息，可通过秘钥互相访问或配置用户密码至``inventory文件中，并且确保 inventory/host_var中有flume组变量。配置ansible-playbook` 文件。

[root@hostname ansible]# tree .
ansible_project_root
├── inventory
│   ├── group_vars
│   │   ├── all.yml
│   │   └── flume.yml
│   └── inventory.ini
├── agent-destroy.yml
└── roles
    └── agent-destroy
        └── tasks
            └── main.yml
[root@hostname ansible]# cat inventory/inventory.ini
...
[destroy]
hostname-1 ansible_host=10.0.0.1
hostname-2 ansible_host=10.0.0.2
hostname-3 ansible_host=10.0.0.3
...
[root@hostname ansible]# cat agent-destroy.yml
---
- hosts: destroy
  gather_facts: true
  max_fail_percentage: 0
  roles:
  - agent-destroy

配置检查通过后，可用如下命令执行 ansible playbook

[root@hostname ansible]# ansible-playbook -i inventory/inventory.ini agent-destroy.yml

看到类似如下输出且所有主机状态均为 unreachable=0 failed=0 则执行成功

...
hostname-1  : ok=1    changed=1    unreachable=0    failed=0    skipped=1    rescued=0    ignored=1
hostname-2  : ok=1    changed=1    unreachable=0    failed=0    skipped=1    rescued=0    ignored=1
hostname-3  : ok=1    changed=1    unreachable=0    failed=0    skipped=1    rescued=0    ignored=1

你可能感兴趣的:(ubuntu)

RK3588 Ubuntu系统编译南风知奇意 RK3588 ubuntu linux RK3588
1、建议配置1.1硬件配置编译Ubuntu开发环境硬件配置建议：64位CPUUbuntu20.04系统16GB内存250GB空闲空间用来编译1.2软件配置sudoaptupdatesudoapt-getinstallgitsshmakegcclibssl-devliblz4-tool\expectg++patchelfchrpathgawktexinfochrpathdiffstatbinfmt-
RK3588上安装Ubuntu20.04修改源 chenzhy223 RK3588 ubuntu linux 运维
RK3588上安装Ubuntu20.04修改源1、参考资料2、更改镜像源2.1、选择源1、参考资料1、清华大学开源软件镜像站.2、Ubuntu软件仓库镜像使用帮助3、UbuntuPorts软件仓库镜像使用帮助4、unbuntu18.04apt-getupdate时报错armpackage找不到–华为服务器（已解决）5、opencv安装(解决libjasper-dev和MIPI接口)2、更改镜像源2
基于讯为RK3588平台搭建Ubuntu20.04.5根文件系统襟铭心缘 RK3588学习笔记 ubuntu linux arm开发
准备工作在搭建系统之前，需要详细阅读讯为公司提供的一些资料（虽然他们家资料一直都做的不完善），搭建好用于开发的Ubuntu虚拟机环境，熟练使用一些常用工具如烧录系统的工具RKDevTool、传输文件的工具FileZilla、远程连接工具MobaXterm等等。当然，本章只针对根文件系统，uboot、kernel的镜像文件和驱动文件需要提前准备好，编译讯为提供的Rockchip的SDK即可得到这些文
RK356X/RK3588构建Ubuntu20.04根文件系统那肯定是很多年以后！全志&瑞芯微开发实战 linux
文章目录前言一、官网下载ubuntu-base二、挂载并构建文件系统2.1、配置构建文件系统环境2.2、编写挂载脚本mount.sh并安装相关工具2.3、轻量级的桌面环境lubuntu-desktop2.4、卸载一些不必要的软件2.5、添加用户2.6、允许root用户登录桌面2.7、串口自动登录2.8、开机卡“AstartjobisrunningforwaitfornetworktobeConfi
【apt源】RK3588 平台ubuntu20.04更换apt源名栩家庭存储 apt RK3588
RK3588芯片使用的是aarch64架构，因此在Ubuntu20.04上更换apt源时需要使用针对aarch64架构的源地址。以下是针对RK3588芯片在Ubuntu20.04上更换apt源到清华源的正确步骤：步骤一：打开终端在Ubuntu20.04中，按下Ctrl+Alt+T打开终端。步骤二：备份原始的source.list文件在终端中输入以下命令以备份原始的source.list文件：sud
Ubuntu系统GAMIT10.7程序安装说书人_J gamit ubuntu linux 系统安装
Ubuntu20.04系统GAMIT10.7程序安装最近选修课学习GAMIT，经过学习整理，将自己的安装过程分享一下，写的不够详细，有问题可以再继续交流。首先，进入Ubuntu系统并确认连接互联网。1、安装环境打开终端（快捷键是Ctrl+Alt+T）,输入sudosu会提示你输入账户密码，输入后可获得root权限了。接下来安装支持GAMIT的软件包，依次输入以下代码，注意联网。apt-getins
自建stgcn数据集并训练青年夏日科技工作者 AI编程
参考了许多博文，慢慢地也就把st-gcn跑出来了，参考的文章一会附在文章里面，实测有用。1.安装st-gcn复现STGCNCPU版（ubuntu16.04+pytorch0.4.0+openpose+caffe）_Significance的博客-CSDN博客复现旧版STGCNGPU版（win10+openpose1.5.0）_Significance的博客-CSDN博客22.准备训练数据集官方使用
Linux国内镜像源详细修改教程网友阿贵 Linux linux 运维服务器
Linux系统下，CentOS和Ubuntu的镜像源修改教程因版本不同而有所差异。以下是针对CentOS7至9以及Ubuntu16.04至22.04的国内外镜像源修改教程：CentOSCentOS7备份原有的YUM源文件：sudocp/etc/yum.repos.d/CentOS-Base.repo/etc/yum.repos.d/CentOS-Base.repo.bak选择并下载国内镜像源：阿里
Ubuntu 16.04安装Lua 一张假钞 ubuntu lua linux
个人博客地址：Ubuntu16.04安装Lua|一张假钞的真实世界在Linux系统上使用以下命令编译安装Lua：curl-R-Ohttp://www.lua.org/ftp/lua-5.3.3.tar.gztarzxflua-5.3.3.tar.gzcdlua-5.3.3makelinuxtest安装make编译过程如果提示以下信息则需要先安装make：#makelinuxtestTheprogr
ubuntu18.04 交换区扩容 Oliver-H 环境搭建 C_C++ubuntu c++
Ubuntu18.04运行程序时，报以下错误：g++:internalcompilererror:Killed(programcc1plus)g++:internalcompilererror:Killed(programcc1plus)Pleasesubmitafullbugreport搞了老半天，终于解决了，记录一下，免得忘记！！！出现以上问题原因是内存不足，使用交换分区来解决：1、查看交换分
Ubuntu22.04安装CUDA10.1 想夹逼但不收敛 ubuntu c++
Ubuntu22.04安装CUDA10.1前言gcc降级添加软件源更新软件源安装gcc-7更换gcc版本安装CUDA10.1前言ubuntu22.04支持cuda10.7以上的版本，而在一些情况下我们需要用到低级的cuda版本，本文以用ubuntu22.04安装cuda10.1为例。而在ubuntu中最主要的是gcc的变化，我们需要7.5+的gcc，而一般情况下ubuntu22.04只有gcc11
ubuntu20.04安装mujoco和mujoco_py tangyubbb? ubuntu linux 人工智能
一.安装mujoco参考链接1.官网下载mujoco210文件https://github.com/deepmind/mujoco/releases/tag/2.1.02.将下载的文件解压到指定目录~/.mujoco下mkdir~/.mujocotar-zxvfmujoco210-linux-x86_64.tar.gz-C~/.mujoco3.配置.bashrc环境文件，在文档最后一行加入下面代码
记录:解决Ubuntu20.04安装ros报错E: Unable to locate package ros-kinetic-desktop-full【亲测有效】 bug菌¹ Ubuntu实战(进阶版)Ubuntu20.04 安装ros
‍作者：bug菌✏️博客：CSDN、掘金等公众号：猿圈奇妙屋特别声明：原创不易，转载请附上原文出处链接和本文声明，谢谢配合。版权声明：文章里可能部分文字或者图片来源于互联网或者百度百科，如有侵权请联系bug菌处理。一、前言环境：Ubuntu20.04版本二、摘要报错：E:Unabletolocatepackageros-kinetic-desktop-full
如何在ubuntu20.04中安装mujoco，亲身测试。冒险岛岛主 mujoco 机器人学习
如何安装mujocomujoco-py以及遇见的各种各样的问题。一、安装mujoco-前言。二、安装conda。2.1第一步：下载2.2第二步:安装。2.3防止冲突。三、安装mujoco。3.1下载mujoco3.2配置环境变量。3.3测试mujoco。四、安装mujoco-py。4.1创建虚拟环境。4.2下载mujoco-py4.3配置环境变量4.4测试mujoco-py五、遇见的问题5.1第一
从0安装mysql server 追心嵌入式 mysql
安装MySQLServer首先，你需要在Ubuntu上安装MySQL服务器。运行以下命令来安装：sudoaptupdatesudoaptinstallmysql-server安装完成后，MySQL服务会自动启动。你可以通过以下命令检查MySQL服务是否正在运行：sudosystemctlstatusmysql如果MySQL正在运行，你会看到类似于以下的输出：yaml●mysql.service-M
Qt调用FFmpeg库实时播放UDP组播视频流 daqinzl qt ffmpeg 流媒体 qt ffmpeg udp组播流
基于以下参考链接，通过改进实现实时播放UDP组播视频流https://blog.csdn.net/u012532263/article/details/102736700源码在windows（qt-opensource-windows-x86-5.12.9.exe）、ubuntu20.04.6(x64)(qt-opensource-linux-x64-5.12.12.run)、以及针对arm64的
使用Ollama 在Ubuntu运行deepseek大模型：以deepseek-r1为例 skywalk8163 人工智能 ubuntu linux 人工智能 ollama
deepseek大模型上热搜啦！咱们来亲身感受下DeepSeek模型的魅力吧！整个操作流程非常简单方便，只需要2步，先安装Ollama，然后执行大模型即可。支持的deepseek-r1模型deepseek-r1DeepSeek-R1-Distill-Qwen-1.5Bollamarundeepseek-r1:1.5bDeepSeek-R1-Distill-Qwen-7Bollamarundeeps
Liunx安装Docker容器化管理工具（记录篇） smart_ljh 工具 docker 容器运维编程工具
一、移除主机原有Docker（以ubuntu为例，没有则忽略）二、Ubuntu安装与配置Docker管理工具三、Centos安装与配置Docker管理工具四、配置Docker镜像加速器五、批量清理Docker缓存日志六、统计Docker缓存日志大小在我们项目开发之后使用Docker容器化构建与部署，可以将软件以及其依赖项封装成一个独立的可执行单位。它能够使服务在后期的部署上变得更加方便，调度资源来
记录一次nvm\node\npm安装，ubuntu18.04 imomsc_csdn npm 前端 node.js
问题：安装nvm时，curl或wget出现443连接失败；且用apt安装的nodejs出现GLIBC_2.28notfound。但网络好使，外网也能上。前提：nvm安装教程如下：Ubuntu安装NVM及简单使用-CSDN博客一、443连接失败——大佬原文如下：ubuntu18.04安装nvm、node.js、npm-简书(jianshu.com)二、nodejs不能用——大佬原文如下：(解决方案)
ubuntu18.04安装nvm管理本机node和npm 爱学习的狮王 Linux/Shell node npm 前端 node.js nvm
ubuntu18.04安装nvm管理本机node和npmnvm的使用方法1.安装nvm2.加载nvm3.安装执行版本4.设置默认版本(可选)5.检查:6.将配置加入到shell配置文件中(默认已经加入)如果系统全局的Node.js存在，但被nvm覆盖了，可以通过禁用或卸载nvm恢复到系统版本。1.取消nvm的版本管理2.然后从shell配置文件（例如~/.bashrc,~/.zshrc或~/.ba
Ubuntu22.04系统下MVS运行海康威视工业相机 boss-dog 海康威视工业相机 ubuntu MVS 海康威视相机
之前的开发环境是Ubuntu16.04，最近因项目需求换到了Ubuntu22.04系统，安装了ROS2-humble，重新记录下开发过程。Ubuntu16.04系统可参考：VMware虚拟机中Ubuntu16.04系统下通过MVS运行海康威视工业相机Linux环境中对海康威视工业相机SDK进行二次开发（QT+CMake+Opencv+海康SDK）1.官网安装包下载https://www.hikro
android studio flutter代理设置问题classpath 'com.android.tools.build:gradle:3.2.1' 同名公众号 - 人生代码 android studio 安卓开发 android studio
前提初次安装flutter,通过代理设置加快速度安装首次更新数据,但在添加设备并开始打包编译时出现classpath找不到的情况1.在初次启动IDE的时候会提示更新各种SDK包,此时一般会直接设置代理,我的系统时Ubuntu18.04,所以直接代理了本地,127.0.0.1端口10802.在编译打包的时候出现了找不到相关的包,原因是flutter三个默认配置的地方采用了Google路径的包切换ma
ubuntu下复制大文件 Joyner2018 计算机综合 ubuntu ubuntu 服务器硬盘网络
ubuntu下复制大文件1.在服务器上的文件复制：cp源文件目的文件cp源文件目的文件夹2.从一台服务器上拷贝到另一台服务器scpusername@ip:directory本台服务器的路径3.从硬盘拷贝文件到服务器这里复制的方法很多：操作最直观的就是远程客户端的上传，但是这个受网络限制，速度慢命令上的上传rz回车暴力快速的方法是把硬盘插到服务器上sudofdisk-lsudomount/dev/s
MySQL安装后设置和测试 Run Out Of Brain mysql 数据库
本节讨论安装MySQL后应执行的任务：1、如有必要，初始化数据目录并创建MySQL授权表。对于一些MySQL安装方法，数据目录初始化可能会自动为您完成：由MSI安装程序和MySQL配置程序执行的Windows安装操作。安装在Linux使用从Oracle下载的服务器rpm或Debian发行。在许多平台上使用本机打包系统安装，包括DebianLinux、UbuntuLinux、GentooLinux等
EtherCAT主站IGH-- 54 -- IGH之控制电机旋转周期同步位置模式（CSP模式）常驻客栈 EtherCAT主站-IGH EtherCAT EtherCAT主站 IGH 常驻客栈 CSP模式周期同步位置模式 igh
EtherCAT主站IGH--54--IGH之控制电机旋转周期同步位置模式（CSP模式）0Ubuntu18.04系统IGH博客、视频欣赏链接1修改电机的ID一代码实现二编译运行该文档修改记录：总结环境：系统：xenomai3.1主站：IGH电机：松下A6B。该博客功能视频欣赏EtherCAT主站-IGH--54--ubuntu18控制电机旋转（CSP模式）环境：系统：ubuntu18.04，xen
docker镜像报错ERROR: failed to solve: DeadlineExceeded: 柠檬编程工作室 Docker docker eureka 容器
--------------------1|#基于NVIDIACUDA镜像，确保GPU支持2|>>>FROMnvidia/cuda:12.6.2-cudnn-devel-ubuntu20.043|4|#设置工作目录--------------------ERROR:failedtosolve:DeadlineExceeded:DeadlineExceeded:DeadlineExceeded:nv
python权限不够无法写入_解决python使用pip安装模块的权限问题 weixin_39922929 python权限不够无法写入
ubuntu16.04下默认的python和pip1.ubuntu16.04默认安装了两个版本的python,python2.7和python3.5,可以使用python-V查看版本命令行中python是2.7版本,python3是python3.5版本请注意，系统自带的python千万不能卸载！2.ubuntu默认没有装pip,我们一般用sudoapt-getinstallpip,这样安装的是p
学习yosys(一款开源综合器) qq85058522 自己动手写CPU fpga开发
安装sudoapt-getinstallyosys#ubuntu22.04仓库里面是yosys-0.9sudoinstallxdot创建脚本show_rtl.ysread_verilogcpu.vhierarchy-topcpuproc;opt;fsm;opt;memory;opt;show-prefixcpu调用脚本yosysshow_rtl.ysverilog代码modulecpu(input
ubuntu上编译fortran_Ubuntu下安装Intel Fortran编译器(ifort) 新职语
IntelFortanCompiler简称ifort,Windows下的ifort是收费的，但是Linux系统下提供免费的ifort,可以在下面的链接中下载需要的版本(必须先注册，随后会收到官网发来的邮件，里面提供了接下来安装需要的series-number)http://software.intel.com/en-us/articles/non-commercial-software-downl
Isaac Lab 安装（ubuntu22.04环境） AIGCnn Isaac Lab isaac sim Omniverse Isaac Sim
Windows下的安装见这篇博客：IsaacLab安装与初体验（windows环境）-CSDN博客ubuntu22.04下的安装与windows下十分类似，还是参考官方的，InstallationusingIsaacSimBinariesInstallationusingIsaacSimBinaries—IsaacLabdocumentation(isaac-sim.github.io)https
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d