0611-_-

ELK——ElasticStack日志分析平台

ElasticStack日志分析平台

ELK日志采集与分析系统概述
- 重读日志文件
- 使用Processors（处理器）过滤和增强数据
Logstash
- Logstash安装
- 使用Grok过滤器插件解析Web日志
- 使用Geoip过滤器插件增强数据编辑**
- 配置接受Beats的输入
ES集群
- 基本介绍
- 集群概述
- - 集群基本概念
  - 集群部署
Kibana部署调试

ELK日志采集与分析系统概述

ELK是Elasticsearch、Logstash、Kibana的简称，是近乎完美的开源实时日志分析平台。
这三者是日志分析平台的核心组件，而并非全部。

Elasticsearch：实时全文搜索和分析引擎，提供搜集、分析、存储数据三大功能，具有分布式，零配置，自动发现，索引自动分片，索引副本机制，restful 风格接口，多数据源，自动搜索负载等特点

Logstash：它支持几乎任何类型的日志，包括系统日志、错误日志和自定义应用程序日志，它可以从许多来源接收日志，这些来源包括 syslog、消息传递（例如 RabbitMQ）和JMX，它能够以多种方式输出数据，包括电子邮件、websockets和Elasticsearch

Kibana：基于Web的图形界面，用于搜索、分析和可视化存储在 Elasticsearch指标中的日志数据，它利用Elasticsearch的REST接口来检索数据，不仅允许用户创建他们自己的数据的定制仪表板视图，还允许他们以特殊的方式查询和过滤数据，Kibana 可以为 Logstash 和 Elasticsearch 提供友好的日志分析 web 界面，可以帮助你汇总、分析和搜索重要数据日志

Filebeat简介

可以使用Filebeat 收集各种日志，之后发送到指定的目标系统上，但是同一时间只能配置一个输出目标.
Filebeat 会对配置好的日志内容进行收集，第一次会从每个文件的开头一直读到当前文件的最后一行。
每一行称为一个事件，格式是一个包含很多字段的大字典，也就是]SON格式的数据。在Filebeat中负责完成这个动作的官方称它为Harvester(收割机)
每个事件将来会被保存到Elasticsearch中
在收割机读到文件的最后，会停止工作，直到文件有新的内容写入才继续工作

作用	IP地址	操作系统	配置
ELK-01	192.168.93.20	CentOS Linux release 7.5.1804	1颗CPU 4G内存
ELK-02	192.168.93.21	CentOS Linux release 7.5.1804	1颗CPU 3G内存
ELK-03	192.168.93.22	CentOS Linux release 7.5.1804	1颗CPU 3G内存

Filebeat安装

#官网下载filebeat
curl -L -O https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-7.13.2-linux-x86_64.tar.gz
#解压至/usr/local
tar xf filebeat-7.13.2-linux-x86_64.tar.gz -C /usr/local/
mv /usr/local/filebeat-7.13.2-linux-x86_64/ /usr/local/filebeat

# Filebeat启动管理
# 1.前台运行：采用前台运行的方式查看Filebeat获取的日志结果
# 2.后台运行：使用nohup方式启动Filebeat到后台,日志结果可查看nohup.out文件
# 使用systemd管理的后台方式启动Filebeat进程不能查看输出日志,测试阶段勿用

# 配置systemd方式的Filebeat启动管理文件
vim /usr/lib/systemd/system/filebeat.service
[Unit]
Description=Filebeat sends log files to Logstash or directly to Elasticsearch.
Wants=network-online.target
After=network-online.target

[Service]

ExecStart=/usr/local/filebeat/filebeat -c /usr/local/filebeat/filebeat.yml
Restart=always

[Install]
WantedBy=multi-user.target

#建立系统进程
systemctl daemon-reload && systemctl enable filebeat --now

Filebeat简单使用

# 准备测试数据
vim /tmp/access.log
112.195.209.90 - - [20/Feb/2018:12:12:14 +0800] "GET / HTTP/1.1" 200 190 "-" "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36" "-"

# 备份配置文件
cp /usr/local/filebeat/filebeat.yml /usr/local/filebeat/filebeat.yml.bak

# 配置Filebeat的输入和输出
vim /usr/local/filebeat/filebeat.yml
filebeat.inputs:                      # 输入模块,希望收集什么
- type: log                           # 类型：日志
  enabled: true                       # 开启收集日志,改
  paths:                              # 日志路径
    - /tmp/*.log                      # 指定需要收集日志的路径,支持通配符可以写多个

#- type: filestream
#  enabled: false
#  paths:
#    - /var/log/*.log

filebeat.config.modules:              # 内置的收集日志的模块配置文件的存放路径
  path: ${path.config}/modules.d/*.yml# 安装路径 modules.d下有更多的规则
  reload.enabled: false               # 当模块配置文件发生变化时,filebeat自身重启,影响收集日志过程,一般配置完成才启动

setup.template.settings:
  index.number_of_shards: 1           # 索引副本数量, 1 不产生副本

output.console:                       # 添加 输出到终端屏幕上
  pretty: true                        # 开启

#setup.kibana:
#output.elasticsearch:
#  hosts: ["localhost:9200"]

processors:                             # 处理
  - add_host_metadata:                  # 添加此主机的源数据信息到输出数据中,如 IP MAC OS 等信息
      when.not.contains.tags: forwarded 
  - add_cloud_metadata: ~
  - add_docker_metadata: ~
  - add_kubernetes_metadata: ~

# Filebeat模块测试
# 如启动时发生了报错
/usr/local/filebeat/filebeat -c /usr/local/filebeat/filebeat.yml
Exiting: data path already locked by another beat. Please make sure that multiple beats are not sharing the same data path (path.data).

# 关闭filebeat即可,本机器已经存在filebeat启动，datapath被lock
systemctl stop filebeat


/usr/local/filebeat/filebeat -c /usr/local/filebeat/filebeat.yml
{
  "@timestamp": "2021-07-17T05:33:45.381Z",
  "@metadata": {
    "beat": "filebeat",
    "type": "_doc",
    "version": "7.13.2"
  },
  "input": {
    "type": "log"
  },
  "host": {
    "id": "ad8a55213faa46babc18170804417b90",
    "containerized": false,
    "name": "pakho",
    "ip": [
      "192.168.100.200",
      "fe80::ec53:d68d:60ea:b5e0"
    ],
    "mac": [
      "00:0c:29:ae:a5:a7"
    ],
    "hostname": "filebeat",
    "architecture": "x86_64",
    "os": {
      "type": "linux",
      "platform": "centos",
      "version": "7 (Core)",
      "family": "redhat",
      "name": "CentOS Linux",
      "kernel": "3.10.0-862.el7.x86_64",
      "codename": "Core"
    }
  },
  "agent": {
    "id": "33541cdc-c78e-4cf1-9181-e03db1ebdc36",
    "name": "filebeat",
    "type": "filebeat",
    "version": "7.13.2",
    "hostname": "filebeat",
    "ephemeral_id": "4f5cb4e0-47b3-4398-8574-8e36905aea10"
  },
  "ecs": {
    "version": "1.8.0"
  },
  "message": "112.195.209.90 - - [20/Feb/2018:12:12:14 +0800] \"GET / HTTP/1.1\" 200 190 \"-\" \"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36\" \"-\"",
  "log": {
    "offset": 0, #从日志文件什么地方开始取的,从第一行
    "file": {
      "path": "/tmp/access.log"
    }
  }
}

找不到配置文件可使用 -c 指定配置文件位置
- ./filebeat -c /usr/local/filebeat/filebeat.yml
filebeat本身运行日志默认位置/usr/local/filebeat/logs/filebeat
要修改Filebeat的日志路径，可以修改如下内容在配置文件filebeat.yml中实现

#==================================Logging================================

# Sets log level. The default log level is info.
#Available log levels are: error, warning, info,debug
#logging.level: debug
path.logs: /var/log/   #添加此行即可

这样设置后，filebeat启动后，日志的目录是/var/log，日志的文件名为filebeat，每次启动或者重启程序会产生一个新的日志文件filebeat，旧的日志命名为filebeat.1以此类推

专用日志搜集模块

模块文件存储位置

[root@pakho ~]# ls /usr/local/filebeat/modules.d

禁用模块

/usr/local/filebeat/filebeat modules disable 模块名

启用模块

/usr/local/filebeat/filebeat modules enable 模块名

Nginx模块

准备Nginx示例模块
添加访问日志文件

[root@pakho ~]# vim /var/log/access.log
123.127.39.50 - - [04/Nar/2021:10:50:28 +0800] "GET/logo.jpg HTTP/1.1" 200 14137 "http://81.68.233.173/" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) ApplewebKit/537.36(KHTAL, like Gecko) Chrome/88.0.4324.192 Safari/537.36" "_"

添加错误日志文件

[root@pakho ~]# vim /var/log/error.log
2021/03/04 10:50:28 [error] 11396#0: *5 open() "/farm/bg.jpg" failed (2: No such file or directory), client: 123.127.39.50, server: localhost, request: "GET /bg.jpg HTTP/1.1",  host:"81.68.233.173", referrer: "http://81.68.233.173/"

启用Nginx模块

[root@pakho ~]# /usr/local/filebeat/filebeat -c /usr/local/filebeat/filebeat.yml modules enable nginx
Enabled nginx
[root@filebeat ~]# ls /usr/local/filebeat/modules.d
nginx.yml...

modules.d/nginx.yml文件内容如下

- module: nginx
  access:
    enabled: true
  error:
    enabled: true

nginx模块搜集日志的默认路径是：
- /var/log/nginx/access.log*
- /var/log/nginx/error.log*
使用默认路径，打开模块即可
使用非默认路径
- 假如所要搜集的日志真实路径和日志收集模块默认的路径不一致，可以配置var.paths:属性进行配置。
  - 接收的值是一个包含一个以上的日志绝对路径列表，接收的值是一个数组
  - 用于给日志文件设置自定义路径的。如果不设置此选项，Filebeat将根据您的操作系统选择路径选择使用默认值

[root@filebeat ~]# vim /usr/local/filebeat/modules.d/nginx.yml
- module: nginx
  access:
    enabled: true
  error:
    enabled: true
    var.paths: ["/var/log/access.log","/var/log/error.log"]

或者下面的方式

- module: nginx
  access:
    enabled: true
  error:
    enabled: true
    var.paths: 
      - "/var/log/access.log*"
      - "/var/log/error.log*"

注意
- var.paths 指定的路径，是以追加的方式和模块默认路径合并到一起的，也就是说假如模块的默认路径有具体的日志文件/var/log/nginx/access.log
- 这里var.paths也配置了路径/var/log/access.log，那么最终Filebeat收集的日志路径将会是：
  - /var/log/nginx/access.log
  - /var/log/access.log
  - 原路径以及指定路径都会收集！
- 测试：调用模块进行测试：./filebeat -e

[root@pakho filebeat]# pwd
/usr/local/filebeat
# -c 指定配置文件 -e 开启模块
[root@pakho filebeat]# ./filebeat -c /usr/local/filebeat/filebeat.yml -e

配置output

Filebeat是用于搜集日志，之后把日志推送到某个接收的系统中的，这些系统或者装置在Filebeat中称为output
output类型
- console终端屏幕
- elasticsearch存放日志，并提供查询
- logstash进一步对日志数据进行处理
- kafka消息队列
Filebeat运行的时候，以上的output只配置一种即可
输出到Console
- 输出完整JSON数据

output.console:
  pretty: true

进入Filebeat的安装目录下，执行命令前台运行

./filebeat

如果只想输出完整JSON数据中的某些字段

output.console:
  codec.format:
    string: '%{[@timestamp]} %{[message]}'

其他输出目标

输出到Elasticsearch

output.elasticsearch:
  hosts: ['http://es01:9200','http://es02:9200']

输出到logstach

output.logstach:
  hosts: ["127.0.0.1:5044"]

重读日志文件

有时候处于实验目的，可能需要重新读取日志文件，这个时候需要删除安装目录下的 data文件夹，重新运行filebeat即可
假如出现如下报错，删除安装目录中的data文件夹

Exiting: data path already locked by another beat. Please make sure that multiple beats are not sharing the same data path (path.data).

查看是否有一个进程已经处于运行状态，尝试杀死此进程，之后重新运行Filebeat

[root@pakho filebeat]# ps -ef | grep 'filebea[t]'
root       2322   2019  0 17:10 pts/2    00:00:00 ./filebeat -c /usr/local/filebeat/filebeat.yml -e

使用Processors（处理器）过滤和增强数据

可以在配置中定义处理器，以便在事件发送到配置的输出之前对其进行处理。libbeat库提供以下处理：
- 减少导出字段的数量
- 使用其他元数据增强事件
- 执行其他除了和解码
工作方式
- 每个处理器都接收一个事件，对该事件应用已定义的操作，然后返回该事件。如果定义处理器列表，则将按照在Filebeat配置文件中定义的顺序执行它们。

去除日志中的某些行

删除所有以DBG:开头的行

processors:
  - drop_event:            #丢弃事件
      when:                #当
        regexp:            #正则表达式,告诉系统下面这段话带正则表达式
          message: "^DBG:" #message为自定义字段

向输出的数据中添加某些自定义字段

用于工作中标记特别的日志

processors:
  - add_fields:
      target: project      #要添加的自定义字段key的名称
      fields:
        name: myproject
        id: '574734885120952459'

执行后效果如下

从事件中删除某些字段

processors:
  - drop_fields:
      fields: ["field1","field2",...]
      ignore_missing: false

以上配置，将删除字段：field1和field2
ignore_missing的值为false表示，字段名不存在则会返回错误，为true不会返回错误
事件中的@timestamp和type字段是无法删除的
下面的配置示例是删除顶级字段input和顶级字段ecs中的version字段

  - drop_fields:
      fields: ['input',"ecs.version"]

Logstash

Logstash安装

参考官方网站

#下载Logstash
[root@pakho ~]# curl -L -O https://artifacts.elastic.co/downloads/logstash/logstash-7.13.2-linux-x86_64.tar.gz
#解压至/usr/local
[root@pakho ~]# tar xf logstash-7.13.2-linux-x86_64.tar.gz -C /usr/local/
[root@pakho ~]# mv /usr/local/logstash-7.13.2/ /usr/local/logstash

测试运行

运行最基本的Logstash管道来测试Logstash安装
Logstash管道具有两个必需元素input和output，以及一个可选元素filter，输入插件使用来自源的数据，过滤器插件根据你的指定修改参数，输出插件将数据写入目标
进入Logstash的安装目录下执行：

bin/logstash -e ''

-e选项用于设置Logstash处理数据的输入和输出
-e 等同于 -e input { stdin { type => stdin} } output { { codec => rubydebug} }
input { stdin { type => stdin} }
- 表示Logstash需要处理的数据来源于标准输入设备
output { stdont { codec = > rubydebug} }
- 表示Logstash把处理好的数据输出到标准输出设备

[root@pakho bin]# pwd
/usr/local/logstash/bin
#input输入 type从键盘读取   output输出 标准输出
[root@pakho bin]# ./logstash -e 'input { stdin {     type => stdin } }    output { stdout { codec=> rubydebug } }'
...
hello
{
    "@timestamp" => 2021-07-17T13:36:08.457Z,
          "host" => "pakho",
       "message" => "hello",
      "@version" => "1",
          "type" => "stdin"
}

message字段对应的值是Logstash接收到的一行完整的数据
@version是版本信息，可以用于建立索引使用
@timestamp处理对应的值是Logstash接收到的一行完整的数据
type就是之前input中设置的值，这个值可以任意修改，但是，type是内置的变量，不能修改，用于建立索引和条件判断等
hosts表示从哪个主机过来的数据
修改type的值为nginx的示例（主要是区分索引的时候用，这里改了没什么实效果）

./bin/logstash -e "input { stdin { type => nginx}}  output { stdout { codec => rubydebug } }"

配置输入和输出

生产中，Logstash管道要复杂一些:它通常具有一个或多个输入，过滤器和输出插件。
本部分中，将创建一个Logstash管道，该管道使用标准输入来获取Apache Web日志作为输入，解析这些日志以从日志中创建特定的命名字段，然后将解析的数据输出到标准输出（屏幕上)。并且这次无需在命令行上定义管道配置，而是在配置文件中定义管道
创建任意一个文件，并写入如下内容，作为Logstash的管道配置文件

[root@pakho ~]# vim /usr/local/logstash/config/first-pipeline.conf

input { 
    stdin{ }
}
output {
    stdout{ }
}

配置文件语法测试

[root@pakho logstash]# pwd
/usr/local/logstash
[root@filebeat logstash]# bin/logstash -f config/first-pipeline.conf --config.test_and_exit
...
Configuration OK

-f用于指定管道配置文件
运行如下命令启动Logstash

[root@pakho logstash]# bin/logstash -f config/first-pipeline.conf
The stdin plugin is now waiting for input:

启动后复制如下内容到命令行中，并按下回车键

83.149.9.216 - - [04/Jan/2015:05:13:42 +0000] "GET /presentations/logstash-monitorama-2013/imageskibana-search.png HTTP/1.1"  200 203023 "http://semicomplete.com/presentations/logstash-monitorama2013/" "Mozilla/5.0 (Macintosh;IntelMac 0s X 10_9_1) ApplewebKit/537.36 (KHTML,like Gecko) Chrome/32.0.1700.77 Safari/537.36"

将会看到如下输出

{
          "host" => "pakho",
      "@version" => "1",
    "@timestamp" => 2021-07-17T14:00:44.109Z,
       "message" => "83.149.9.216 - - [04/Jan/2015:05:13:42 +0000] \"GET /presentations/logstash-monitorama-2013/imageskibana-search.png HTTP/1.1\"  200 203023 \"http://semicomplete.com/presentations/logstash-monitorama2013/\" \"Mozilla/5.0 (Macintosh;IntelMac 0s X 10_9_1) ApplewebKit/537.36 (KHTML,like Gecko) Chrome/32.0.1700.77 Safari/537.36\""
}

使用Grok过滤器插件解析Web日志

现在有了一个工作管道，但是日志消息的格式不是理想的。你想解析日志消息,以便能从日志中创建特定的命名字段。为此，应该使用grok过滤器插件
使用grok过滤器插件，可以将非结构化日志数据解析为结构化和可查询的内容
grok会根据你感兴趣的内容分配字段名称，并把这些内容和对应的字段名称进行绑定
grok如何知道哪些内容是你感兴趣的呢？它是通过自己预定义的模式来识别感兴趣的字段的。这个可以通过给其配置不同的模式来实现。
这里使用的模式是%{COMBINEDAPACHELOG}
%{COMBINEDAPACHELOG}使用以下模式从Apache日志中构造行：

原信息	对应新的字段名称
IP地址	clientip
用户ID	ident
用户认证信息	auth
时间戳	timestamp
HTTP请求方法	verb
请求的URL	request
HTTP版本	httpversion
响应码	response
响应体大小	bytes
跳转来源	referrer

并且这里想要实现修改配置文件之后自动加载它，不能配置input为stdin
所有，这里使用了file，创建示例日志文件

[root@pakho ~]# vim /var/log/httpd.log
83.149.9.216 - - [04/Jan/2015:05:13:42 +0000] "GET /presentations/logstash-monitorama-2013/imageskibana-search.png HTTP/1.1" 200 203023 "http://semicomplete.com/presentations/logstash-monitorama-2013/" "Mozilla/5.0 (Macintosh; IntelMac OS X 10_9_1) AppleWebKit/537.36 (KHTAL，like Gecko) Chrome/32.0.1700.77 Safari/537.36"

确保没有缓存数据

[root@pakho data]# pwd
/usr/local/logstash/data
[root@pakho data]# ls
dead_letter_queue  queue  uuid

修改好的管道配置文件如下：

[root@pakho ~]# vim /usr/local/logstash/config/first-pipeline.conf
input {
    file { 
        path => ["/var/log/httpd.log"]
        start_position => "beginning"  #从文件起始开始收集
    }
}

filter {
    grok { #对web日志进行过滤处理,输出结构化的数据
           #在message字段对应的值中查询匹配上COMBINEDAPACHELOG
         match => { "message" => "%{COMBINEDAPACHELOG}"}
         }
}


output {
    stdout{ }
}

match => {"message" => "%{COMBINEDAPACHELOG}"}的意思是：
- 当匹配到"message"字段时，用户模式"COMBINEDAPACHELOG"进行字段映射
配置完成后，再次进行验证

[root@pakho logstash]# bin/logstash -f config/first-pipeline.conf

下面是输出内容

{
           "host" => "pakho",
           "auth" => "-",
      "timestamp" => "04/Jan/2015:05:13:42 +0000",
          "ident" => "-",
           "verb" => "GET",
        "request" => "/presentations/logstash-monitorama-2013/imageskibana-search.png",
          "bytes" => "203023",
       "referrer" => "\"http://semicomplete.com/presentations/logstash-monitorama-2013/\"",
       "@version" => "1",
          "agent" => "\"Mozilla/5.0 (Macintosh; IntelMac OS X 10_9_1) AppleWebKit/537.36 (KHTAL，like Gecko) Chrome/32.0.1700.77 Safari/537.36\"",
           "path" => "/var/log/httpd.log",
     "@timestamp" => 2021-07-17T14:31:04.282Z,
       "response" => "200",
        "message" => "83.149.9.216 - - [04/Jan/2015:05:13:42 +0000] \"GET /presentations/logstash-monitorama-2013/imageskibana-search.png HTTP/1.1\" 200 203023 \"http://semicomplete.com/presentations/logstash-monitorama-2013/\" \"Mozilla/5.0 (Macintosh; IntelMac OS X 10_9_1) AppleWebKit/537.36 (KHTAL，like Gecko) Chrome/32.0.1700.77 Safari/537.36\"",
    "httpversion" => "1.1",
       "clientip" => "83.149.9.216"
}

由原来的非结构化数据，变为结构化数据了
但是原来的message字段仍然存在，假如不需要它，可以使用grok中提供的常用选项之一：
- remove_field来移除这个字段
- remove_field可以移除任意的字段，它可以接受的值是一个数组
- rename可以重新命名字段
修改后管道配置文件如下：

[root@pakho ~]# vim /usr/local/logstash/config/first-pipeline.conf
input {
    file {
        path => ["/var/log/httpd.log"]
        start_position => "beginning"  #从文件起始开始收集
    }
}

filter {
    grok { #对web日志进行过滤处理,输出结构化的数据
           #在message字段对应的值中查询匹配上COMBINEDAPACHELOG
         match => { "message" => "%{COMBINEDAPACHELOG}"}  }
         mutate {
             #重写字段
                rename => {
                        "clientip" => "cip"
                }
         }

         mutate {
                #去掉没用字段
                remove_field => ["message","input_type","@version","fields"]
         }
}


output {
    stdout{ }
}

配置完成后，增加新日志，再次进行验证

[root@pakho logstash]# bin/logstash -f config/first-pipeline.conf
...
[2021-07-17T22:48:25,567][INFO ][logstash.agent           ] Successfully started Logstash API endpoint {:port=>9600}

下面是输出内容
- message不见了，而且clientip重命名为cip！

{
     "@timestamp" => 2021-07-17T14:49:42.501Z,
           "auth" => "-",
           "host" => "pakho",
      "timestamp" => "04/Jan/2015:05:13:42 +0000",
        "request" => "/presentations/logstash-monitorama-2013/imageskibana-search.png",
    "httpversion" => "1.1",
          "bytes" => "203023",
       "response" => "200",
          "agent" => "\"Mozilla/5.0 (Macintosh; IntelMac OS X 10_9_1) AppleWebKit/537.36 (KHTAL，like Gecko) Chrome/32.0.1700.77 Safari/537.36\"",
            "cip" => "83.149.9.217",
       "referrer" => "\"http://semicomplete.com/presentations/logstash-monitorama-2013/\"",
           "path" => "/var/log/httpd.log",
          "ident" => "-",
           "verb" => "GET"
}

使用Geoip过滤器插件增强数据编辑**

除解析日志数据以进行更好的搜索外，筛选器插件还可以从现有数据中获取补充信息。例如，geoip插件可以通过查找到IP地址，并从自己自带的数据库中找到地址对应的地理位置信息，然后将该位置信息添加到日志中
该geoip插件配置要求您指定包含IP地址来查找源字段的名称。在此示例中，该clientip字段包含IP地址

	geoip {
	    source => "clientip"
    }

由于过滤器是按顺序求值的，因此请确保该geoip部分位于grok配置文件的该部分之后，并且grok和geoip部分都嵌套在该 filter 部分中

[root@pakho ~]# vim /usr/local/logstash/config/first-pipeline.conf
input {
    file {
        path => ["/var/log/httpd.log"]
        start_position => "beginning"  #从文件起始开始收集
    }
}

filter {
    grok { #对web日志进行过滤处理,输出结构化的数据
           #在message字段对应的值中查询匹配上COMBINEDAPACHELOG
         match => { "message" => "%{COMBINEDAPACHELOG}"}  
         }
    geoip { source => "clientip" }
}

output {
    stdout{ }
}

配置完成后，执行配置文件

[root@pakho logstash]# bin/logstash -f config/first-pipeline.conf

下面是输出内容

{
          "ident" => "-",
           "auth" => "-",
       "@version" => "1",
        "request" => "/presentations/logstash-monitorama-2013/imageskibana-search.png",
    "httpversion" => "1.1",
     "@timestamp" => 2021-07-17T15:00:34.438Z,
           "host" => "pakho",
           "path" => "/var/log/httpd.log",
      "timestamp" => "04/Jan/2015:05:13:42 +0000",
           "verb" => "GET",
          "bytes" => "203023",
        "message" => "83.149.9.217 - - [04/Jan/2015:05:13:42 +0000] \"GET /presentations/logstash-monitorama-2013/imageskibana-search.png HTTP/1.1\" 200 203023 \"http://semicomplete.com/presentations/logstash-monitorama-2013/\" \"Mozilla/5.0 (Macintosh; IntelMac OS X 10_9_1) AppleWebKit/537.36 (KHTAL，like Gecko) Chrome/32.0.1700.77 Safari/537.36\"",
          "agent" => "\"Mozilla/5.0 (Macintosh; IntelMac OS X 10_9_1) AppleWebKit/537.36 (KHTAL，like Gecko) Chrome/32.0.1700.77 Safari/537.36\"",
       "referrer" => "\"http://semicomplete.com/presentations/logstash-monitorama-2013/\"",
          "geoip" => {
        "continent_code" => "EU",
         "country_code2" => "RU",
           "region_code" => "MOW",
              "timezone" => "Europe/Moscow",
         "country_code3" => "RU",
              "location" => {
            "lat" => 55.7527,
            "lon" => 37.6172
        },
          "country_name" => "Russia",
             "longitude" => 37.6172,
             "city_name" => "Moscow",
              "latitude" => 55.7527,
                    "ip" => "83.149.9.217",
           "postal_code" => "129223",
           "region_name" => "Moscow"
    },
       "clientip" => "83.149.9.217",
       "response" => "200"
}
{
          "ident" => "-",
           "auth" => "-",
       "@version" => "1",
        "request" => "/presentations/logstash-monitorama-2013/imageskibana-search.png",
    "httpversion" => "1.1",
     "@timestamp" => 2021-07-17T15:00:34.439Z,
           "host" => "pakho",
           "path" => "/var/log/httpd.log",
      "timestamp" => "04/Jan/2015:05:13:42 +0000",
           "verb" => "GET",
          "bytes" => "203023",
        "message" => "182.149.163.223 - - [04/Jan/2015:05:13:42 +0000] \"GET /presentations/logstash-monitorama-2013/imageskibana-search.png HTTP/1.1\" 200 203023 \"http://semicomplete.com/presentations/logstash-monitorama-2013/\" \"Mozilla/5.0 (Macintosh; IntelMac OS X 10_9_1) AppleWebKit/537.36 (KHTAL，like Gecko) Chrome/32.0.1700.77 Safari/537.36\"",
          "agent" => "\"Mozilla/5.0 (Macintosh; IntelMac OS X 10_9_1) AppleWebKit/537.36 (KHTAL，like Gecko) Chrome/32.0.1700.77 Safari/537.36\"",
       "referrer" => "\"http://semicomplete.com/presentations/logstash-monitorama-2013/\"",
          "geoip" => {
        "continent_code" => "AS",
         "country_code2" => "CN",
           "region_code" => "SC",
              "timezone" => "Asia/Shanghai",
         "country_code3" => "CN",
              "location" => {
            "lat" => 30.6667,
            "lon" => 104.0667
        },
          "country_name" => "China",
             "longitude" => 104.0667,
             "city_name" => "Chengdu",
              "latitude" => 30.6667,
                    "ip" => "182.149.163.223",
           "region_name" => "Sichuan"
    },
       "clientip" => "182.149.163.223",
       "response" => "200"
}

配置接受Beats的输入

[root@pakho ~]# vim /usr/local/logstash/config/first-pipeline.conf
#监听 5044 端口,接收 filebeat 的输入
input {
    beats {
      port => 5044
   }    
}

filter {
    grok { #对web日志进行过滤处理,输出结构化的数据
           #在message字段对应的值中查询匹配上COMBINEDAPACHELOG
         match => { "message" => "%{COMBINEDAPACHELOG}"}  }
    #geoip { source => "clientip" }
}

output {
    stdout{ }
}

修改filebeat配置文件

[root@pakho ~]# vim /usr/local/filebeat/filebeat.yml
...
#注释console
#output.console:
#  codec,format:
#    string: '%{[@timestamp]} %{[message]}'
#  pretty: true

#开启logstash
output.logstash:
  #The Logstash hosts
  hosts: ["192.168.100.200:5044"]

[root@pakho ~]# rm -rf /usr/local/filebeat/data/

运行filebeat

[root@pakho filebeat]# pwd
/usr/local/filebeat
[root@pakho filebeat]# ./filebeat

运行Logstash

[root@pakho logstash]# pwd
/usr/local/logstash
[root@pakho logstash]# bin/logstash -f config/first-pipeline.conf

/tmp/access.log文件添加一条访问日志

182.149.163.223 - - [20/Feb/2018:12:12:14 +0800] "GET / HTTP/1.1" 200 190 "-" "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36" "-"

Logstash接受到的filebeat消息如下

...
       "@version" => "1",
        "message" => "182.149.163.223 - - [20/Feb/2018:12:12:14 +0800] \"GET / HTTP/1.1\" 200 190 \"-\" \"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36\" \"-\"",
            "ecs" => {
        "version" => "1.8.0"
    },
           "auth" => "-",
        "request" => "/",
           "verb" => "GET",
       "response" => "200",
          "agent" => {
                "type" => "filebeat",
                  "id" => "57d4937a-5d65-498a-bc50-f8779a11ebcf",
            "hostname" => "pakho",
        "ephemeral_id" => "2b08ef40-c15b-4f94-98df-024fabda68d8",
             "version" => "7.13.2",
                "name" => "pakho"
    },
          "bytes" => "190"
}
...

ES集群

基本介绍

Elasticsearch：存储、搜索和分析
- Elasticsearch是Elastic Stack核心的分布式搜索和分析引擎。Logstash和Beats有助于收集，聚合和丰富你的数据并将其存储在Elasticsearch中。使用Kibana，你可以交互式地探索，可视化和共享对数据的见解，并管理和监视堆栈。Elasticsearch是发生索引，搜索和分析数据的地方。
Elasticsearch为所有类型的数据提供近乎实时的搜索和分析。
- 支持的数据类型
  - 结构化文本
  - 非结构化文本
  - 数字数据
  - 地理空间数据
文档
- Elasticsearch是面向文档的，文档是所有可搜索数据的最小单位
  - 日志文件中的日志项
  - 一本电影的具体信息/一张唱片的详细信息
  - MP3播放器里的一首歌 / 一篇PDF文档中的具体内容
- 文档会被序列化成JSON格式，保存在Elasticsearch中
  - JSON对象由字段组成
  - 每个字段都有对应的字段类型（字符串/数值/布尔/日期/二进制/范围类型）
- 每个文档都有一个Unique ID
  - 可以自定义ID
  - 或者通过Elasticsearch自动生成
- 一篇文档包含了一系列的字段，类似数据库表中一条数据
- JSON文档，格式灵活，不需要预先定义格式
  - 字段的类型可以指定或者通过Elasticsearch自动推算
  - 支持数组 / 支持嵌套

文档元数据

索引

Type
- 在7.0之前，一个Index可以设置多个Types
- 7.0开始一个索引只能建立一个Type：_doc
Elasticsearch和关系型数据库的比较

增删改查（RD使用）

单机ES

部署于192.168.100.200

#下载GPG-KEY校验
[root@pakho ~]# rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch
#创建YUM源
[root@pakho ~]# vim /etc/yum.repos.d/elasticsearch.repo
[elasticsearch]
name=Elasticsearch repository for 7.x packages
baseurl=https://artifacts.elastic.co/packages/7.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md
#安装elasticsearch
[root@pakho ~]# yum -y install elasticsearch
[root@pakho ~]# systemctl daemon-reload
[root@pakho ~]# systemctl enable elasticsearch.service
[root@pakho ~]# systemctl start elasticsearch.service

[root@pakho ~]# ss -lnt
...
:9200
:9300
#关闭elasticsearch , 等下做集群的时候一直开着 ,系统会认为集群只有本机
[root@pakho ~]# systemctl stop elasticsearch.service

集群概述

Elasticsearch是一个分布式、RESTful风格的搜索和数据分析引擎，能够解决不断涌现出的各种用例。作为Elastic Stack的核心，它集中存储您的数据，帮助您发现意料之中以及意料之外的情况。

集群基本概念

集群的特性
- Elasticsearch集群是一个多节点组成的高可用可扩展的分布式系统
  - 高可用
    - 服务可用性，允许有节点停止服务
    - 数据可用性，部分节点丢失，不会丢失数据
  - 可扩展性
    - 请求量提升 / 数据的不断增长（将数据分部到所有节点上）
  - Elasticsearch的分布式架构的好处
    - 存储的水平扩容
    - 提高系统的可用性，部分节点停止服务，整个集群的服务不受影响
  - Elasticsearch的分布式架构
    - 不同的集群通过不同的名字来区分，默认名字`“elasticsearch”
    - 通过配置文件修改，或者在命令行中 -E cluster.name=geektime进行设定
    - 一个集群可用有一个或者多个节点
集群中的节点角色
Master-eligible Node和 Master Node
- 每个节点启动后，默认就是一个Master eligible节点
  - 可以设置node.master:false禁止
- 当第一个节点启动时候，他会将自己选举为Master节点
- 每个节点上都保存了集群的状态，只有Master节点才能修改集群的状态信息
  - 集群状态(Clister State)，维护了一个集群，必要的信息
    - 所有的节点信息
    - 所有的索引和其相关的Mapping和Setting信息
    - 分片的路由信息
  - 任意节点都能修改信息会导致数据的不一致性
Date Node和Coordinating Node
- Date Node
  - 可以保存数据的节点，叫做Data Node，负责保存分片数据，在数据扩展上起到了至关重要的作用
- Coordinating Node
  - 负责接收Client的请求，将请求分发到合适的节点，最终把结果汇集到一起
  - 每个节点默认都起到了Coordinating Node的职责
分片
- 主分片和副本
  - 主分片，用以解决数据水平扩展的问题，通过主分片，可以将数据分布到集群内的所有节点之上
    - 一个分片是一个运行的Lucene的实例
    - 主分片数在索引创建时指定，后续不允许修改，除非Reindex
  - 副本，用以解决数据高可用的问题，分片是主分片的拷贝
    - 副本分片数，可以动态地调整
    - 增加副本数，还可以在一定程度上提高服务的可用性（读取的吞吐）
分片分布示例
- 一个三节点的集群中，blogs索引的分片分布情况

分片的设定

主分片是在一开始建立索引时候设置的，后期无法更改！
一般和节点相同即可！

生产中要做好容量规划
- 分片过少
  - 后期如果数量量不断增多，也无法通过增加节点来实现水平扩展也会导致单个分片存储数据量过多，在以后数据重新分配时耗时
- 分片过多
  - 假如长期分片过多，会影响查询结果的相关性打分，从而影响查询结果的准确性单节点上存放过多的分片会造成资源的浪费，也会影响性能

集群部署

主机规划

主机	IP地址	配置
Master	192.168.100.200	4G内存
es_node1	192.168.100.201	4G内存
es_node2	192.168.100.202	4G内存

配置域名解析

[root@master ~]# vim /etc/hosts
192.168.100.200 master
192.168.100.201 es_node1
192.168.100.202 es_node2
[root@master ~]# scp -r /etc/hosts es_node1:/etc/hosts
[root@master ~]# scp -r /etc/hosts es_node2:/etc/hosts

Master节点配置

[root@master ~]# vim /etc/elasticsearch/elasticsearch.yml
cluster.name: elk
node.name: master
node.data: true     #添加,这是一个数据节点吗,是的
network.host: 0.0.0.0
http.port: 9200     #对外服务端口9200

#官方文档指定写法如下,三台机器一样
discovery.seed_hosts: 
    - master                  #节点1主机名称
    - 192.168.100.201:9300    #节点2的IP加端口
    - 192.168.100.202         #节点3的IP

#集群初始化主人是谁？ 写一个就行,为什么写三个, 如果主机挂了 其余主机能顶替, 注意主机之间的空格
cluster.initial_master_nodes: ["master", "es_node1", "es_node2"]

#拷贝至其余节点
[root@master ~]# scp -r /etc/elasticsearch/elasticsearch.yml es_node1:/etc/elasticsearch/
[root@master ~]# scp -r /etc/elasticsearch/elasticsearch.yml es_node2:/etc/elasticsearch/

es_node1节点配置

[root@es_node1 ~]# vim /etc/elasticsearch/elasticsearch.yml
cluster.name: elk
node.name: es_node1
node.data: true
network.host: 0.0.0.0
http.port: 9200

discovery.seed_hosts:
    - master
    - 192.168.100.201:9300
    - 192.168.100.202

cluster.initial_master_nodes: ["master", "es_node1", "es_node2"]

es_node2节点配置

[root@es_node2 ~]# vim /etc/elasticsearch/elasticsearch.yml
node.name: es_node2   #只需改名即可

配置文件参数说明
- cluster.name 集群名称，各节点配成相同的集群名称
- node.name 节点名称，各节点配置不同
- node.data指示节点是否为数据节点，数据节点包含并管理索引的一部分
- network.host绑定节点IP
- http.port监听端口
- path.data数据存储目录
- path.logs日志存储目录
- discovery.seed.hosts指定集群成员，用于主动发现他们，所有成员都要写进来，包括自己，每个节点中应该写一样的信息
- cluster.initial_master_nodes指定有资格成为master的节点
- http.cors.enabled用于允许head插件访问es
- http.cors.allow-origin允许的源地址
注意：
- 当提供的自定义设置时network.host，elasticsearch会假设正在从开发模式过渡到生产模式，并将许多系统启动检查从警告升级到异常
- cluster.initial_master_nodes中的节点名称需要和node.name的名称一致

启动集群

在每个节点上启动elasticsearch进程
yum方式安装直接启动服务即可，以下为二进制方式的启动
切换到普通用户ela，yum安装直接使用systemctl start elasticsearch启动
YUM安装启动时注意启动顺序，Master -> es_node1 -> es_node2

su - ela

执行如下命令

cd /usr/local/elasticsearch-7.10.0
./bin/elasticsearch -d -p /tmp/elasticsearch.pid

-d后台运行
-p指定一个文件，用于存放pid
默认的端口号
- 9200用于外部访问的监听端口，比如查看集群状态，向其传输数据，查询数据等
- 9300用户集群中节点之间的相互通信，比如主节点之间的选举，集群节点信息的通告等
查看端口的命令如下

ss -ntal

注意：如果集群配置错误，想重新初始化集群，只需要删除数据目录，重启服务即可
日志
- 日志消息可以在$ES_HOME/logs/目录中找到

ls /logs/elk.log

YUM安装的日志：cat /var/log/elasticsearch/elasticsearch.log
假如启动失败，从这个日志中查询报错信息

查看集群健康状态

curl -X GET "localhost:9200/_cat/health?v"

[root@es_node2 ~]# curl -X GET "localhost:9200/_cat/health?v"
epoch      timestamp cluster status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1626544475 17:54:35  elk     green           3         3      0   0    0    0        0             0                  -                100.0%

三种不同状态的含义
- 黄色，如果仅运行单个Elasticsearch实例，则集群状态将保持黄色，单节点集群具有完整的功能，但是无法将数据复制到另一个节点以提供弹性
- 绿色，副本分片必须可用，集群状态为绿色
- 红色，如果集群状态为红色，则某些数据不可用

查看集群节点信息

curl -X GET "localhost:9200/_cat/nodes?v"

[root@master ~]# curl -X GET "localhost:9200/_cat/nodes?v"
ip              heap.percent ram.percent cpu load_1m load_5m load_15m node.role   master name
192.168.100.200           36          72   3    0.02    0.08     0.10 cdfhilmrstw *      master
192.168.100.201           26          76   3    0.05    0.09     0.10 cdfhilmrstw -      es_node1
192.168.100.202           14          76   3    0.00    0.10     0.11 cdfhilmrstw -      es_node2

集群报错排查

一般报错，常出现之前使用root 用户启动，之后又使用普通用户启动的情况。还有集群节点的IP地址变化的情况。

# 找到进程
[ela@ela1 elasticsearch-7.10.0]$ jdk/bin/jps
8244 jps
7526 Elasticsearch

# 杀死进程
[ela@ela1 elasticsearch-7.18.0]$ kill -9 7526

查看相关日志

logs/elk.log

根据日志修改相关配置信息
解决完成后执行如下操作

#删除数据目录中的所有文件
[ela@ela1 elasticsearch-7.10.0]$ rm -rf data/*

#删除日志
[ela@ela1 elasticsearch-7.18.0]$ rm -rf logs/*

#删除keystore文件
[ela@ela1 elasticsearch-7.10.0]$ rm -rf config/elasticsearch.keystore

#重新启动进程
[ela@ela1 elasticsearch-7.10.0]$ bin/elasticsearch -d -p /tmp/elk.pid

关闭Elasticsearch进程

#二进制方式
# pkill -F /tmp/elasticsearch.pid

ES集群测试

使用Filebeat搜集 Nginx的日志，输出到Logstash，再由Logstash处理完数据后输出到Elasticsearch
确保Elasticsearch集群可用
Logstash配置

[root@master ~]# vim /usr/local/logstash/config/first-pipeline.conf
#监听 5044 端口,接收 filebeat 的输入
input {
    beats {
      port => 5044
   }
}

filter {
    grok { #对web日志进行过滤处理,输出结构化的数据
           #在message字段对应的值中查询匹配上COMBINEDAPACHELOG
         match => { "message" => "%{COMBINEDAPACHELOG}"}  }
    #geoip { source => "clientip" }
}
output {
    stdout{ 
       codec => rubydebug
    }

    elasticsearch {
      # 这里是输出到 elasticsearch 集群中
      hosts => ["192.168.100.200:9200","192.168.100.201:9200","192.168.100.202"]
                }
}

Logstash配置文件准备完成后，启动filebeat

[root@master filebeat]# pwd
/usr/local/filebeat
#指定配置文件启动
[root@master filebeat]# ./filebeat -c /usr/local/filebeat/filebeat.yml

启动Logstash

[root@master logstash]# pwd
/usr/local/logstash
[root@master logstash]# ./bin/logstash -f config/first-pipeline.conf

验证

持续向日志文件中输入日志内容
访问Nginx服务器持续产生日志

[root@master ~]# vim /var/log/access.log
...

查看Logstash的终端

...
{
       "project" => {
          "id" => "574734885120952459",
        "name" => "myproject"
    },
           "log" => {
        "offset" => 3290,
          "file" => {
            "path" => "/var/log/access.log"
        }
    },
       "fileset" => {
        "name" => "access"
    },
           "ecs" => {
        "version" => "1.9.0"
    },
      "@version" => "1",
          "tags" => [
        [0] "beats_input_codec_plain_applied",
        [1] "_grokparsefailure"
    ],
         "agent" => {
            "hostname" => "master",
                "type" => "filebeat",
                  "id" => "57d4937a-5d65-498a-bc50-f8779a11ebcf",
        "ephemeral_id" => "977cb9be-c500-41b2-b9b3-64ce579ee7b0",
             "version" => "7.13.2",
                "name" => "master"
    },
         "event" => {
          "module" => "nginx",
         "dataset" => "nginx.access",
        "timezone" => "+08:00"
    },
       "message" => "FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF",
          "host" => {
                   "os" => {
                "name" => "CentOS Linux",
            "codename" => "Core",
              "family" => "redhat",
              "kernel" => "3.10.0-862.el7.x86_64",
                "type" => "linux",
             "version" => "7 (Core)",
            "platform" => "centos"
        },
                   "ip" => [
            [0] "192.168.100.200",
            [1] "fe80::ec53:d68d:60ea:b5e0"
        ],
             "hostname" => "master",
         "architecture" => "x86_64",
                   "id" => "ad8a55213faa46babc18170804417b90",
                  "mac" => [
            [0] "00:0c:29:ae:a5:a7"
        ],
        "containerized" => false,
                 "name" => "master"
    },
         "input" => {
        "type" => "log"
    },
    "@timestamp" => 2021-07-17T18:24:44.580Z,
       "service" => {
        "type" => "nginx"
    }
}
...

验证Elasticsearch是否创建了索引

[root@master ~]# curl -X GET "192.168.100.200:9200/_cat/indices"
green open logstash-2021.07.17-000001 HqWptzX_RkeGjm91LfF22w 1 1 31 0 80.5kb 40.2kb

目前logstash-2021.07.17-000001是Elasticsearch自动创建的索引
如果需要自定义索引，参照如下

Kibana部署调试

Kibana-是进入Elastic的窗口，使用Kibana，可以：
- 搜索，观察和保护。从发现文档到分析日志再到发现安全漏洞，Kibana是您访问这些功能及其他功能的门户。
- 可视化和分析数据。搜索隐藏的见解，可视化在图表，仪表，地图等中找到的内容，并将其组合在仪表板中。
- 管理，监视和保护弹性堆栈。管理索引和提取管道，监视Elastic Stack集群的运行状况，并控制哪些用户可以访问哪些功能。

[root@master ~]# curl -L -O https://artifacts.elastic.co/downloads/kibana/kibana-7.13.2-linux-x86_64.tar.gz
[root@master ~]# tar xf kibana-7.13.2-linux-x86_64.tar.gz -C /usr/local/
[root@master ~]# mv /usr/local/kibana-7.13.2-linux-x86_64/ /usr/local/kibana

配置主配置文件
- /usr/local/kibana/config/kibana.yml

[root@master ~]# vim /usr/local/kibana/config/kibana.yml
server.port: 5601
server.host: "0.0.0.0"

#用于连接到ES 集群的地址和端口
elasticsearch.hosts: ["http://192.168.100.200:9200"]

#日志文件路径
#logging.dest: stdout
logging.dest: /var/log/kibana/kibana.log

#设置页面的字体为中文
i18n.locale: "zh-CN"

创建用于运行kibana的普通用户
默认情况下，kibana不允许使用root用户运行，所以必须创建一个普通用户

[root@master ~]# useradd ela

[root@master ~]# mkdir /run/kibana /var/log/kibana
[root@master ~]# chown ela.ela /run/kibana/ /var/log/kibana/ /usr/local/kibana/ -R

使用普通用户运行
运行于前台

[root@master ~]# su - ela
[ela@master ~]$ /usr/local/kibana/bin/kibana

运行于后台

[ela@master ~]$ nohup /usr/local/kibana/bin/kibana &

使用root用户运行
如果使用root用户运行需要使用如下命令

[ela@master ~]$ nohup /usr/local/kibana/bin/kibana --allow-root &

访问
- 浏览器访问：http://ip:5601

创建索引模式
- Kibana需要使用索引模式来访问要浏览的Elasticsearch数据。索引模式选择要使用的数据，并允许您定义字段的属性。
- 索引模式可以指向特定索引，例如，昨天的日志数据或包含您的数据的所有索引。它还可以指向数据流或索引别名。

你可能感兴趣的:(ELK,大数据,elasticsearch,elk,运维)

SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？ SeaTunnel bug SeaTunnel 开源数据集成大数据
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
Elasticsearch性能调优金字塔：从分片与副本策略构建海量日志分析平台 lingRJ777 Java技术栈应用 java backend elasticsearch spring boot microservices elk
Elasticsearch性能调优金字塔：从分片与副本策略构建海量日志分析平台引言在当前的微服务架构体系中，一个复杂的业务流程往往会横跨数十甚至上百个服务。当线上出现问题时，如何从每天产生的TB级海量日志中快速定位根源，成为衡量系统可观测性的关键。传统的日志聚合方案在面对如此巨大的数据量时，普遍会遇到两大核心挑战：高并发写入瓶颈：数千个服务实例同时产生大量日志，要求日志系统具备极高的写入吞吐能力，
基于 SASL/SCRAM 让 Kafka 实现动态授权认证 zlt2000 Java java springboot kafka
一、说明在大数据处理和分析中ApacheKafka已经成为了一个核心组件。然而在生产环境中部署Kafka时，安全性是一个必须要考虑的重要因素。SASL（简单认证与安全层）和SCRAM（基于密码的认证机制的盐化挑战响应认证机制）提供了一种方法来增强Kafka集群的安全性。本文将从零开始部署ZooKeeper和Kafka并通过配置SASL/SCRAM和ACL（访问控制列表）来增强Kafka的安全性。二
Docker：容器化技术的基石与实践指南代码老y docker 容器运维
在现代软件开发和部署中，Docker作为一种领先的容器化平台，已经成为了开发人员和运维工程师不可或缺的工具。它不仅简化了应用的部署过程，还提高了应用的可移植性和可扩展性。本文将深入探讨Docker的核心概念、基本操作以及如何在实际项目中应用Docker来实现高效的容器化部署。一、Docker核心概念（一）容器与镜像容器是Docker的核心概念之一，它是一个轻量级、可执行的软件包，包含了运行某个应用
系统性能调优指南：CPU、内存、磁盘I/O资源的优化策略 Echo_Wish 让你快速入坑运维运维探秘 linux 服务器运维 docker nginx
在系统运维中，性能调优是确保系统高效运行的关键任务。本文将深入探讨如何优化CPU、内存和磁盘I/O资源的使用，通过详细的策略和示例代码，帮助您实现系统性能的提升。一、CPU性能优化CPU是系统的核心资源之一，其性能直接影响系统的整体运行速度。以下是一些常见的CPU性能优化策略：1.进程优先级调整通过调整进程的优先级，可以优化CPU的资源分配。Linux系统中，可以使用nice和renice命令调整
Elasticsearch分组后排序，并查询组数量 Gzzz__ Elasticsearch elasticsearch java 大数据
项目场景：Elasticsearch分组后，根据分组后的数量排序，并查询分组后的组数量，通过DSL和javaAPI两种方式解决方案：示例：在单据表中，查询2022-01-19当天每个人提交的单据数量，从高到低排序，并查询提交过单据的总人数。期望实现的SQLselectId,count(Id)ascfromuserbillwheretype='bill'andcreateTime>='2022-01
嵌套列表与二维列表的遍历方法
在Python的世界中，列表（list）是最为基础而强大的数据结构之一。而当一个列表的元素本身又是列表时，我们便进入了嵌套列表（NestedList）或更通用的二维列表（2DList）的语境中。无论是在软件开发、测试数据构造、数据分析、机器学习、自动化运维还是教育教学场景中，嵌套结构的遍历与处理都是工程能力的一项基本功。本文将系统剖析Python中处理嵌套列表和二维列表的常用遍历方式，从基础语法到
以智能楼宇自动化控制系统为基石，构筑绿色建筑节能增效新标杆 ctrlworks 楼宇自控康沃思物联楼宇自控系统厂家 ba系统厂商建筑管理系统厂家 ibms系统厂家
在全球“双碳”目标加速推进与能源危机日益凸显的背景下，建筑行业作为能源消耗与碳排放的重点领域，正面临从传统建造向绿色智能化转型的迫切需求。数据显示，我国建筑运行阶段能耗占全社会总能耗超30%，碳排放占比达21.9%，而传统建筑管理模式下设备低效运行、能源浪费等问题普遍存在。智能楼宇自动化控制系统（BACS）凭借物联网、大数据、人工智能等技术，通过对建筑设备的精准监控、智能调度与协同管理，成为破解绿
大神之路-起始篇 | 第13章.计算机科学导论之【文件结构】学习笔记全栈工程师修炼指南从业必看书籍专栏学习笔记
欢迎关注「WeiyiGeek」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！涉及网络安全运维、应用开发、物联网IOT、学习路径、个人感悟等知识“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]作者博客：[https://blog.weiyigeek.top]作者答疑学习交流群：
MapReduce01：基本原理和wordCount代码实现冬至喵喵大数据 mapreduce
本篇文章中，笔者记录了自己对于MapReduce的肤浅理解，参考资料主要包括《大数据Hadoop3.X分布式处理实战》和网络视频课程。下文介绍了MapReduce的基本概念、运行逻辑以及在wordCount代码示例。一、MapReduce概述1.概述google为解决其搜索引擎中的大规模网页数据的并行化处理问题，设计了MapReduce，在发明MapReduce之后首先用其重新改写了搜索引擎中we
性能分析与调优详解测试老哥测试工具 python 软件测试自动化测试性能测试测试用例职场和发展
点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快常看到性能测试书中说，性能测试不单单是性能测试工程师一个人的事儿。需要DBA、开发人员、运维人员的配合完成。但是在不少情况下性能测试是由性能测试人员独立完成的，退一步就算由其它人员的协助，了解系统架构的的各个模块对于自身的提高也有很大帮助，同进也更能得到别人的尊重。性能分析与调优如何下手先从硬件开始，还是先从代码或数据库。从操作系统（CP
大模型智能运维详解：技术架构、落地挑战与行业实践 FreeTools FreeAiGuard 运维架构人工智能运维开发科技
大模型智能运维详解：技术架构、落地挑战与行业实践作者：开源大模型智能运维FreeAiOps在数字化转型加速的背景下，企业IT系统复杂度呈指数级增长，传统运维模式面临效率低下、故障定位困难、成本高昂等瓶颈。大模型技术的出现为智能运维提供了突破性解决方案，其通过自然语言处理、多模态数据分析与自动化决策能力，正在重塑运维工作的底层逻辑。本文将从技术原理、落地挑战、行业实践三个维度，系统解析大模型智能运维
知识积累----空转转录因子TF活性的计算框架追风少年ii 空间数据分析 hotspot 傅里叶变换机器学习
作者，EvilGenius关于我们外显子的分析课程，我们来一次预报名吧，课表如下第一节：外显子分析基础知识与框架（包括基础文件的格式等）第二节：fastq数据处理到callSNV+基础认知（简单判断谱系突变和体系突变、以及GT:AD:AF:DP等基础信息）第三节（可能需要拆分成2节课）：各大数据库如何注释突变信息（clinvar、cosmic、gnomad、HGMD、hotspot、oncoKB、
大数据项目-Django基于大数据技术实现的农产品销售系统 IT实战课堂-玲琳娜计算机毕业设计大数据 java spark 爬虫
《[含文档+PPT+源码等]Django基于大数据技术实现的农产品销售系统》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、包运行成功以及课程答疑与微信售后交流群、送查重系统不限次数免费查重等福利！数据库管理工具：phpstudy/Navicat或者phpstudy/sqlyog后台管理系统涉及技术：后台使用框架：Django前端使用技术：Vue,HTML5,CSS3、JavaScrip
ES 和 lucene 的区别是什么？晚夜微雨问海棠呀 elasticsearch lucene 大数据
Elasticsearch(ES)和Lucene都是用于全文搜索和分析的工具，但它们在功能和使用场景上有一些重要的区别：基础与角色：Lucene是一个开源的信息检索软件库，提供了一个高性能、全功能的文本搜索引擎。它是许多搜索应用的核心，包括Elasticsearch。Elasticsearch是一个分布式搜索和分析引擎，构建在Lucene之上。它不仅提供了Lucene的所有功能，还增加了分布式计算
Lucence 和 Elasticsearch 的区别? 码出财富 elasticsearch 大数据搜索引擎
Lucene和Elasticsearch都是在信息检索和文本处理领域中广泛使用的工具，它们的主要区别如下：概念和定位Lucene：是一个基于Java的全文检索库，它提供了一套强大的底层索引和搜索功能的API。Lucene更像是一个工具包，开发人员可以基于它来构建自己的搜索应用程序，需要深入了解搜索的底层原理和算法，对开发者的技术要求较高。Elasticsearch：是一个基于Lucene的分布式搜
香港服务器查询缓存禁用-性能优化关键技术解析 cpsvps_net linux
在香港服务器运维过程中，查询缓存禁用是提升数据库性能的关键操作。本文将深入解析禁用查询缓存的原理、操作步骤、适用场景及注意事项，帮助管理员优化MySQL服务器配置，解决高并发环境下的性能瓶颈问题。香港服务器查询缓存禁用-性能优化关键技术解析查询缓存的工作原理与性能影响香港服务器上的MySQL查询缓存(QueryCache)机制会将SELECT语句及其结果存储在内存中。当完全相同的查询再次执行时，系
VPS服务器上Windows容器网络IPv6双栈配置指南 cpsvps_net 服务器 windows 网络
在云计算技术快速发展的今天，Windows容器结合IPv6双栈网络配置已成为提升VPS服务器效能的关键技术。本文针对运维工程师的实际需求，深入解析如何在虚拟私有服务器环境中，通过Docker平台实现Windows容器的IPv6/IPv4双协议栈部署，涵盖网络适配器设置、Docker引擎配置、防火墙策略优化等核心环节，并特别关注VPS服务商对IPv6的特殊支持要求。VPS服务器上Windows容器网
VPS云服务器自动化运维：Ansible+Puppet实现批量配置管理与监控 cpsvps_net 运维服务器自动化
在云计算时代，VPS云服务器的自动化运维已成为企业提升效率的关键技术。本文将深入解析如何通过Ansible和Puppet两大主流工具实现批量配置管理，构建完整的监控体系，帮助运维团队从重复劳动中解放，确保服务器集群的高可用性。我们将从基础架构设计到实战案例，系统讲解自动化运维的最佳实践路径。VPS云服务器自动化运维：Ansible+Puppet实现批量配置管理与监控一、VPS云服务器自动化运维的核
JVM调优实战 Day 14 ：大数据处理中的JVM调优在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day14】大数据处理中的JVM调优文章标签jvm调优,大数据处理,Java性能优化,JVM参数配置,JVMGC调优,Java开发,大数据架构,Jvm实战文章简述在大数据处理场景中，Java应用通常面临内存占用高、GC频率频繁、堆内存不足等挑战。本文作为“JVM调优实战”系列的第14天，深入探讨了大数据处理中的JVM调优策略。文章从概念解析、技术原理、常见问题、诊断方法、调优策略到
鸿蒙开发必备技能：六种数据存储方式全解析+实战代码 harmonyos
摘要在当前多设备互联的时代，移动端应用不再局限于单一设备，而是需要在多个终端上保持状态一致、数据同步与持久管理。鸿蒙系统提供了多种数据存储机制，从轻量级状态存储到复杂的数据持久化方案，满足不同场景下的需求。本文将结合实战案例，深入讲解鸿蒙系统中的六大数据存储方式，并配有可运行的代码，帮助开发者快速掌握数据管理方法。引言随着鸿蒙系统的不断发展，越来越多的开发者开始构建面向多设备、多用户、多场景的智能
IT 行业深度洞察：从技术革命到产业重构的全景图谱 XQR.小白重构
摘要本文系统梳理IT行业的发展脉络，深入剖析云计算、人工智能、大数据、物联网等核心技术的演进逻辑与协同效应，揭示IT产业在数字化转型浪潮中的生态重构与价值创造。通过典型案例分析与数据支撑，探讨行业面临的技术挑战、伦理困境与全球化竞争格局，展望IT技术如何持续驱动社会变革与产业升级。全文结合2025年最新技术动态与市场趋势，为从业者、投资者与研究者提供兼具理论深度与实践指导的行业参考。目录摘要一、I
Python 爬虫实战：12306 订单记录爬取（登录态保持 + 订单数据可视化）西攻城狮北 python 爬虫信息可视化
引言在大数据驱动的今天，12306作为国内最重要的铁路出行平台，积累了海量的出行数据。对于广大用户而言，能够方便地查看和分析自己的出行订单记录，不仅有助于行程管理，还能为未来的出行规划提供有力参考。本文将详细讲解如何利用Python爬虫技术实现12306的模拟登录，爬取个人订单记录，并通过数据可视化技术直观展示出行情况。一、环境搭建与准备工作（一）Python环境配置确保本地已安装Python3.
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二) 争取不加班！ hadoop hbase zookeeper 大数据运维
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
Redis 集群与分布式实现：从原理到实战一切皆有迹可循 redis redis 分布式数据库后端缓存
前言在大数据与高并发场景下，单节点Redis的容量与可用性已无法满足需求。Redis通过集群与分布式技术，实现了数据的分片存储与高可用部署，成为分布式系统的核心组件。本文将深入解析Redis集群的底层原理、架构模式与实战经验，结合代码示例与最佳实践，帮助开发者构建高性能、高可用的分布式缓存系统。一、集群基础架构与核心原理1.数据分片机制Redis集群采用哈希槽（HashSlot）实现数据分片，共有
网络延迟诊断与优化：从路由到应用层的全链路分析 Clownseven 网络智能路由器
更多云服务器知识，尽在hostol.com你有没有在日常工作中体验过网络延迟带来的焦虑？浏览器页面加载缓慢，API请求几秒钟不返回，甚至服务器上的某个微服务迟迟无法响应。每次点击刷新页面，你的心里是否已经准备好迎接各种负面反馈？网络延迟，简而言之，就是数据从源头传输到目的地所花的时间。你可能认为延迟只是一个小问题，可当延迟问题累积，可能就会变成让整个系统瘫痪的大隐患。我们每一个运维人员都清楚，任何
大数据未来发展的趋势与挑战倒霉男孩大数据
随着信息技术的飞速发展，大数据已经成为推动社会进步和产业变革的重要力量。从商业决策到医疗健康，从智慧城市到人工智能，大数据技术的应用无处不在。未来，随着5G、物联网（IoT）、人工智能（AI）等技术的深度融合，大数据的发展将迎来更广阔的空间，同时也面临诸多挑战。本文将探讨大数据未来的发展趋势、应用前景以及可能面临的问题。一、大数据未来的发展趋势数据量持续爆发式增长随着5G网络的普及和物联网设备的广
从0到1构建智能招聘数据引擎：基于 Python 的 BOSS直聘信息采集实战与反爬破解指南程序员威哥 python 开发语言
前言在大数据浪潮席卷的时代，招聘平台蕴藏着海量的岗位信息，揭示着行业走向、人才趋势、薪资结构等核心价值。BOSS直聘作为国内极具代表性的直招平台，其数据对职业分析、市场监测甚至智能推荐系统的构建都有着重要意义。本文将手把手带你打造一个高质量、抗封锁的Python爬虫系统，精准采集BOSS直聘网的岗位数据，并全面解析其中涉及的反爬机制识别、加密参数处理、数据提取与存储等高级技巧，助你在Web数据采集
未来运维，绝绝AI 必备 AI_运维_攻城狮 ai 运维人工智能
在当今数字化时代，运维工作对于企业的稳定运行至关重要。随着科技的不断进步，人工智能（AI）和自动化技术正逐渐改变着运维行业的面貌。本文将分析运维行业的未来发展方向，探讨人工智能在运维中的应用前景、自动化运维的发展趋势，并对未来的运维工作模式和技能需求进行预测和分析，以帮助读者更好地规划自己的职业发展。一、运维行业现状目前，运维工作主要包括服务器管理、网络管理、数据库管理、应用程序监控等方面。运维工
博睿数据出席GOPS全球运维大会，深度解析如何让大模型真正“懂”运维！运维
2025年6月27日-28日，第二十六届GOPS全球运维大会暨研运数智化技术峰会在北京盛大启幕。全球近千位行业专家齐聚一堂，围绕大模型、DevOps、SRE、可观测性等核心议题展开深度探讨。本届峰会专设可观测性、金融行业、SRE稳定性等特色专场，聚焦IT技术领域的最新发展，共探企业级最佳实践。作为国内应用性能管理及可观测性领域的领导者，博睿数据受邀出席本次大会。产品总监贺安辉亮相“可观测性专场”，
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri