weixin_30457065

ELK学习笔记

1、ELK-ES简介

对于日志来说，最常见的就是收集、存储、查询、展示。对应的有一个开源项目组合：ELKStack。其中包括logstash(日志收集)、elasticsearch(存储+搜索)和kibana(展示)这三个项目。

https://www.elastic.co/cn/

安装logstash：

# yum install -y java

导入GPG-KEY：

# rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch

添加yum仓库：

# vim /etc/yum.repos.d/logstash.repo

[logstash-6.x]

name=Elastic repository for 6.x packages

baseurl=https://artifacts.elastic.co/packages/6.x/yum

gpgcheck=1

gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch

enabled=1

autorefresh=1

type=rpm-md

# yum install -y logstash

# systemctl start logstash

安装ElasticSearch，使用6.x版本的安装包有太多的坑，所以改用2.x版本

————————————————————————————————————————————————————————————————————这是个坑，放弃———————————————————————————————————————————————————————————————————————————————————

tar.gz安装：官网上有现成的压缩包，下载下来解压就完成了。

# wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.4.tar.gz

# tar zxf elasticsearch-6.2.4.tar.gz

然后是配置。配置文件在/etc/elasticsearch/下：

# vim elasticsearch.yml

# ---------------------------------- Cluster -----------------------------------

cluster.name: myes //elasticsearch就是分布式的

# ------------------------------------ Node ------------------------------------

# Use a descriptive name for the node:

node.name: linux-node01 //配置节点名称

# ----------------------------------- Paths ------------------------------------

path.data: /data //配置存储es数据的路径，多个的话可以使用,分隔

path.logs: /var/log/elasticsearch/ //日志的路径

# ----------------------------------- Memory -----------------------------------

bootstrap.memory_lock: true //保证内存不会放入交换分区

# ---------------------------------- Network -----------------------------------

network.host: 172.16.0.3 //本机IP地址

http.port: 9200 //默认端口，不需要修改

# --------------------------------- Discovery ----------------------------------

# 这里配置的是集群的各个节点互相发现的方式，有单播或者组播的方式。

然后创建/data目录：

# mkdir /data

接下来启动：

# ./bin/elasticsearch

失败。。。然后查看日志：

# cat /home/es/elasticsearch-6.2.4/logs/myes.log

[2018-05-22T16:03:12,235][ERROR][o.e.b.Bootstrap ] Exception

java.lang.RuntimeException: can not run elasticsearch as root

查看网上解释发现如果是以root权限来执行elasticsearch会有上面的报错。解决方法，创建es用户，然后修改所有相关文件的属主和属组。

# useradd es

# passwd es

# mv ~/elasticsearch-6.2.4 /home/es/

# chown -R es:es /home/es/elasticsearch-6.2.4

# chown -R es:es /data/

然后切换用户启动：

# su - es

$ ./elasticsearch-6.2.4/bin/elasticsearch

接下来又遇到报错：

[2018-05-22T16:32:36,857][WARN ][o.e.b.JNANatives ] Unable to lock JVM Memory: error=12, reason=无法分配内存

[2018-05-22T16:32:36,874][WARN ][o.e.b.JNANatives ] This can result in part of the JVM being swapped out.

[2018-05-22T16:32:36,874][WARN ][o.e.b.JNANatives ] Increase RLIMIT_MEMLOCK, soft limit: 65536, hard limit: 65536

[2018-05-22T16:32:36,875][WARN ][o.e.b.JNANatives ] These can be adjusted by modifying /etc/security/limits.conf, for example:

# allow user 'elasticsearch' mlockall

elasticsearch soft memlock unlimited

elasticsearch hard memlock unlimited

...

[2018-05-22T16:33:28,310][INFO ][o.e.b.BootstrapChecks ] [linux-node1] bound or publishing to a non-loopback address, enforcing bootstrap checks

ERROR: [3] bootstrap checks failed

[1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]

[2]: memory locking requested for elasticsearch process but memory is not locked

[3]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144]

在root用户下修改系统文件：

# vim /etc/security/limits.conf

* soft nofile 65535

* hard nofile 131072

* soft memlock unlimited

* hard memlock unlimited

# vim /etc/sysctl.conf

vm.max_map_count=655360

安装kibana和marvel：

由于elasticsearch使用的是6.2.4，这里kibana也应该使用6.2.4版本，同样使用tar包：

$ wget https://artifacts.elastic.co/downloads/kibana/kibana-6.2.4-linux-x86_64.tar.gz

$ tar zxf kibana-6.2.4.linux-x86_64.tar.gz

$ cd /kibana-6.2.4-linux-x86_64/config/kibana.yml //修改IP地址

server.host: "172.16.0.3"

elasticsearch.url: "http://172.16.0.3:9200"

elasticsearch.username: "elastic"

elasticsearch.passsword: "123456” //这个要与后面使用set-password所设置的密码保持一致

logging.dest: /var/log/kibana

# touch /var/log/kibana

# chown -R es:es /var/log/kibana

根据官网的描述，在5.0以后，Marvel插件归入X-Pack，所以这里安装X-Pack：

$ pwd

/home/es

$ ./elasticsearch-6.2.4/bin/elasticsearch-plugin install x-pack

接下来分别启动elasticsearch和kibana

$ ./elasticsearch-6.2.4/bin/elasticsearch -d

$ ./kibana-6.2.4-linux-x86_64/bin/kibana

注意，kibana这里用tar包运行，没有像elasticsearch那么方便直接-d就可以后台运行，所以需要如下的方式：

$ nohup /home/es/kibana-6.2.4-linux-x86_64/bin/kibana &

运行完之后可以看到9200正常监听，然后可以用http://172.16.0.3:9200打开网页，但是这个时候需要输入密码。原因在于安装了X-pack。

$ ./elasticsearch-6.2.4/bin/x-pack/set-passwords ineractive

设置密码。完成之后可以正常打开网页。

安装head插件(集群管理插件)：

在6.2.3版本中无法直接通过plugin安装head，可以通过git安装：

$ yum install -y git bzip2 nodejs npm

$ git clone https://github.com/mobz/elasticsearch-head.git

$ cd elasticsearch-head/

$ npm install

$ vim elastisearch-6.2.4/config/elasticsearch.yml

末尾新增：

http.cors.enable: true

http.cors.allow-origin: "*"

$ vim elasticsearch-head/Gruntifile.js

在快要结尾的位置添加hostname：

options:{

hostname: '*',

port: 9100,

base: '.',

keepalive: true

}

$ vim elasticsearch-head/_site/app.js

将localhost改成本机IP：

this.base_uri = this.config.base_uri || this.prefs.get("app-base_uri") || "http://172.16.0.3:9300";

后台启动：

$ cd elasticsearch-head/node_modules/grunt/bin/

$ nohup ./grunt server &

$ netstat -lntup

[root@3-linux-node01 elasticsearch-head]# netstat -lntup

Active Internet connections (only servers)

Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name

tcp6 0 0 :::9100 :::* LISTEN 21679/grunt

tcp6 0 0 172.16.0.3:9200 :::* LISTEN 3118/java

可以看到9100正在处于监听状态中，而且使用网页打开http://172.16.0.3:9100可以看到正常显示。

———————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————

rpm安装：

在网站上找到2.4.6的rpm安装包，然后下载下来上传至虚拟机，之后安装

# wget https://download.elastic.co/elasticsearch/release/org/elasticsearch/distribution/rpm/elasticsearch/2.4.6/elasticsearch-2.4.6.rpm

# rpm --install elasticsearch-2.4.6

配置文件还是和上面一样保持不变，但是/data的权限要变化

# chown -R elasticsearch:elasticsearch /data

# /usr/share/elasticsearch/bin/plugin install marvel-agent

# /usr/share/elasticsearch/bin/plugin install license

# /usr/share/elasticsearch/bin/plugin install mobz/elasticsearch-head

# /usr/share/elasticsearch/bin/plugin install lmenezes/elasticsearch-kopf

# /usr/share/elasticsearch/bin/plugin install hlstudio/bigdesk

# systemctl restart elasticsearch

启动完成之后就可以打开网页了：

http://172.16.0.3:9200/_plugin/head/

http://172.16.0.3:9200/_plugin/kopf/#!/cluster

但是日志中有以下错误，先等到6月23日再说吧：

# License will expire on [Saturday, June 23, 2018]. If you have a new license, please update it.

# Otherwise, please reach out to your support contact.

2、ELK-ES集群

启动第二台服务器，地址172.16.0.4。配置文件的集群名称必须一致，主机名则需要不同，IP地址需要修改。

这里不清楚是否是虚拟机故障，集群是靠组播协议发现，所以改成单播发现：

# vim /etc/elasticsearch/elasticsearch.yml

discovery.zen.ping.unicast.hosts: ["172.16.0.3", "172.16.0.4"]

# systemctl restart elasticsearch

之后可以看到两台服务器组成了集群：

所有参与集群的主机都要配置，可以不加自己的地址，但是对方的地址一定是要加的。实心五角星代表着master节点。

安装kibana，这里选择4.6.5版本：

# rpm --install kibana-4.6.5-x86_64.rpm

# vim /opt/kibana/config/kibana.yml

修改配置文件中的url地址为本机地址：

elasticsearch.url: "http://172.16.0.3:9200"

# systemctl start kibana

安装logstash，这里选择5.5.1版本：

# rpm --install logstash-5.5.1.rpm

logstash的实现主要是依赖于插件，核心在于input和output

# /usr/share/logstash/bin/logstash -e 'input { stdin{} } output { stdout{} }'

然后遇到一系列问题：

ERROR StatusLogger No log4j2 configuration file found. Using default configuration: logging only errors to the console.

WARNING: Could not find logstash.yml which is typically located in $LS_HOME/config or /etc/logstash. You can specify the path using --path.settings. Continuing using the defaults

Could not find log4j2 configuration at path //usr/share/logstash/config/log4j2.properties. Using default config which logs to console

13:37:17.095 [main] INFO logstash.setting.writabledirectory - Creating directory {:setting=>"path.queue", :path=>"/usr/share/logstash/data/queue"}

13:37:17.265 [main] INFO logstash.setting.writabledirectory - Creating directory {:setting=>"path.dead_letter_queue", :path=>"/usr/share/logstash/data/dead_letter_queue"}

13:37:17.840 [LogStash::Runner] INFO logstash.agent - No persistent UUID file found. Generating new UUID {:uuid=>"26451586-698c-48cb-87ca-8a2a80500e9e", :path=>"/usr/share/logstash/data/uuid"}

13:37:22.527 [[main]-pipeline-manager] INFO logstash.pipeline - Starting pipeline {"id"=>"main", "pipeline.workers"=>2, "pipeline.batch.size"=>125, "pipeline.batch.delay"=>5, "pipeline.max_inflight"=>250}

13:37:23.734 [[main]-pipeline-manager] INFO logstash.pipeline - Pipeline main started

The stdin plugin is now waiting for input:

13:37:26.194 [Api Webserver] INFO logstash.agent - Successfully started Logstash API endpoint {:port=>9600}

# ln -s /etc/logstash/ config

# /usr/share/logstash/bin/logstash -e 'input { stdin{} } output { stdout{} }'

解决了一部分：

ERROR StatusLogger No log4j2 configuration file found. Using default configuration: logging only errors to the console.

Sending Logstash's logs to /var/log/logstash which is now configured via log4j2.properties

The stdin plugin is now waiting for input:

插件地址：https://www.elastic.co/guide/en/logstash-versioned-plugins/current/index.html

3、ELK-Logstash实验

接下来做实验，从标准输入读取，然后输出到es里面去。这里要是用插件elasticsearch，选择版本为v7.3.2：

https://www.elastic.co/guide/en/logstash-versioned-plugins/current/v7.3.2-plugins-outputs-elasticsearch.html

# /usr/share/logstash/bin/logstash -e 'input { stdin{} } output { elasticsearch { hosts => ['172.16.0.3:9200'] index => "logstash-%{+YYYY.MM.dd}" } }'

之后输入的内容就可以在elasticsearch上看到了：

将上面的命令写成一个脚本：

# pwd

/usr/share/logstash/config/conf.d

# vim demo.conf

input{

stdin{}

}

filter{

}

output{

stdout{

codec => rubydebug

}

elasticsearch {

hosts => ["172.16.0.3:9200"]

index => "logstash-%{+YYYY.MM.dd}"

}

之后可以指定启动脚本启动：

# /usr/share/logstash/bin/logstash -f /usr/share/logstash/config/conf.d/demo.conf

这样就可以用启动脚本达成需要的效果了。

启动脚本的写法很简单，包括input、filter和output三个模块，其中filter可以为空。其中的原理需要理解。首先，logstash的读取是按"行"读取，但是大多数情况下我们是希望按"事件"读取，比如一条日志包含若干行，那么我们肯定是希望这一条日志的所有行被显示在一条日志中，而不是有多少行就显示多少条日志。其次，logstash在这个过程中相当于从input得到日志，经过codec编码之后，再经过filter过滤日志，然后经过codec解码之后再由output输出日志。每个模块都有自己的成对的{}，数组则使用[]，字符串则使用""。

discover_interval：logstash 每隔多久去检查一次被监听的 path 下是否有新文件。默认值是 15 秒。

exclude：不想被监听的文件可以排除出去，这里跟 path 一样支持 glob 展开。

sincedb_path：sincedb文件是用于存储Logstash读取文件的位置，每行表示一个文件，每行有两个数字，第一个表示文件的inode，第二个表示文件读取到的位置（byteoffset），默认为$HOME/.sincedb*(Windows 平台上在 C:\Windows\System32\config\systemprofile\.sincedb)，文件名是日志文件路径MD5加密后的结果。sincedb_path只能指定为具体的file文件，不能是path目录。

sincedb_write_interval：logstash 每隔多久写一次 sincedb 文件，默认是 15 秒。

stat_interval：logstash 每隔多久检查一次被监听文件状态（是否有更新），默认是 1 秒。

start_position：logstash 从什么位置开始读取文件数据，默认是结束位置，也就是说 logstash 进程会以类似 tail -F 的形式运行。如果你是要导入原有数据，把这个设定改成 "beginning"，logstash 进程就从头开始读取，有点类似 cat，但是读到最后一行不会终止，而是继续变成 tail -F。

接下来再做一个实验，收集系统日志：

# vim file.conf

input{

file{

path => ["/var/log/messages","/var/log/secure"]

type => "system-log"

start_position => "beginning"

}

filter{

}

output{

elasticsearch {

hosts => ["172.16.0.3:9200"]

index => "system-log-%{+YYYY.MM}"

}

# /usr/share/logstash/bin/logstash -f /usr/share/logstash/config/conf.d/file.conf

可以看到system-log的相关信息已经出来了。

4、ELK-Kibana简单使用

kibana为ELK的一个模块，为用户提供可视化界面。4.6.5版本。

# wget https://download.elastic.co/kibana/kibana/kibana-4.6.5-x86_64.rpm

# rpm --install kibana-4.6.5-x86_64.rpm

# vim /opt/kibana/config/kibana.yml

elasticsearch.url: "http://172.16.0.3:9200"

kibana.index: ".kibana"

# systemctl enable kibana

# systemctl start kibana

# netstat -lntup

Active Internet connections (only servers)

Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name

tcp 0 0 0.0.0.0:5601 0.0.0.0:* LISTEN 63193/node

打开网页之后，默认会在setting页面，kibana会引导设置第一个监控页面。通过选择时间戳或者输入名称可以对已经设置了的日志文件进行匹配然后直接读取。之后就可以在discover页面进行搜索了。需要注意的是，kibana不会自己去发现日志，所以必须通过setting进行手动添加才能读出来。同时，也会给被读取的文件记录下一个叫.sincedb的隐藏文件，如果不想使用默认的$HOME/.sincedb，可以自己通过sincedb_path来定义路径。

5、ELK-Logstash-Input-if判断

设计收集elasticsearch的日志myes.log，先按照以前的老方法配置：

[root@3-linux-node01 ~]# vim /usr/share/logstash/config/conf.d/file.conf

input{

file{

path => ["/var/log/messages","/var/log/secure"]

type => "system-log"

start_position => "beginning"

}

file{

path => "/var/log/elasticsearch/myes.log"

type => "es-log"

start_position => "beginning"

}

filter{

}

output{

if [type] == "system-log" {

elasticsearch {

hosts => ["172.16.0.3:9200"]

index => "system-log-%{+YYYY.MM}"

}

if [type] == "es-log" {

elasticsearch {

hosts => ["172.16.0.3:9200"]

index => "es-log-%{+YYYY.MM}"

}

# /usr/share/logstash/bin/logstash -f /usr/share/logstash/config/conf.d/file.conf

总是会遇到报错：

[2018-05-26T18:34:17,069][FATAL][logstash.runner ] Logstash could not be started because there is already another instance using the configured data directory. If you wish to run multiple instances, you must change the "path.data" setting.

这里是要运行多实例，修改启动命令：

# /usr/share/logstash/bin/logstash -f /usr/share/logstash/config/conf.d/file.conf --path.data /data/

启动之后可以看到已经开始出现日志，但是显示出现了"行"与"事件"的情况：

实际的日志：

[2018-05-26 18:00:06,384][WARN ][transport.netty ] [linux-node01] exception caught on transport layer [[id: 0x9fb06663]], closing connection

java.net.NoRouteToHostException: 没有到主机的路由

at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)

at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:717)

at org.jboss.netty.channel.socket.nio.NioClientBoss.connect(NioClientBoss.java:152)

at org.jboss.netty.channel.socket.nio.NioClientBoss.processSelectedKeys(NioClientBoss.java:105)

at org.jboss.netty.channel.socket.nio.NioClientBoss.process(NioClientBoss.java:79)

at org.jboss.netty.channel.socket.nio.AbstractNioSelector.run(AbstractNioSelector.java:337)

at org.jboss.netty.channel.socket.nio.NioClientBoss.run(NioClientBoss.java:42)

at org.jboss.netty.util.ThreadRenamingRunnable.run(ThreadRenamingRunnable.java:108)

at org.jboss.netty.util.internal.DeadLockProofWorker$1.run(DeadLockProofWorker.java:42)

at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)

at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)

at java.lang.Thread.run(Thread.java:748)

而收集到的日志(从下往上看)：

实际上虽然日志没有漏下，但是将一条日志采集成了多条日志，即logstash是按照"行"进行的采集。那么这个不是我所期望的，因此需要将其改成按"事件"进行采集。

6、ELK-Logstash-Codec-multiline

先插一个小知识点，搜索的语法：

https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-query-string-query.html#query-string-syntax

接下来解决上面说的按"行"收集日志的问题，这里就需要用到multiline插件了。

filter {

multiline {

pattern => "pattern, a regexp" //可以支持正则表达式

negate => boolean

what => "previous" or "next"

}}

先来演示一下用法：

使用正则表达式匹配以"["开头的行，两个以"["开头的行中间的内容，就会被认为是一个"事件"，记录并且输出出来，换行符会以\n记录下来。

# vim odec.conf

input{

stdin{

codec => multiline{

pattern => "^\["

negate => true

what => "previous"

}

filter{

}

output{

stdout{

codec => rubydebug

}

# /usr/share/logstash/bin/logstash -f codec.conf --path.data /data/

ERROR StatusLogger No log4j2 configuration file found. Using default configuration: logging only errors to the console.

Sending Logstash's logs to /var/log/logstash which is now configured via log4j2.properties

The stdin plugin is now waiting for input:

[hjashfasj

dsajcbajs

dashidhasn

[

{

"@timestamp" => 2018-05-26T18:02:46.631Z,

"@version" => "1",

"host" => "3-linux-node01",

"message" => "[hjashfasj\ndsajcbajs\ndashidhasn",

"tags" => [

[0] "multiline"

]

}

接下来修改正式的启动配置文件：

# vim /usr/share/logstash/config/conf.d/file.conf

input{

file{

path => ["/var/log/messages","/var/log/secure"]

type => "system-log"

start_position => "beginning"

}

file{

path => "/var/log/elasticsearch/myes.log"

type => "es-log"

start_position => "beginning"

codec => multiline{ //加上这一段

pattern => "^\["

negate => true

what => "previous"

}

filter{

}

output{

if [type] == "system-log" {

elasticsearch {

hosts => ["172.16.0.3:9200"]

index => "system-log-%{+YYYY.MM}"

}

if [type] == "es-log" {

elasticsearch {

hosts => ["172.16.0.3:9200"]

index => "es-log-%{+YYYY.MM}"

}

之后启动logstash，发现日志已经按"事件"来进行采集了：

接下来是sincedb的一些实验：

file{

path => ["/var/log/messages","/var/log/secure"]

type => "system-log"

start_position => "beginning"

sincedb_path => "/data/.sincedb_mes_sec"

}

可以看到有文件显示出来：

[root@3-linux-node01 data]# ls -a

. .. dead_letter_queue .lock myes plugins queue .sincedb_ela .sincedb_mes_sec uuid

[root@3-linux-node01 data]# cat .sincedb_ela

17180165 0 64768 47540

[root@3-linux-node01 data]# ll -i /var/log/elasticsearch/myes.log

17180165 -rw-r--r-- 1 elasticsearch elasticsearch 48029 5月 27 17:00 /var/log/elasticsearch/myes.log

7、ELK-Logstash-Codec-json

对于某些日志，如果显示成一团会影响阅读，这个时候就要是用到json插件了。比如Nginx。

方法1、nginx日志改成json输出：

对nginx配置文件的日志格式以及读取方式做如下修改：

log_format access_log_json '{"user_ip":"$http_x_real_ip","lan_ip":"$remote_addr","log_time":"$time_iso8601","user_req":"$request","http_code":"$status","body_bytes_sent":"$body_bytes_sent","req_time":"$request_time","user_ua":"$http_user_agent"}';

access_log /var/log/nginx/access_log_json.log access_log_json;

之后写配置文件：

input{

file{

path => "/var/log/nginx/access_log_json.log"

codec => "json"

}

filter{

}

output{

elasticsearch{

hosts => ["172.16.0.3:9200"]

index => "nginx-access-log-%{+YYYY.MM.dd}"

}

stdout{

codec => rubydebug

}

加与不加json的区别在于：

{

"path" => "/var/log/nginx/access_log_json.log",

"@timestamp" => 2018-05-28T07:45:57.070Z,

"@version" => "1",

"host" => "4-linux-node02",

"message" => "{\"user_ip\":\"-\",\"lan_ip\":\"172.16.0.4\",\"log_time\":\"2018-05-28T15:45:56+08:00\",\"user_req\":\"GET / HTTP/1.0\",\"http_code\":\"200\",\"body_bytes_sent\":\"612\",\"req_time\":\"0.000\",\"user_ua\":\"ApacheBench/2.3\"}"

}

和

{

"user_ip" => "-",

"path" => "/var/log/nginx/access_log_json.log",

"@timestamp" => 2018-05-28T07:47:02.448Z,

"http_code" => "200",

"body_bytes_sent" => "612",

"lan_ip" => "172.16.0.4",

"user_req" => "GET / HTTP/1.0",

"@version" => "1",

"host" => "4-linux-node02",

"user_ua" => "ApacheBench/2.3",

"log_time" => "2018-05-28T15:46:44+08:00",

"req_time" => "0.000"

}

可以达成的效果：

可以在左侧选择需要查看的选项，如果不选择默认则是全部显示成一条，这就是json的应用。对于http请求以及响应，可能只是去搜索其中一个字段，比如http_code，这样可以更加简洁明了的显示出来。

方法2、文件直接收取进redis，然后是用Python脚本读取redis，写成json后写入ES。

十三、ELKStack(下)

1、ELK-kibana图形化

kibana可以支持可视化，用不同的图形和模块来实现：

这里使用Markdown，metric和vertical bar还有搜索方案来做一个面板：

选择nginx-access-log作为源，之后可以选择不同的模块进行监控：

之后保存：

之后在面板上添加：

达到最终的效果：

对之前的搜索同样使用，显示的模块为搜索的结果。

2、ELK-LogStash实战-input插件rsyslog

Rsyslog是一个input插件，使用514端口。远端的机器会将日志信息发送至logstash监听的514端口，logstash通过监听514端口来获取对应的日志信息，达到搜集日志的目的。

编辑启动测试脚本：

# vim /etc/logstash/conf.d/syslog.conf

input{

syslog{

type => "system-syslog"

port => "514"

}

filter{

}

output{

stdout{

codec => rubydebug

}

# netstat -lntup

Active Internet connections (only servers)

Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name

tcp6 0 0 :::514 :::* LISTEN 1889/java

udp6 0 0 :::514 :::* 1889/java

修改被采集syslog的主机(172.16.0.3)的rsyslog配置文件：

# vim /etc/rsyslog.conf

# remote host is: name/ip:port, e.g. 192.168.0.1:514, port optional

*.* @@172.16.0.4:514 //改成远端主机的IP地址

小知识点：

# The authpriv file has restricted access.

authpriv.* /var/log/secure

# Log all the mail messages in one place.

mail.* -/var/log/maillog

在路径前面加一个-表示不立即生效。

# systemctl restart rsyslog

重启之后就可以在远端主机(172.16.0.4)上看到有日志更新出来了

接下来修改测试脚本为正式脚本：

# vim syslog.conf

input{

syslog{

type => "system-syslog"

port => "514"

}

filter{

}

output{

elasticsearch{

hosts => ["172.16.0.4:9200"]

index => "system-syslog-%{+YYYY.MM}"

}

跑起来之后虽然kibana的显示无误，但是始终在报错如下：

[2018-05-28T21:33:18,154][INFO ][logstash.inputs.syslog ] Starting syslog udp listener {:address=>"0.0.0.0:514"}

[2018-05-28T21:33:18,156][WARN ][logstash.inputs.syslog ] syslog listener died {:protocol=>:udp, :address=>"0.0.0.0:514", :exception=>#, :backtrace=>["org/jruby/ext/socket/RubyUDPSocket.java:161:in `bind'", "/usr/share/logstash/vendor/bundle/jruby/1.9/gems/logstash-input-syslog-3.2.1/lib/logstash/inputs/syslog.rb:141:in `udp_listener'", "/usr/share/logstash/vendor/bundle/jruby/1.9/gems/logstash-input-syslog-3.2.1/lib/logstash/inputs/syslog.rb:122:in `server'", "/usr/share/logstash/vendor/bundle/jruby/1.9/gems/logstash-input-syslog-3.2.1/lib/logstash/inputs/syslog.rb:102:in `run'"]}

[2018-05-28T21:33:18,165][INFO ][logstash.inputs.syslog ] Starting syslog tcp listener {:address=>"0.0.0.0:514"}

[2018-05-28T21:33:18,167][WARN ][logstash.inputs.syslog ] syslog listener died {:protocol=>:tcp, :address=>"0.0.0.0:514", :exception=>#, :backtrace=>["org/jruby/ext/socket/RubyTCPServer.java:118:in `initialize'", "org/jruby/RubyIO.java:871:in `new'", "/usr/share/logstash/vendor/bundle/jruby/1.9/gems/logstash-input-syslog-3.2.1/lib/logstash/inputs/syslog.rb:159:in `tcp_listener'", "/usr/share/logstash/vendor/bundle/jruby/1.9/gems/logstash-input-syslog-3.2.1/lib/logstash/inputs/syslog.rb:122:in `server'", "/usr/share/logstash/vendor/bundle/jruby/1.9/gems/logstash-input-syslog-3.2.1/lib/logstash/inputs/syslog.rb:106:in `run'"]}

结合启动日志发现tcp和udp都在监听同一个端口，怀疑可能是由于这个原因引起：

[2018-05-28T21:43:39,451][INFO ][logstash.inputs.syslog ] Starting syslog udp listener {:address=>"0.0.0.0:514"}

[2018-05-28T21:43:39,555][INFO ][logstash.inputs.syslog ] Starting syslog tcp listener {:address=>"0.0.0.0:514"}

3、ELK-LogStash实战-input插件tcp

TCP可以用来实现抓取tcp对应端口的日志文件。

# vim tcp.conf

input{

tcp{

type = "tcp"

port => "6666"

mode => "server"

}

filter{

}

output{

stdout{

codec => rubydebug

}

# /usr/share/logstash/bin/logstash -f tcp.conf --path.data /data

执行完成后可以看到java监听的6666端口：

# netstat -lntup

Active Internet connections (only servers)

Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name

tcp6 0 0 :::6666 :::* LISTEN 5676/java

测试一下：

# echo "hehe" | nc 172.16.0.4 6666

收到消息：

{

"@timestamp" => 2018-05-30T10:08:17.088Z,

"port" => 40620,

"@version" => "1",

"host" => "172.16.0.3",

"message" => "hehe",

"type" => "tcp"

}

小技巧：

# nc 172.16.0.4 6666 < test.txt

# echo "hehe1" > /dev/tcp/172.16.0.4/6666

4、ELK-LogStash实战-filter插件grok

对于Apache的日志，不能支持json插件，可以使用filter的grok插件完成。

写配置文件：

# cat grok.conf

input{

stdin {}

}

filter{

grok{

match => { "message" => "%{IP:client} %{WORD:method} %{URIPATHPARAM:request} %{NUMBER:bytes} %{NUMBER:duration}" }

}

output{

stdout {

codec => rubydebug

}

验证效果：

# /usr/share/logstash/bin/logstash -f grok.conf --path.data /data

ERROR StatusLogger No log4j2 configuration file found. Using default configuration: logging only errors to the console.

Sending Logstash's logs to /var/log/logstash which is now configured via log4j2.properties

The stdin plugin is now waiting for input:

55.3.244.1 GET /index.html 15824 0.043

{

"duration" => "0.043",

"request" => "/index.html",

"@timestamp" => 2018-05-30T13:17:37.564Z,

"method" => "GET",

"bytes" => "15824",

"@version" => "1",

"host" => "3-linux-node01",

"client" => "55.3.244.1",

"message" => "55.3.244.1 GET /index.html 15824 0.043"

}

达到这样的效果之后就可以正常的将结果输出到es中去了。但是需要注意的是，grok很吃性能，如果不是很懂ruby的话，那么grok就不灵活。

5、ELK-LogStash实战-采集Apache日志

一般情况下是不会用到grok去采集的，缺点上面说了。对于传参数量巨大(甚至可能是攻击)grok就不行了，有使用logstash将日志抓去redis，然后使用python脚本将日志过滤之后导入es。

但是学了可以实践一下，grok会自带一些参数可以直接调用，具体路径如下：

# pwd

/usr/share/logstash/vendor/bundle/jruby/1.9/gems/logstash-patterns-core-4.1.1/patterns

# ls

aws exim httpd maven nagios ruby

bacula firewalls java mcollective postgresql squid

bind grok-patterns junos mcollective-patterns rails

bro haproxy linux-syslog mongodb redis

这里需要使用到grok-patterns文件，但是在当前版本中似乎没有apache的日志格式，所以可以手动添加：

# Log formats

SYSLOGBASE %{SYSLOGTIMESTAMP:timestamp} (?:%{SYSLOGFACILITY} )?%{SYSLOGHOST:logsource} %{SYSLOGPROG}:

COMMONAPACHELOG %{IPORHOST:clientip} %{HTTPDUSER:ident} %{USER:auth} \[%{HTTPDATE:timestamp}\] "(?:%{WORD:verb} %{NOTSPACE:request}(?: HTTP/%{NUMBER:httpversion})?|%{DATA:rawrequest})" %{NUMBER:response} (?:%{NUMBER:bytes}|-)

COMBINEDAPACHELOG %{COMMONAPACHELOG} %{QS:referrer} %{QS:agent}

书写启动文件：

# vim apache_log.conf

input{

file {

path => "/var/log/httpd/access_log"

start_position => "beginning"

}

filter{

grok{

match => { "message" => "%{COMMONAPACHELOG}" }

}

output{

stdout{

codec => rubydebug

}

可以看到访问结果：

{

"request" => "/",

"auth" => "-",

"ident" => "-",

"verb" => "GET",

"message" => "172.16.0.1 - - [31/May/2018:15:55:14 +0800] \"GET / HTTP/1.1\" 200 13 \"-\" \"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.170 Safari/537.36 OPR/53.0.2907.68\"",

"path" => "/var/log/httpd/access_log",

"@timestamp" => 2018-05-31T07:55:15.030Z,

"response" => "200",

"bytes" => "13",

"clientip" => "172.16.0.1",

"@version" => "1",

"host" => "4-linux-node02",

"httpversion" => "1.1",

"timestamp" => "31/May/2018:15:55:14 +0800"

}

之后就可以使用output将日志写去es中

# vim apache_log.conf

input{

file {

path => "/var/log/httpd/access_log"

start_position => "beginning"

}

filter{

grok{

match => { "message" => "%{COMMONAPACHELOG}" }

}

output{

elasticsearch {

hosts => ["172.16.0.4:9200"]

index => "apache-%{+YYYY.MM.dd}"

}

看看kibana：

正常显示

6、ELK-使用消息队列扩展

线上环境出了使用插件完成日志收集之外，还可以使用消息队列。logstash进行采集至redis，然后通过消息队列处理之后再发给logstash。这里就学习一下怎么通过插件将日志送入redis。

配置文件：

# vim redis.conf

input{

stdin{

}

filter{}

output{

redis{

host => "172.16.0.4"

port => "6379"

db => "6"

data_type => "list"

key => "demo"

}

# vim /etc/redis.conf

...

bind 172.16.0.4

...

daemonize yes

...

# /usr/share/logstash/bin/logstash -f /usr/share/logstash/config/conf.d/redis.conf --path.data /data

ERROR StatusLogger No log4j2 configuration file found. Using default configuration: logging only errors to the console.

Sending Logstash's logs to /var/log/logstash which is now configured via log4j2.properties

The stdin plugin is now waiting for input:

disahdioashd //随便输入4行

dsaihfashfa

dshiacvash

dssjiadh

然后去172.16.0.4上面看redis：

172.16.0.4:6379> info

# Keyspace

db0:keys=1,expires=0,avg_ttl=0

db6:keys=1,expires=0,avg_ttl=0 //有db6产生

172.16.0.4:6379> select 6

172.16.0.4:6379[6]> KEYS *

1) "demo"

172.16.0.4:6379[6]> LLEN demo

(integer) 4

172.16.0.4:6379[6]> LINDEX demo -1

"{\"@timestamp\":\"2018-06-01T03:26:17.080Z\",\"@version\":\"1\",\"host\":\"3-linux-node01\",\"message\":\"dssjiadh\"}"

可以看到demo里面的值和输入的值相同。

然后写实际应用的脚本：

# vim apache.conf

input{

file {

path => "/var/log/httpd/access_log"

start_position => "beginning"

}

filter{

}

output{

redis{

host => "172.16.0.4"

port => "6379"

db => "7"

data_type => "list"

key => "apache-accesslog"

}

接下来再从redis中读出来，写入es中去。结合前几章的内容，apache的日志需要经过grok的处理才可以写入es，所以需要些filter了。

# vim index.conf

input{

redis{

host => "172.16.0.4"

port => "6379"

db => "7"

data_type => "list"

key => "apache-accesslog"

}

filter{

grok{

match => { "message" => "%{COMMONAPACHELOG}" }

}

output{

elasticsearch {

hosts => ["172.16.0.3:9200"]

index => "apache-%{+YYYY.MM.dd}"

}

之后同时运行apache.conf和index.conf，就可以看到redis里面没有了，而出现在es中了。如果redis的日志只增不减，就要注意一下了，表示es读不过来或者根本没有在读了，如果时间变长空间占满的话，可能会导致日志丢失。

细讲：

对于一个搜索引擎来讲，主要有两个模块，分别是索引的建立以及结果的展示。可以使用类似爬虫程序去网上爬所有的网页，并且返回每个网站的信息，以此来获取全球范围内的网站信息。之后通过获取到的网站信息(原始数据)来创建提供搜索的内容(文档)。之后分析所有的文档来创建索引。这一块就是索引的建立。之后搜索引擎提供用户接口UI(搜索页面)来让用户执行搜索操作，这一块便是搜索结果的展示。如果说结果的展示使用的是Elasticsearch的话，索引的建立则是使用Lucene。

Lucene：

文档：Document

包含一个或多个域的容器。文档就是由field:value组成，一个filed:value组合被称为一个域。

域：创建域的时候可以通过给域多个选项，控制lucene将文件添加进域索引之后可以对域进行什么样的操作。包括索引选项、存储选项、域向量使用选项。

索引选项通过倒排索引控制文本是否可被搜索。

Index.ANYLYZED：分析(切词)并单独作为索引项；

Index.Not-ANYLYZED：不分析(不切词)，把整个内容当做一个索引项；

Index.ANYLYZED_NORMS：类似于Index.ANYLYZED，但是不存储token的Norms(加权基准)信息

Index.Not_ANYLYZED_NORMS：类似于Index.Not_ANYLYZED，但是不存储token信息

Index.NO：不做索引

存储选项用于确定是否需要存储域的真实值

store.YES：存储真实值

store.NO：不存储真实值

域向量选项用于在搜索期间该文档所有的唯一项都能完全从文档中检索时使用。

文档和域的加权操作

搜索：

查询Lucene索引时，它返回的是一个有序的scoreDOC对象：查询时，Lucene会为每个文档计算出分值并且排序。

API：

IndexSearcher：搜索索引入口。

Query及其子类：

QueryParser

TopDocs

Lucene的多元化查询：

IndexSearcher中的search方法：

TermQuery：对索引中的特定项进行搜索，Term是索引中的最小索引片段，每个Term包含一个域名和一个文本值。

TermRangeQuery：在索引中的多个特定项中进行搜索，能搜索指定的多个域。

NumericRangeQuery：做数值范围搜索。

PrefixQuery：用于搜索以指定字符串开头的项。

BooleanQuery：实现组合查询，组合逻辑为AND, OR, NOT

PhraseQuery：根据词语的长度以及位置信息

WildcardQuery：通配符

FuzzyQuery：模糊查询

Elasticsearch是一个基于Lucene实现的开源、分布式、Restful的全文本搜索引擎；此外，它还是一个分布式实时文档存档，其中每个文档的每个field都是被索引的数据，且都可被搜索；也是一个带实时分析功能的分布式搜索引擎，能扩展至数以百计的节点实时处理PB级的数据。

基本组件：

索引(index)：文档容器，具有类似属性的文档的合集。类似于表。必须使用小写。

类型(type)：索引是索引内部的逻辑分区，其意义完全取决于用户需求。一个索引可以定义一个或者多个类型。一般来说，类型就是拥有相同的域的文档的预定义。

文档(document)：文档是Lucene索引和搜索的原子单位，它包含了一个或多个域，是域的容器，基于JSON格式表示。每个域的组成部分，是由一个名字，一个或多个值，拥有多个值的域，通常称为多值域。

映射(mapping)：原始内容存储为文档之前，需要事先进行分析，例如切词、过滤掉某些词等，映射用于定义此分析机制该如何实现。此外，ES还为映射提供了诸如将域中的内容排序等功能。

ES的集群组件：

Cluster：ES集群标识为集群名称。一个节点只能属于一个集群。

Node：运行了单个ES实例的主机即为节点。用于存储数据、参与集群索引及搜索操作。节点标识为节点名。

Shard：将索引切割成为的物理存组件，但是每一个shard都是一个独立且完整索引；创建索引时，ES默认将其分割为5个(或者自定义)shard。

shard有两种类型：primary shard和replica shard。每个索引都会创建出5个主shard，每个主shard都有一个(或者自定义个)replica shard。Replica用于数据冗余以及查询时的负载均衡。primary和replica shard的数量都可以自定义，不同点在于primary定义之后无法修改，replica定义之后可以修改。

index.number_of_shards和index.number_of_replicas在5.x版本里面不支持在yml文件中修改了，如果需要修改的话要使用下面的方法：

# curl -XPUT ip:9200/index_name -d '{

"settings":{

"index": {

"number_of_shards": "10",

"number_of_replicas": "1",

"max_result_window": 999999

}

# curl -XPUT http://ip:9200/myindex/_settings -d'{"index.number_of_replicas": 2}'

ES Cluster工作过程：

启动时，通过组播(默认)或者单播方式在9300/tcp查找同意集群中的其他节点，并与之建立通信。会选择出一个主节点负责管理整个集群状态，以及在集群范围内决定各shards分布方式，每个均可接收并响应用户的各类请求。

集群状态有：green、red和yellow。

JDK：

Oracle JDK

OpenJDK

ES默认端口：

参与集群事物：9300/tcp：transport.tcp.port

访问以及接收请求：9200/tcp：http.port

Restful API：

1.检查集群、节点、索引等健康与否，以及获取其相应状态；

2.管理集群、节点、索引及元数据；

3.执行CRUD操作；

4.执行高级操作，例如paging、filtering等

_cat API：

# curl -X GET ' http://172.16.0.3:9200/?preey'

# curl -X GET ' http://172.16.0.3:9200/_cat'

# curl -X GET ' http://172.16.0.3:9200/_cat/nodes'

# curl -X GET ' http://172.16.0.3:9200/_cat/nodes?v' //加?v看详细信息

# curl -X GET ' http://172.16.0.3:9200/_cat/master'

# curl -X GET ' http://172.16.0.3:9200/_cat/master?v'

# curl -X GET ' http://172.16.0.3:9200/_cat/nodes?help' //加help之后可以看到具体的使用方法

_cluster API：

# curl -X GET ' http://172.16.0.3:9200/_cluster/health?pretty' //查看集群信息

# curl -X GET ' http://172.16.0.3:9200/_cluster/state/version?pretty'

# curl -X GET ' http://172.16.0.3:9200/_cluster/state/master_node?pretty'

# curl -X GET ' http://172.16.0.3:9200/_cluster/stats?pretty'

Plugins：

插件扩展ES的功能：

添加自定义的映射类型、自定义分析器、本地脚本、自定义发现方式

安装：

直接将插件放置于plugins目录下即可

使用plugin脚本

# /usr/share/elasticsearch/bin/plugin -h(install/remove/list)

# /usr/share/elasticsearch/bin/plugin list

Installed plugins in /usr/share/elasticsearch/plugins:

- marvel-agent

- license

- head

- kopf

- bigdesk

站点插件：

可以通过_plugin API直接访问的， http://host:9200/_plugin/plugin_name

CRUD操作相关的API：

CRUD主要用在文档的增删改查。

创建文档：

# curl -XPUT '172.16.0.3:9200/students/class1/1?pretty' -d '

{

"first_name":"Jing",

"last_name":"Guo",

"gender":"Male",

"age":25,

"courses":"Xianglong Shiba Zhang"

如果数据出现重复，PUT操作会直接覆盖掉原有的数据，所以创建的时候要小心。

获取文档：

# curl -XGET '172.16.0.3:9200/students/class1/1?pretty'

{

"_index" : "students",

"_type" : "class1",

"_id" : "1",

"_version" : 3,

"found" : true,

"_source" : {

"first_name" : "Jing",

"last_name" : "Guo",

"gender" : "Male",

"age" : 25,

"courses" : "Xianglong Shiba Zhang"

}

更新文档：

# curl -XPOST '172.16.0.3:9200/students/class1/2/_update?pretty' -d '

{

"doc":{ "age":22 }

删除文档：

# curl -XDELETE '172.16.0.3:9200/students/class1/2'

删除索引：

# curl -XGET '172.16.0.3:9200/_cat/indices?v' //查看索引

# curl -XDELETE '172.16.0.3:9200/students' //删除索引

查询数据：

Query API：

Query DSL(Domain Search Language)：JSON based language for building complex queries.用户实现诸多类型的查询类型，比如，simple term query, phrase, range boolean, fuzzy等；

ES的查询操作执行分为两个阶段：

分散阶段：将查询请求分散到各个节点上面去。

合并阶段：将查询结果汇总到主节点上面去。

查询方式：

向ES发起查询请求的方式有两种：

1、通过Restful request API查询，也成为query string；

2、通过发送REST request body进行；

# curl -XGET '172.16.0.3:9200/students/_search?pretty'

{

"took" : 144, //执行时间，单位ms

"timed_out" : false, //是否超时

"_shards" : {

"total" : 5, //有几个分片

"successful" : 5, //涉及多少分片

"failed" : 0

"hits" : { //命中文档

"total" : 1, //命中了几个

"max_score" : 1.0,

"hits" : [ { //命中的具体内容，使用数组表示

"_index" : "students",

"_type" : "class1",

"_id" : "1",

"_score" : 1.0,

"_source" : {

"first_name" : "Jing",

"last_name" : "Guo",

"gender" : "Male",

"age" : 25,

"courses" : "Xianglong Shiba Zhang"

}

} ]

}

# curl -XGET '172.16.0.3:9200/students/_search?pretty' -d '

> {

> "query":{ "match_all": {} }

> }'

多索引、多类型查询：

/_search：所有索引

/INDEX_NAME/_search：单索引

/INDEX1,INDEX2/_search：多索引

/s*,t*/_search：通配符索引

/students/class1/_search：单类型搜索

/students/class1,class2/_search：多类型搜索

Mapping和Analysis：

ES：对每一个文档，会取的其所有域的所有值，生成一个名为all的域。如果query_search未指定查询的域，则在_all域上执行查询操作。

Mapping：在各个特定域中的数据类型可能会不一致，mapping可以看到一个文档中的数据类型是如何被定义的。

# curl '172.16.0.3:9200/students/_mapping/class1?pretty'

ES中搜索的数据广义上可被理解为两位：Type:exact(指明类型)，full-text(全文搜索)

精确值：未经过加工的原始值，在搜索时进行精确匹配

full-text：用于引用文本中数据，判断文档在多大程度上匹配查询请求，而非做精确匹配。即文档与用户请求查询的相关度。为了完成full-text搜索，ES必须首先分析文本，并创建出倒排索引，倒排索引中的数据还需要"正规化"为标准格式。

分析需要由分析器进行：analyzer。由字符过滤器、分词器、分词过滤器组件构成。内置分析器有standard analyzer、simple analyzer、whitespace analyzer、language analyzer

Query DSL：

request body：

query dsl：执行full-text查询时，基于相关度来评判其匹配结果。此方法执行结果复杂。

match_all Query：用于匹配所有文档，没有指定任何query

{"match_all":{}}

match Query：在几乎任何域上执行full-text或者exact-value查询。如果执行full-text查询，首先对查询语句做分析，如果执行exact-value查询，将搜索精确值。

multi_match Query：用于在多个域上执行相同的查询

{"multi_match":

"query":full-text search

"filed":{'filed1','filed2'}

}

bool query：基于boolean逻辑合并多个查询语句；与bool filter不同的是查询子句不是返回"yes"或"no"，而是其计算出的匹配分值，因此boolean Query会为各子句合并其score

filter dsl：执行exact查询时，基于其结果为"yes"或者"no"来评判。此方法速度快且结果缓存。

查询语句结构：

{

QUERY_NAME:{

AGGUMENT: VALUE,

AGGUMENT: VALUE,...

}

{

QUERY_NAME: {

FILED_NAME: {

ARGUMENT: VALUE,...

}

term filter：精确匹配包含指定term的文档

{"term": {"key":"value"}}

# curl -XGET '172.16.0.3:9200/students/_search' -d '

> {

> "query":{

> "term":{"name":"Guo"}

> }

> }'

关于这个实例遇到了一个小问题，当匹配"name":"Guo"的时候，无法匹配，但是"name":"guo"就可以匹配了。这里的原因在于分析器不同。虽然PUT进去的数据是Guo没错，但是默认分析器是analyzed，数据已经被处理(大写被改成小写)，所以存储的数据实际上是guo。对于string类型的filed index 默认值是： analyzed.如果我们想对进行精确查找, 那么我们需要将它设置为：not_analyzed。

terms filter：用于多值精确匹配

{"terms":{"key":["value1","value2"]}}

range filter：用于在指定的范围内查找数值或时间，只能查数值或时间

{"range":"age"{"gte":15,"lte":25}}

gt,lt,gte,lte和shell脚本一样

exists and missing filter：判断值是否存在

{"exists":{"age":25}}

boolean filter：基于boolean的逻辑来合并多个filter子句。

must：内部子句条件必须同时匹配

must:{"term":{"age":25}"term":{"name":"Guo"}}

must_not：其所有子句必须不匹配

must_not:{"term":{"age":25}"term":{"name":"Guo"}}

should：至少有一个子句匹配

should:{"term":{"age":25}"term":{"name":"Guo"}}

合并filter和query：filter是过滤，query是查询，常常会将filter用于query中进行过滤，而不会讲query用于filter进行查询。

查询语句语法检查：

GET /INDEX/_validate/query?explain&pretty

{

...

}

LOGSTASH：

logstash是个整合的框架，虽然自己也有索引构建功能，但是现在不用了。由于logstash占用的资源很多，因此大多数情况下会自己开发收集日志的程序，然后传给kafka，kafka是一种分布式的消息队列，可以替代logstash完成日志收集。

支持多种数据获取机制，通过TCP/UDP协议、文件、syslog、windows eventlogs以及STDIN等；获取到数据后还可以支持对数据进行过滤、修改等操作。使用JRuby语言，所以必须运行在JVM环境。为agent/server架构。

如果agent的数量过多，那么可以在agent与server中间搭建一个broker，可能会使用消息队列(rabbitmq、activemq、qpid、zeromq、kafka、redis等)，来接驳agent和server。关于几种消息队列的选择，可以参考文章： https://blog.csdn.net/vtopqx/article/details/76382934

配置框架：

input{...}

filter{...} //如果无需对数据进行额外处理，则可以省略filter

output{...}

四种类型的插件：

input，filter，codec，output

数据类型：

array: [item1, item2, ...]

boolean: true, false

bytes:

codec: 编码器

hash: key => value

number:

password:

path: 文件系统路径

string: 字符串

条件判断：

==, !=, <, <=, >, >=, =~, !~, in, not in, and, or

()：多个条件判断

logstash的插件：

input插件：

file：从指定的文件中读取事件流。使用FileWatch监听文件的变化，然后将文件的变化保存在一个的.sincedb的隐藏文件中。有了.sincedb文件之后，如果读取文件的过程中将logstash关了，再打开之后也不会重新去读取文件的，节省时间与资源，也不会漏掉，还支持文件的滚动读取。默认这个文件是存放在启动logstash进程的用户的家目录里面的。在日志读取的过程中，尽量不要指定文件是beginning(start_position => "beginning")，这样的话不会从断点开始读取的。

udp：通过udp协议通过网络连接来读取message，其唯一必备参数为port，指定自己监听的端口，用来接收其他主机发来的数据，host则用来指明自己监听的地址。

collectd：性能监控程序；

安装完成之后可以修改配置文件来使collectd收集特定日志，并且将收集到的日志文件发送给特定的端口(/etc/collectd.conf)：

#LoadPlugin memcached

LoadPlugin memory

##LoadPlugin mic

LoadPlugin network

接下来配置启动脚本：

input {

udp{

port => 25125

codec => collectd {}

type => "collectd"

}

output {

stdout {

codec => rubydebug

}

然后可以看到kibana上有收集到collectd信息。

redis：从redis读取数据，支持redis channel和lists两种方式；

filter插件：主要用于将event执行output之前对其实现处理功能。

grok：用于分析并结构化文本数据；目前是logstash中将非格式化日志数据转化为结构化的可查询数据的不二之选。

预定义grok的模式：模式定义默认位置：/usr/share/logstash/vendor/bundle/jruby/1.9/gems/logstash-patterns-core-4.1.1/patterns/grok-patterns，可以使用patterns_dir => [ "XXX" ]来指定定义模式的文件的位置。

模式的语法格式：%{SYNTAX:SEMANTIC}；其中SYNTAX是预定义模式名称；SEMANTIC是匹配到的文本的自定义标识符。对于想要定义的模式，都是要已经定义了的，也是在这个文件里面，如果没有定义的话，就需要自己用全大写来自己进行定义。

先来看一个示例：

172.16.0.1 - - [13/Jun/2018:16:24:15 +0800] "GET /favicon.ico HTTP/1.1" 404 209 " http://172.16.0.4/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.170 Safari/537.36 OPR/53.0.2907.68"

所对应的关系就有了：%{IPORHOST:clientip}|172.16.0.1；%{HTTPDUSER:ident}|-；%{USER:auth}|-；\[%{HTTPDATE:timestamp}\]|[13/Jun/2018:16:24:15 +0800]；%{WORD:verb}|GET；%{NOTSPACE:request}|/favicon.ico；HTTP/%{NUMBER:httpversion}|HTTP/1.1；%{DATA:rawrequest}|无；%{NUMBER:response}|404； %{NUMBER:bytes}|209。?:这些的作用，参考另外一个笔记《知识文档-正则表达式之 pattern+?、pattern*?、(?!pattern)、(?:pattern)》

下面来使用预定义模式写一个格式：

1.1.1.1 GET /index.html 30 0.23

%{IP:clientip} %{WORD:method} %{WORD:verb} %{URIPATHPARAM:request} %{NUMBER:bytes} %{NUMBER:duration}

模式的定义位置并没有硬性要求，可以写在patterns文件中，也可以写在配置文件中。写在patterns文件中，取个名字，之后在配置文件中调用即可。比如下面这个：

grok {

patterns_dir => [ "/etc/logstash/network_device_log_patterns" ]

match => [

#IOSXE

"message", "%{SYSLOG5424PRI}(<%{NUMBER:seqnum1}>)?(%{NUMBER:seqnum2}:)? (\*|\.)?%{IOSXETIMESTAMP:log_date} (%{TZ:timezone})?: \%%{WORD:facility}-%{INT:severity_level}-%{NETWORKDEVICE_REASON:log_brief}: %{GREEDYDATA:message}"

]

overwrite => [ "message" ]

remove_field => [ "@version", "syslog5424_pri" ]

}

grok插件中的参数具体说明可以参照官网的介绍， https://www.elastic.co/guide/en/logstash/5.4/plugins-filters-grok.html，了解其作用。

自定义grok的模式：grok的模式是基于正则表达式编写，其元字符与其他用到正则表达式的工具awk/sed/grep/pcre差别不大。也可以直接套用其他的pattern来实现自己的功能。

USERNAME [a-zA-Z0-9._-]+

USER %{USERNAME}

output插件：

stdout {}

elasticsearch {}

常用参数：action,hosts,index,cluster,port,protocol,workers(实现output的线程数)

redis {}

常用参数：host(在哪),port(哪个端口),timeout,workers(线程数量),db(放在哪),data_type,batch(一条RPUSH推送多个值)

消息队列使用发布订阅机制，里面有引入频道的概念。对于将数据发布进消息队列的服务器，我们称之为消息的生产者producer，对于接收消息队列推送的消息的服务器，我们称之为消息的消费者customer，连接producer频道和customer频道，并且进行消息的分配的角色，我们称之为exchanger，exchanger不是单独的服务器，而是消息队列内部的角色。customer可以订阅自己感兴趣的频道，当producer将消息发布进消息队列的各个频道中，消息队列再将各频道的消息推送至订阅该频道的customer手中，这就是发布订阅机制，也是消息队列的最基本概念。再来看消息队列的内部，customer和producer的频道不同，一个producer可能会产生出多个频道的消息，而频道本身是不做分类的，那么在消息队列内部就会有一个exchanger来进行消息的路由(分配)。exchanger将producer的队列中的消息分配至不同的customer频道中去，以便customer频道将消息推送给customer。

转载于:https://www.cnblogs.com/teezzy/p/9121579.html

你可能感兴趣的:(ELK学习笔记)

【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
《转介绍方法论》学习笔记小可乐的妈妈
一、高效转介绍的流程：价值观---执行----方案一）转介绍发生的背景：1、对象：谁向谁转介绍？全员营销，人人参与。①员工的激励政策、客户的转介绍诱因制作客户画像：a信任；支付能力；意愿度；便利度（根据家长具备四个特征的个数分为四类）B性格分类C职业分类D年龄性别②执行：套路，策略，方法，流程2、诱因：为什么要转介绍？认同信任；多方共赢；传递美好；零风险承诺打动人心，超越期待。选择做教育，就是选择
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
【从问题中去学习k8s】k8s中的常见面试题（夯实理论基础）（二十八）向往风的男子 k8s 学习 kubernetes 容器
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》从问题中去学习k8s《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
碎片化学习笔记分享剑客写作
现在生活节奏很快，学习力成为了我们拥有的最大财富。碎片化学习是最好的。首先，不要太过自信，学会虚心学习，是我们面对现实的好方法，才能够常保新鲜。平时我们要拥有什么工具呢？1.思维导图2.写在印象笔记里3.听书，消燥耳机4.教学输出5.录音笔里面最好的方式就是教学输出法，记忆里最好。当输出时我们集中精力记忆里最好。有人认为缩短睡眠时间来学习，其实最好的方式是保持最好的睡眠，记忆力会更好。剥夺睡眠，会
《随园诗话》学习笔记三百零六飞鸿雪舞
卷五凡诗之传者，都在灵性五、五斗米与诗【原文】丁丑，余觅一抄书人，或荐黄生，名之纪，号星岩者，人甚朴野。偶过其案头，得句云；“破庵僧卖临街瓦，独井人争向晚泉。”余大奇之，即饷米五斗。自此欣然大用力于诗。五言句云：“云开日脚直，雨落水纹圆。竹锐穿泥壁，蝇酣落酒尊。钓久知鱼性，樵多识树名。笔残芦并用，墨尽指同磨。＂七言云：＂小窗近水寒偏觉，古木遮天曙不知。旧生萍处泥犹绿，新落花时水亦香。旧甓恐闲都贮水
D15 论语学习笔记许小兔Angelina
悟：上级对下级的宽容：凡事成定局，就不你说了；已接近完结的事，也没必要匡正和挽回了；既然是过去的事，也没必要追究得失和责任了。对待孩子教育也是，不用“问责制”，这样容易让孩子因为害怕担责而说谎。应当循循善诱，避免再犯错才是最重要的。3.16：【原文】子曰：“射不主皮，为力不同科，古之道也。”【译文】孔子说：“射箭比赛不以射透为主，而主要看是否射得准确，因为人的力量不同，自古如此。”3.17：【原文
网络工程师学习笔记（一）专业白嫖怪网络工程师学习笔记学习笔记网络
为了备战下半年的软考——网络工程师，利用每天的下班的闲暇时间看书听课，然后自己手敲整理的系列资料。希望能够对你们有所帮助第一章__计算机网络概述计算机网络的定义：将分散的具有独立运算功能的计算机系统，通过通信线路和通信设备进行连接起来的实现资源的共享。ARPAnet网络的特征：资源共享、分散控制、分组交换1946年第一台通用计算机—埃尼亚克能够相互连通进行数据交换。1960年提出巨型网络，出现了对
K8S学习笔记02——K8S组件沉淅尘 #Docker #K8S kubernetes
Kubernetes组件一、控制平面组件（ControlPlaneComponents）(1)kube-apiserver(2)etcd(3)kube-scheduler(4)kube-controller-manager(5)cloud-controller-manager二、Node组件1.kubelet2.kube-proxy3.容器运行时（ContainerRuntime）三、插件（Add
「Python」2020.04.08学习笔记 | 第六章文件（a+）模式+把随机手机号写入文件小练习 Yetta的书影屋
学习测试开发的Day97，真棒！学习时间为40M第九次全天课(下午视频二20M-50M）>>>fp.seek(0)0>>>fp.read()'你好11你好12你好13你好14你好15\n你好16\n你好17\n你好18\n'>>>fp.seek(0,0)0>>>fp.write("*********************************\n")34>>>fp.seek(0,0)0>>>f
《金文成〈中庸〉学习笔记401。2020-2-24》金吾生
《金文成〈中庸〉学习笔记401。2020-2-24》今天是庚子年戊寅月丁酉日，二月初二，2020年2月24日星期一。二月二龙抬头。第二十二章【唯天下至诚，为能尽其性；能尽其性，则能尽人之性；能尽人之性，则能尽物之性；能尽物之性，则能赞天地之化育；能赞天地之化育，则可以与天地参矣。】上一节，船山讲解说，性作为天用之本体，于圣人和匹夫匹妇而言并无二致，区别来自于诚。诚的区别来自于纯粹与掺杂。掺杂什么呢
CDGA学习笔记三-《数据安全》 zy_chris 网络安全
七、数据安全7.1引言数据安全包括安全策略和过程的规划、建立与执行，为数据和信息资产提供正确的身份验证、授权、访问和审计。要求来自以下方面：（1）利益相关方（2）政府法规（3）特定业务关注点（4）合法访问需求（5）合同义务7.1.1业务驱动因素1、降低风险信息安全首先对组织数据进行分级分类，对组织数据进行分类分级的整个流程：1）识别敏感数据资产并分类分级2）在企业中查找敏感数据3）确定保护每项资产
vue学习笔记——关于对Vue3 ref(), toRef(), toRefs(), unref(), isRef(), reactive()方法的理解。 chen_sir_sh vue学习笔记 javascript 前端 vue
VUE3出现了很多新的API，下面是自己的一些理解进行的总结。欢迎大家一起交流补充。ref()使用ref创建一个数据类型，ref有value这个属性constname1={age:"14",name:"bob1"};constname2=ref({name:"bob2"});//使用ref创建一个数据类型相对于reactive，ref有value属性name2.value="bob3"consol
遇到僵尸进程，怎么处理---学习笔记 summer@彤妈性能优化 linux
僵尸进程解释当iowait升高时，进程很可能因为得不到硬件的响应，而长时间处于不可中断状态。从ps或者top命令的输出中，你可以发现它们都处于D状态，也就是不可中断状态（UninterruptibleSleep）。既然说到了进程的状态，进程有哪些状态你还记得吗？我们先来回顾一下。top和ps是最常用的查看进程状态的工具，我们就从top的输出开始。下面是一个top命令输出的示例，S列（也就是Stat
C++学习笔记----6、内存管理（五）---- 智能指针（3）王俊山IT c++学习笔记开发语言
2、shared_ptr有时候吧，有些对象或者一部分代码需要同一个指针的拷贝。那么unique_ptr不能被拷贝，因此就不能用于些场景。这样的话，std::shared_ptr就是一个支持能够被拷贝的拥有共享属主的智能指针。但是，如果有指向同一个资源的多个shared_ptr实例，那么怎么知道什么时候去释放资源呢？这可以通过对于引用记数来解决，这个我们以后再聊。首先，让我们看一下怎么构造与使用sh
【学习笔记】武志红心理学—潜意识决定命运万万千千
冰山一角什么构成了我们的命运？命运是由我们的显意识和潜意识来决定的。我们可以用一张图做一个比喻。看过“冰山一角”图片的都知道，潜意识就是水面以下的部分，显意识是水面以上的部分，从体积来看，潜意识占了大部分，而显意识只是冰山一角，纵向来看，庞大的潜意识支撑着冰山一角的显意识，才得以让冰山漂浮在水面。延伸到我们的人生，我们对自己显意识层面的想法很容易感知到，所以我们会说这是“我”自己做的选择。而潜意识
Prism 教程 yang_B621 Prism IOC
http://t.csdnimg.cn/VXSSvhttps://blog.csdn.net/u010476739/article/details/119341731Prism-随笔分类-Hello——寻梦者！-博客园(cnblogs.com)C#IoC学习笔记-缥缈的尘埃-博客园(cnblogs.com)WPF_SchuylerEX的博客-CSDN博客
绘本讲师训练营【第30期】2/21阅读原创《绘本之力》学习笔记2 郑贤钰
30028郑贤钰今天读了绘本之力《留在灵魂里的东西》读了心里有非常大的感触！两个年幼什么都不懂的孩子，为了自己心爱的东西，攒下来自己的零花钱，却买了一个自己不知道怎么用的东西，当他们觉得这个东西根本就不好，准备扔掉的时候，这是故事中的有趣有爱的老爷爷出现了，帮助孩子们再一次发现之前别人拉出优美的音乐，原来自己买的这一个琴，自认为没用的琴也能够经过老爷爷熟练的演奏也能拉出这样优美的声音，这让孩子们十
仿老师悟耕海者
毕业十年了，今天去拜访老师，看到老师的学习笔记，看到老师努力学习，积极提高的状态，我觉着自己真是有些懈怠了，孩子们，老师的老师都在孜孜不倦，我们岂能偷懒！
C++学习笔记----7、使用类与对象获得高性能（一）---- 书写类（2）王俊山IT c++学习笔记开发语言
2.2、定义成员函数前面对SpreadsheetCell类的定义足以让你生成类的对象。然而，如果想调用setValue()或者getValue()成员函数，连接器就会抱怨这些函数没有定义。这是因为到目前为止，这些成员函数只有原型，而还没有实现。通常，类的定义会在模块接口文件。对于成员函数的定义，你有一个选择：可以在模块定义文件或者在模块实现文件。下面是SpreadsheetCell类，在类内对成员
Spring6学习笔记4：事务 ·云扬· SSM Java #Spring 学习笔记 spring
1JdbcTemplate1.1简介Spring框架对JDBC进行封装，使用JdbcTemplate方便实现对数据库操作准备工作①搭建子模块搭建子模块：spring-jdbc-tx②加入依赖org.springframeworkspring-jdbc6.0.2mysqlmysql-connector-java8.0.30com.alibabadruid1.2.15③创建jdbc.propertie
连通无向图一般中心的算法及其matlab程序详解夏天天天天天天天# 图论算法 matlab 图论
#################本文为学习《图论算法及其MATLAB实现》的学习笔记#################若服务点只允许取在各顶点上,而服务对象却取在各顶点及各边(或弧)上的点,则在所有顶点中选定一个顶点作为图的一般中心其条件是该点离它本身的最远服务对象(包括顶点及各边(或弧)上的点)的距离达到极小值。寻找无向图的一般中心对解决网络最佳服务点确定的问题是十分有效的，使得服务对象的范围
K8S - Volume - NFS 卷的简介和使用 nvd11 K8S kubernetes 容器云原生
在之前的文章里已经介绍了K8S中两个简单卷类型hostpath和emptydirk8s-Volume简介和HostPath的使用K8S-Emptydir-取代ELK使用fluentd构建loggingsaidcar但是这两种卷都有同1个限制，就是依赖于k8snodes的空间如果某个servicepod中需要的volumn空间很大，这时我们就需要考虑网络磁盘方案，其中NAS类型的Volume是常用且
fluentd 简介，日志收集并导入BigQuery nvd11 Cloud spring Etl spring boot
日志收集的工具有很多种例如Splunk，很多大公司都在使用，但是个人使用的话并不合适，主要是需要license的…钱是1个大问题另1个常见开源的解决方案是ELK,但是搭建和学习成本高，如果只是为了日志收集并不值。对于k8s方案，还有1个开源选择，就是fluentd，本文的主题。Fluentd的简介Fluentd是一个开源的数据收集器，旨在实现日志数据的统一收集、处理和转发。它支持多种数据源和数据格
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found