目录
引言:
一、ELK概述
1.1 组件说明
1.1.1 ElasticSearch
1.1.2 Kiabana
1.1.3 Logstash
1.1.4 Filebeat
1.1.5 缓存/消息队列(redis、kafka、RabbitMQ等)
1.1.6 Fluentd
1.2 思考:为什么要用ELK
1.3 完整日志系统的基本特征
1.4 ELK工作原理
二、Elasticsearch的介绍
三、Logstash
3.1 Logstash简介
3.2 Logstash主机分类
四、Kibana
五、部署ELK日志分析系统
5.1 服务器配置
5.2 关闭防火墙
5.3 ElasticSearch集群部署(需要部署两个节点,这里以node1为例说明)
5.3.1 环境准备
5.3.2 部署 ElasticSearch 软件
5.4 安装 Elasticsearch-head 插件(node1为例)
5.4.1编译安装 node
5.4.2 安装 phantomjs
5.4.3 安装 Elasticsearch-head 数据可视化工具
5.4.4 修改 Elasticsearch 主配置文件
5.4.5 启动 elasticsearch-head 服务
5.4.6 通过 Elasticsearch-head 查看 ES 信息
5.4.7插入索引
5.4.8 浏览器查看索引信息
5.5 ELK-Logstash 部署(在 Apache 节点上操作)
5.5.1 更改主机名
5.5.2 安装 Apache 服务(httpd)
5.5.3 安装 Java 环境
5.5.4 安装 logstash
5.5.5 测试 Logstash
5.5.6定义 logstash 配置文件
5.5.7访问测试
5.6 ELK-Kibana 部署(在 node1 节点上操作)
5.6.1 安装 Kibana
5.6.2 设置 Kibana 的主配置文件
5.6.3 启动 Kibana 服务
5.6.4 验证 Kibana
5.6.5 将 Apache 服务器的日志(访问的、错误的)添加到 ES 并通过 Kibana 显示
5.6.6 浏览器访问
六、ELFK(Filebeat + ELK)
6.1 Filebeat 的作用
6.2 ELFK 工作流程
6.3 ELFK 的部署
6.3.1服务器配置
6.3.2 服务器环境
6.3.3 安装 filebeat
6.3.4 修改 filebeat 主配置文件
6.3.5 在 logstash 组件所在节点(apache节点)上新建一个 logstash 配置文件
6.3.6 浏览器验证
七、总结
ELK 平台是一套完整的日志集中处理解决方案,将 ElasticSearch、Logstash 和 Kibana 三个开源工具配合使用,完成更强大的用户对日志的查询、排序、统计需求。
filebeat 结合 logstash 带来好处
日志的集中化管理 beats 包括四种工具
可以对高并发日志数据进行流量削峰和缓冲,这样的缓冲可以一定程度的保护数据不丢失,还可以对整个架构进行应用解耦。
Fluentd是一个流行的开源数据收集器。由于 logstash 太重量级的缺点,Logstash 性能低、资源消耗比较多等问题,随后就有 Fluentd 的出现。相比较 logstash,Fluentd 更易用、资源消耗更少、性能更高,在数据处理上更高效可靠,受到企业欢迎,成为 logstash 的一种替代方案,常应用于 EFK 架构当中。在 Kubernetes 集群中也常使用 EFK 作为日志数据收集的方案。
在 Kubernetes 集群中一般是通过 DaemonSet 来运行 Fluentd,以便它在每个 Kubernetes 工作节点上都可以运行一个 Pod。 它通过获取容器日志文件、过滤和转换日志数据,然后将数据传递到 Elasticsearch 集群,在该集群中对其进行索引和存储。
日志主要包括系统日志、应用程序日志和安全日志。系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷,性能安全性,从而及时采取措施纠正错误。
往往单台机器的日志我们使用grep、awk等工具就能基本实现简单分析,但是当日志被分散的储存不同的设备上。如果你管理数十上百台服务器,你还在使用依次登录每台机器的传统方法查阅日志。这样是不是感觉很繁琐和效率低下。当务之急我们使用集中化的日志管理,例如:开源的syslog,将所有服务器上的日志收集汇总。集中化管理日志后,日志的统计和检索又成为一件比较麻烦的事情,一般我们使用 grep、awk和wc等Linux命令能实现检索和统计,但是对于要求更高的查询、排序和统计等要求和庞大的机器数量依然使用这样的方法难免有点力不从心。
一般大型系统是一个分布式部署的架构,不同的服务模块部署在不同的服务器上,问题出现时,大部分情况需要根据问题暴露的关键信息,定位到具体的服务器和服务模块,构建一套集中式日志系统,可以提高定位问题的效率。
总结:logstash作为日志搜集器,从数据源采集数据,并对数据进行过滤,格式化处理,然后交由Elasticsearch存储,kibana对日志进行可视化处理。
提供了一个分布式多用户能力的全文搜索引擎
Elasticsearch的核心:
1、接近实时(NRT)
Elasticsearch是一个接近实时的搜索平台,这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒)
2、集群(cluster)
3、节点(node)
4、索引(index)
5、类型(type)
6、文档(document)
7、分片和副本(shards & replicas)也是es作为搜索引擎比较快的原因
实际情况下,索引存储的数据可能超过单个节点的硬件限制。为了解决这个问题,Elasticsearch提供将索引分成多个分片的功能。当在创建索引时,可以定义想要的分片数量。每一个分片就是一个全功能的独立的索引,可以位于集群中任何节点上。
分片的主要原因:
分片副本的原因:
总之,每个索引可以被分成多个分片。一个索引可以被复制0次或者多次。一旦复制了,每个索引就有了主分片 (作为复制源的原来的分片)和复制分片(主分片的拷贝)之别。分片和副本的数量可以在索引创建的时候指定。在索引创建之后,你可以在指定任何时候动态的改变副本的数量,但是你事后不能改变分片的数量。
默认情况下,Elasticsearch中的每个索引被分片5个主分片和1个副本,这意味着,如果你的集群中至少有两个节点,你的索引将会有5个主分片和另外的5个副本分片(一个完全拷贝),这样的话每个索引总共有10个分片。
8、相关概念在关系型数据库和ElasticSearch中的对应关系
关系型数据库 | Elasticserch |
数据库database | 索引index,支持全文索引 |
表table | 类型type |
数据行row | 文档document。但不需要固定结构,不同文档可以具有不同字段集合 |
数据列cloumn | 字段field |
模式schema | 映像mapping |
Logstash由JRuby语言编写,基于消息(message-based)的简单架构,并运行在java虚拟机(JVM)上。不同于分离的代理端(agent)或主机端(server),Logstash可配置单一的代理端与其他开源软件结合,以实现不同的功能。
常用插件:
主要组件:
Kibana 是用于在 Elasticsearch 中可视化数据的强大工具,可通过基于浏览器的界面轻松搜索,可视化和探索大量数据。
Kibana主要功能:
Elasticsearch无缝之集成:
Kibana架构为Elasticsearch定制,可以将任何结构化和非结构化数据加入Elasticsearch索引。Kibana还充分利用了Elasticsearch强大的搜索和分析功能。
整合数据:
Kibana能够更好地处理海量数据,并据此创建柱形图、折线图、散点图、直方图、饼图和地图。
复杂数据分析。
Kibana提升了Elasticsearch分析能力,能够更加智能地分析数据,执行数学转换并且根据要求对数据切割分块。
让更多团队成员收益:
强大的数据库可视化接口让各业务岗位都能够从数据集合受益。
接口灵活,分享更容易:
使用Kibana可以更加方便地创建、保存、分享数据,并将可视化数据快速交流。
配置简单:
Kibana的配置和启用非常简单,用户体验非常友好。Kibana自带Web服务器,可以快速启动运行。
可视化多数据源:
Kibana可以非常方便地把来自Logstash、ES-Hadoop、Beats或第三方技术的数据整合到Elasticsearch,支持的第三方技术包括Apache flume、 Fluentd 等。
简单数据导出:
Kibana可以方便地导出感兴趣的数据,与其它数据集合并融合后快速建模分析,发现新结果。
服务器 | 配置 | 主机名 | ip地址 | 主要软件 |
node1 节点 | 2C/4G | node1 | 192.168.223.9 | ElasticSearch、Kibana |
node2 节点 | 2C/4G | node2 | 192.168.223.10 | ElasticSearch |
apache 节点 | / | apache | 192.168.223.11 | Logstash、Apache |
systemctl stop firewalld && systemctl disable firewalld
setenforce 0
ntpdate ntp.aliyun.com
[root@localhost ~]# hostnamectl set-hostname node1
[root@localhost ~]# bash
[root@node1 ~]# echo "192.168.223.9 node1" >> /etc/hosts
[root@node1 ~]# echo "192.168.223.10 node2" >> /etc/hosts
[root@node1 ~]# java -version #不建议使用 openjdk
# rpm 安装 jdk (方法一)
cd /opt
#将软件包传至该目录下
rpm -ivh jdk-8u201-linux-x64.rpm
vim /etc/profile.d/java.sh
export JAVA_HOME=/usr/java/jdk1.8.0_201-amd64
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar
export PATH=$JAVA_HOME/bin:$PATH
#注释:
1.输出定义java的工作目录
2.输出指定java所需的类文件
3.输出重新定义环境变量,$PATH一定要放在$JAVA_HOME的后面,让系统先读取到工作目录中的版本信息
source /etc/profile.d/java.sh
java -version
# rpm 安装 jdk (方法二)
cd /opt
tar zxvf jdk-8u91-linux-x64.tar.gz -C /usr/local
mv /usr/local/jdk1.8.0_91/ /usr/local/jdk
vim /etc/profile
export JAVA_HOME=/usr/local/jdk
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
source /etc/profile
java -version
1、安装 elasticsearch-rpm 包
[root@node1 ~]# cd /opt
[root@node1 opt]# rz -E
#上传elasticsearch-5.5.0.rpm到/opt目录下
rz waiting to receive.
[root@node1 opt]# rpm -ivh elasticsearch-5.5.0.rpm
2、加载系统服务
systemctl daemon-reload && systemctl enable elasticsearch.service
3、修改 elasticsearch 主配置文件
[root@node1 opt]# cp /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/elasticsearch.yml.bak
#备份配置文件
[root@node1 opt]# vim /etc/elasticsearch/elasticsearch.yml
##17行,取消注释,指定群集名称
cluster.name: my-elk-cluster
##23行,取消注释,指定节点名称(node1节点为node1,node2节点为node2)
node.name: node1
##33行,取消注释,指定数据存放路径
path.data: /data/elk_data
##37行,取消注释,指定日志存放路径
path.logs: /var/log/elasticsearch/
##43行,取消注释,不在启动的时候锁定内存(前端缓存,与IOPS-性能测试方式,每秒读写次数相关)
bootstrap.memory_lock: false
##55行,取消注释,设置监听地址,0.0.0.0代表所有地址
network.host: 0.0.0.0
##59行,取消注释,ES服务的默认监听端口为9200
http.port: 9200
##68行,取消注释,集群发现通过单播实现,指定要发现的节点node1、node2
discovery.zen.ping.unicast.hosts: ["node1", "node2"]
[root@node1 opt]# grep -v "^#" /etc/elasticsearch/elasticsearch.yml
cluster.name: my-elk-cluster
node.name: node1
path.data: /data/elk_data
path.logs: /var/log/elasticsearch/
bootstrap.memory_lock: false
network.host: 0.0.0.0
http.port: 9200
discovery.zen.ping.unicast.hosts: ["node1", "node2"]
-------------------------------------------------------
scp /etc/elasticsearch/elasticsearch.yml [email protected]:/etc/elasticsearch/elasticsearch.yml
#将配置好的文件用 scp 传至 node2,后续只用去改个节点名字即可
4、创建数据存放路径并授权
[root@node1 opt]# mkdir -p /data/elk_data
[root@node1 opt]# chown elasticsearch:elasticsearch /data/elk_data/
5、启动 elasticsearch
[root@node1 opt]# systemctl start elasticsearch.service
[root@node1 opt]# netstat -natp | grep 9200 #启动较慢,需等待
tcp6 0 0 :::9200 :::* LISTEN 4216/java
注:必须在解压后的 elasticsearch-head 目录下启动服务,进程会读取该目录下的 gruntfile.js 文件,否则可能启动失败。
6、查看节点信息
浏览器访问 http://192.168.223.9:9200、http://192.168.223.10:9200 查看节点 node1、node2 的信息
浏览器访问 http://192.168.223.9:9200/_cluster/health?pretty、http://192.168.223.10:9200/_cluster/health?pretty
查看群集的健康情况,可以看到status值为green(绿色),表示节点健康运行
0
ES 在 5.0 版本后,插件需要作为独立服务进行安装,需要使用 npm 工具(NodeJS 的包管理工具)安装。安装 Elasticsarch-head 需要提前安装好依赖软件 node 和 phantomjs。
[root@node1 ~]# cd /opt
[root@node1 opt]# rz -E
#上传软件包node-v8.2.1.tar.gz到/opt目录
rz waiting to receive.
[root@node1 opt]# yum install -y gcc gcc-c++ make
[root@node1 opt]# tar zxvf node-v8.2.1.tar.gz
[root@node1 opt]# cd node-v8.2.1/
[root@node1 node-v8.2.1]# ./configure
[root@node1 node-v8.2.1]# make -j 4 && make install
#编译时间很长
[root@node1 node-v8.2.1]# cd /opt
[root@node1 opt]# rz -E
#上传软件包phantomjs-2.1.1-linux-x86_64.tar.bz2到/opt目录
rz waiting to receive.
[root@node1 opt]# tar jxvf phantomjs-2.1.1-linux-x86_64.tar.bz2 -C /usr/local/src
[root@node1 opt]# cd /usr/local/src/phantomjs-2.1.1-linux-x86_64/bin
[root@node1 bin]# cp phantomjs /usr/local/bin
[root@node1 bin]# cd /opt
[root@node1 opt]# rz -E
#上传软件包elasticsearch-head.tar.gz到/opt目录
rz waiting to receive.
[root@node1 opt]# tar zxvf elasticsearch-head.tar.gz -C /usr/local/src/
[root@node1 opt]# cd /usr/local/src/elasticsearch-head/
[root@node1 elasticsearch-head]# npm install
[root@node1 elasticsearch-head]# vim /etc/elasticsearch/elasticsearch.yml
##末行添加以下内容
http.cors.enabled: true ##开启跨域访问支持,默认为false
http.cors.allow-origin: "*" ##指定跨域访问允许的域名地址为所有
[root@node1 elasticsearch-head]# systemctl restart elasticsearch.service
[root@node1 elasticsearch-head]# netstat -antp | grep 9200
[root@node1 elasticsearch-head]# cd /usr/local/src/elasticsearch-head/
[root@node1 elasticsearch-head]# npm run start &
[1] 71012
> [email protected] start /usr/local/src/elasticsearch-head
> grunt server
Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100
^C
[root@node1 elasticsearch-head]# netstat -natp | grep 9100
tcp 0 0 0.0.0.0:9100 0.0.0.0:* LISTEN 71022/grunt
注:必须在解压后的 elasticsearch-head 目录下启动服务,进程会读取该目录下的 gruntfile.js 文件,否则可能启动失败。
通过浏览器访问 http://192.168.223.9:9100 地址并连接群集。如果看到群集健康值为 green,代表群集很健康。
注意:有的时候显示未连接,这时将 localhost 改成 IP 地址即可
通过命令插入一个测试索引,索引为 index-demo,类型为 test
[root@node1 elasticsearch-head]# curl -X PUT 'localhost:9200/index-demo/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}'
{
"_index" : "index-demo",
"_type" : "test",
"_id" : "1",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 2,
"failed" : 0
},
"created" : true
}
浏览器访问 http://129.168.223.9:9100 查看索引信息,可以看见索引默认被分片为 5 个,并且有一个副本。
点击 **数据浏览**,会发现在 node1 上创建的索引为 index-demo,类型为 test 的相关信息。
[root@localhost ~]# hostnamectl set-hostname apache
[root@localhost ~]# bash
[root@apache ~]#
[root@apache ~]# yum install -y httpd
[root@apache ~]# systemctl start httpd && systemctl enable httpd
cd /opt
tar zxvf jdk-8u201-linux-x64.tar.gz -C /usr/local
mv /usr/local/jdk1.8.0_91/ /usr/local/jdk
vim /etc/profile
export JAVA_HOME=/usr/local/jdk
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
source /etc/profile
java -version
[root@apache ~]# cd /opt
[root@apache opt]# rz -E #上传安装包 logstash-5.5.1.rpm
[root@apache opt]# rpm -ivh logstash-5.5.1.rpm
[root@apache opt]# systemctl start logstash.service && systemctl enable logstash.service
[root@apache opt]# ln -s /usr/share/logstash/bin/logstash /usr/local/bin/
1、 Logstash 命令常用选项
Logstash 命令常用选项 | 说明 |
-f | 通过这个选项可以指定 Logstash 的配置文件,根据配置文件配置 Logstash 的输入和输出流 |
-e | 从命令行中获取,输入、输出后面跟着字符串,该字符串可以被当做 Logstash 的配置(如果是空,则默认使用 stdin 作为输入,stdout 作为输出) |
-t | 测试配置文件是否正确,然后退出 |
2、定义输入和输出流
标准输入、输出:输入采用标准输入,输出采用标准输出(类似管道)
[root@apache /opt]# logstash -e 'input { stdin{} } output { stdout{} }'
......
The stdin plugin is now waiting for input:
22:24:31.510 [Api Webserver] INFO logstash.agent - Successfully started Logstash API endpoint {:port=>9600}
www.baidu.com #键入内容(标准输入)
2021-11-19T14:28:36.175Z apache www.baidu.com #输入结果(标准输出)
www.4399.com
2021-11-19T14:29:01.315Z apache www.4399.com
www.baidu.com
2021-11-19T14:29:10.569Z apache www.baidu.com
2021-11-19T14:29:10.569Z apache www.baidu.com
^C22:30:07.071 [SIGINT handler] WARN logstash.runner - SIGINT received. Shutting down the agent.
22:30:07.081 [LogStash::Runner] WARN logstash.agent - stopping pipeline {:id=>"main"}
rubydebug 输出使:用 rubydebug 输出详细格式显示,codec 为一种编解码器
[root@apache /opt]# logstash -e 'input { stdin{} } output { stdout{ codec=>rubydebug } }'
......
The stdin plugin is now waiting for input:
22:37:46.417 [Api Webserver] INFO logstash.agent - Successfully started Logstash API endpoint {:port=>9600}
www.test.com #输入内容
{ #输出内容
"@timestamp" => 2021-11-19T14:38:03.535Z,
"@version" => "1",
"host" => "apache",
"message" => "www.test.com"
}
^C22:38:35.333 [SIGINT handler] WARN logstash.runner - SIGINT received. Shutting down the agent.
22:38:35.343 [LogStash::Runner] WARN logstash.agent - stopping pipeline {:id=>"main"}
输出到 ES:使用 logstash 将嘻嘻写入到 ES 中
[root@apache opt]# logstash -e 'input { stdin{} } output { elasticsearch { hosts=>["192.168.223.9:9200"] } }'
······
The stdin plugin is now waiting for input:
22:40:57.485 [Api Webserver] INFO logstash.agent - Successfully started Logstash API endpoint {:port=>9600}
www.test.com #键入内容(标准输出)
结果不在标准输出显示,而是发送至 ES,可浏览器访问 http://192.168.223.11:9100 查看索引和数据
在每个部分中,也可以指定多个访问方式。例如:若要指定两个日志来源文件,则格式如下:
input {
file { path =>"/var/log/messages" type =>"syslog"}
file { path =>"/var/log/httpd/access.log" type =>"apache"}
}
修改 logstash 配置文件,让其收集系统日志 /var/log/messages,并将其输出到 ES 中
[root@apache opt]# chmod o+r /var/log/messages
#赋予读的权限,让 Logstash 可以获取到该文件的内容
[root@apache opt]# vim /etc/logstash/conf.d/system.conf
##该文件需自行创建,文件名可自定义
input {
file{
path =>"/var/log/messages"
##指定要收集的日志的位置
type =>"system"
##自定义日志类型标识
start_position =>"beginning"
##表示从开始处收集
}
}
output {
elasticsearch{
##输出到ES
hosts =>["192.168.223.9:9200", "192.168.223.10:9200"]
##指定ES服务器的地址和端口,为避免单机故障,建议写全
index =>"system-%{+YYYY.MM.dd}"
##指定输出到ES的索引格式
}
}
[root@apache opt]# systemctl restart logstash.service
浏览器访问 http://192.168.223.9:9100 查看索引信息
[root@node1 elasticsearch-head]# cd /opt
[root@node1 opt]# rz -E #上传软件包 kibana-5.5.1-x86_64.rpm
[root@node1 opt]# rpm -ivh kibana-5.5.1-x86_64.rpm
[root@node1 opt]# cp /etc/kibana/kibana.yml /etc/kibana/kibana.yml.bak
#备份配置文件
[root@node1 opt]# vim /etc/kibana/kibana.yml
##2行,取消注释,kibana服务的默认监听端口为5601
server.port: 5601
##7行,取消注释,设置kibana的监听地址,0.0.0.0代表所有地址
server.host: "0.0.0.0"
##21行,取消注释,设置和ES建立连接的地址和端口
elasticsearch.url: "http://192.168.223.9:9200"
##30行,取消注释,设置在ES中添加.kibana索引
kibana.index: ".kibana"
[root@node1 opt]# systemctl start kibana.service && systemctl enable kibana.service
[root@node1 opt]# netstat -natp | grep 5601
tcp 0 0 0.0.0.0:5601 0.0.0.0:* LISTEN 82765/node
浏览器访问 http://192.168.223.9:5601
第一次登录需要添加一个 ES 索引
点击 create 创建
索引添加完成后,点击 Discover 按钮可查看图表信息及日志信息
数据展示可以分类显示,例如:在 Available Fileds 中的 host
apache 服务器
[root@apache opt]# vim /etc/logstash/conf.d/apache_log.conf
input {
file{
path => "/etc/httpd/logs/access_log"
type => "access"
start_position => "beginning"
}
file{
path => "/etc/httpd/logs/error_log"
type => "error"
start_position => "beginning"
}
}
output {
if [type] == "access" {
elasticsearch {
hosts => ["192.168.223.37:9200", "192.168.223.53:9200"]
index => "apache_access-%{+YYYY.MM.dd}"
}
}
if [type] == "error" {
elasticsearch {
hosts => ["192.168.223.37:9200", "192.168.223.53:9200"]
index => "apache_error-%{+YYYY.MM.dd}"
}
}
}
[root@apache opt]# cd /etc/logstash/conf.d
[root@apache conf.d]# /usr/share/logstash/bin/logstash -f apache_log.conf
······
23:42:13.199 [Api Webserver] INFO logstash.agent - Successfully started Logstash API endpoint {:port=>9601}
浏览器访问 http://192.168.223.9:9100 查看索引是否创建
可能你只看到了 apache-error,那是因为 access 需要访问 httpd 页面才能生成
浏览器访问 http://192.168.223.9:5601 登录 kibana,添加 apache_access-* 和 apache_error-* 索引,查看日志信息
服务器 | 配置 | 主机名 | ip地址 | 主要软件部署 |
node1 节点 | 2C/4G | node1 | 192.168.223.9 | ElasticSearch、Kibana |
node2 节点 | 2C/4G | node2 | 192.168.223.10 | ElasticSearch |
apache 节点 | / | apache | 192.168.223.11 | Logstash、Apache |
filebeat 节点 | / | filebeat | 192.168.223.12 | Filebeat |
在 ELK 的服务配置的基础上,增加一台 filebeat 服务器,其余不变(所以以下只说明部署Filebeat服务器)
[root@localhost ~]# hostnamectl set-hostname filebeat
[root@localhost ~]# su
[root@filebeat ~]# systemctl stop firewalld && systemctl disable firewalld
[root@filebeat ~]# setenforce 0
#wget https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-6.2.4-linux-x86_64.tar.gz
#wget http://101.34.22.188/ELK/filebeat-5.5.1-linux-x86_64.tar.gz -P /opt
[root@filebeat ~]# wget http://101.34.22.188/ELK/filebeat-6.2.4-linux-x86_64.tar.gz -P /opt
[root@filebeat ~]# cd /opt
[root@filebeat opt]# tar zxvf filebeat-6.2.4-linux-x86_64.tar.gz
[root@filebeat opt]# mv filebeat-6.2.4-linux-x86_64 /usr/local/filebeat
[root@filebeat opt]# cd /usr/local/filebeat/
[root@filebeat filebeat]# cp filebeat.yml filebeat.yml.bak
[root@filebeat filebeat]# vim filebeat.yml
filebeat.prospectors:
##21行,指定log类型,从日志文件中读取消息
- type: log
##24行,开启日志收集功能,默认为false
enabled: true
##28行,指定监控的日志文件
- /var/log/*.log
##29行,添加收集/var/log/messages
- /var/log/messages
##31行,添加以下内容,注意格式
fields:
service_name: filebeat
log_type: log
service_id: 192.168.223.33
#-------------------------- Elasticsearch output ------------------------------
该区域内容全部注释
#----------------------------- Logstash output --------------------------------
##157行,取消注释
output.logstash:
##159行,取消注释,指定logstash的IP和端口号
hosts: ["192.168.223.13:5044"]
[root@filebeat filebeat]# ./filebeat -e -c filebeat.yml
#启动filebeat,-e记录到stderr并禁用syslog /文件输出,-c指定配置文件
[root@apache ~]# cd /etc/logstash/conf.d/
[root@apache conf.d]# vim logstash.conf
input {
beats {
port => "5044"
}
}
output {
elasticsearch {
hosts => ["192.168.223.37:9200", "192.168.223.53:9200"]
index => "%{[fields][service_name]}-%{+YYYY.MM.dd}"
}
stdout {
codec => rubydebug
}
}
[root@apache conf.d]# /usr/share/logstash/bin/logstash -f apache_log.conf
浏览器访问 http://192.168.223.9:5601 登录 kibana, 添加 filebeat-* 索引后在 Discover 中查看 filebeat 日志收集情况。
参考文件如下
ELK 理论详解https://blog.csdn.net/weixin_51486343/article/details/114297277?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163721971416780271569143%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=163721971416780271569143&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_v2~rank_v29-2-114297277.pc_v2_rank_blog_default&utm_term=ELK&spm=1018.2226.3001.4450ELK 部署https://xucf1.blog.csdn.net/article/details/114333700ELK 详解https://www.cnblogs.com/dingcong1201/p/15363199.htmlZookeeper、Kafka集群与Filebeat+Kafka+ELK架构https://www.cnblogs.com/dingcong1201/p/15365638.h
随着业务量的增长,每天业务服务器将会产生上亿条的日志,单个日志文件达几个GB,这时我们发现用Linux自带工具,cat grep awk 分析越来越力不从心了,而且除了服务器日志,还有程序报错日志,分布在不同的服务器,查阅繁琐。