ELK是一套完整的日志集中处理解决方案,将Elastic Search、Logstash和Kibana三个开开源工具配置使用,发挥出更强大的用户对日志查询、排序、统计需求(还可以加一个filebeat)。
Elasticsearch是基于Lucene开发的分布式存储检索引擎,用来存储各类日志。
Elasticsearch是基于JAVA开发的,可以通过RESTful Web接口让用户通过浏览器与Elasticsearch通信。
Elasticsearch是一个实时的、分布式的可扩展搜索引擎,允许进行全文、结构化地搜索。通常用于索引和搜索大容量的日志数据,也可以用于搜索不同类型的文档。
Logstash作为一个数据收集引擎,支持动态的从各种数据源搜集数据并对数据进行过滤、分析、丰富、统一格式等操作,然后存储到用户指定的位置(一般会发送给Elasticsearch)。
通常与Elasticsearch一起部署,kibana是Elasticsearch的一个数据可视化Dashboard。Kibana提供图形化的WEB界面来浏览Elasticsearch日志数据,可以用来汇总、分析和搜索重要数据。
Filebeat是一款轻量级的开源日志文件数据搜集器。通常在采集数据的客户端安装Filebeat并指定目录与日志格式,Filebeat就能快速收集数据并发送给Logstash进行分析,或是直接发给ES存储。性能上相比于运行于JVM上的Logstash优势明显,是对它的替代。
·通过Logstash具有基于磁盘的自适应缓冲系统,该系统将吸收传入的吞吐量从而减轻Elasticsearch持续写入数据的压力
·从其他数据源(例如数据库,消息队列等)中提取
·将数据发送到多个目的地,例如S3,HDFS或写入文件
·使用条件数据流逻辑组成更复杂的处理管道
·Packetbeat 用来搜索网络流量数据
·Topbeat 用来搜索系统、进程和文件系统级别的cpu和内存使用情况等数据
·Filebeat 用来搜集文件数据
·Winlogbeat 用来搜集windows时间日志数据
①将日志进行集中化管理
②对日志格式化(Logstash)并输出到Elasticsertach
③对格式化后的数据进行索引和存储
④前端数据展示(Kibana)
能够采集多种来源的日志数据
能够稳定的把日志数据解析过滤并传输到存储系统
存储日志数据
支持UI分析
有监控机制,能够提供错误报告
node1 192.168.10.102 ElasticSearch、Kibana
node2 192.168.10.103 ElasticSearch
web 192.168.10.30 Logstash、apache
vim /etc/elasticsearch/elasticsearch.yml
集群名
节点名,每个节点各自独立
指定数据存放路径
指定日志存放路径
不锁定内存
监听所有地址
默认监听端口9200
指定发现节点
mkdir -p /data/elk_data
chown elasticsearch:elasticsearch /data/elk_data/
访问该节点9200端口
http://192.168.10.102:9200/_cluster/health?pretty
查看群集的健康情况,status为green表示健康。
http://192.168.10.102:9200/_cluster/state?pretty
查看集群状态信息
ES在5.0版本后,插件需要作为独立服务进行安装,需要使用npm工具(NodeJS的包管理工具)安装。安装ELasticsearch-head需要提前安装依赖软件node和phantomjs。
node是一个基于Chrome V8引擎的JavaScript运行环境。
phantomjs是一个居于webkit的JavaScriptAPI,可以理解为一个隐形的浏览器,任何基于webkit浏览器做的事情,它都可以做到。
必须在解压后的ES-head目录下启动服务,进程会读取该目录下的gruntfile.js文件,否则可能启动失败。
-f 指定logstash配置文件,根据配置文件配置logstash的输入输出流
-e 从命令行获取,输入输出后面跟着的字符串,该字符串可以被当作logstash的配置
-t 测试配置文件是否正确,然后退出
logstash -e ‘input { stdin{} } output { stdout{} }’
logstash -e ‘input { stdin{} } output { stdout{ codec=>rubydebug } }’
logstash -e ‘input { stdin{} } output { elasticsearch { hosts=>[“192.168.10.102:9200”] } }’
结果发送到ES
Logstash 配置文件基本由三部分组成:input、output 以及 filter(可选,根据需要选择使用)
·input:表示从数据源采集数据,常见的数据源如Kafka、日志文件等
·filter:表示数据处理层,包括对数据进行格式化处理、数据类型转换、数据过滤等,支持正则表达式
·output:表示将Logstash收集的数据经由过滤器处理之后输出到Elasticsearch。
指定多个访问方式
input {
file { path =>“/var/log/messages” type =>“syslog”}
file { path =>“/var/log/httpd/access.log” type =>“apache”}
}
修改 logstash 配置文件,让其收集系统日志 /var/log/messages,并将其输出到 ES 中
赋予读的权限,让 Logstash 可以获取到该文件的内容
vim /etc/logstash/conf.d/system.conf
重启服务
监听端口,默认5601
设置监听地址,0.0.0.0监听所有
设置和ES建立连接的地址和端口
设置在ES中添加.kibana索引
修改apache配置
在kibana上添加apache_access-*和apache_error-*索引
由于logstash会大量占用系统的内存资源,所以一般我们会使用filebeat替换logstash收集日志的功能,这也就是ELFK。或者使用fluentd替代logstash组成EFK,由于fluentd是由go开发的,所以一般用于k8s。
①filebeat将日志收集后交由logstash处理;
②logstash将日志过滤、格式化等操作,满足过滤条件的数据发送给ES;
③ES对数据进行分片存储,并提供索引功能;
④Kibana对数据进行图形化展示。
在ELK的基础上新增一台filebeat节点服务器。
filebeat服务器 192.168.10.104
下载filebeat压缩包
解压缩并转移到/usr/local下
指定log类型,从日志文件中读取信息
开启日志收集功能,默认false关闭
指定监控的日志文件,添加收集/var/log/messages
添加,指定名称filebeat,log类型,filebeat服务器即本机ip。
注释,收集的日志不传输到ES
收集的日志传送给logstash。
启动filebeat,-e记录到stderr并禁用syslog /文件输出,-c指定配置文件