zabbix监控

目录

一、zabbix监控

1.1、网站可用性 

2、监控什么东西

2.1、监控范畴

3、企业级监控解决方案——Zabbix

4、zabbix主要功能

5、zabbix监控范畴

 6、zabbix监控组件

7、zabbix常用的监控架构平台

 8、zabbix运行过程图


一、zabbix监控

1、为什么要监控

 对于运维人员来说,监控是非常重要的,因此如果想要保证线上业务整体能够稳定运行,那么我们则需要实时关注与其相关的各项指标是否正常,而一个业务系统的背后,往往存在着很多的服务器、网络设备等硬件资源,如果我们想要能够更加方便的、集中的监控他们,我们则需要依靠一些外部的工具,而zabbix就是一个被广泛使用的,可以实现集中监控管理的应用程序。
 我们监控的初衷就是当某些指标不符合我们的需求时,我们能够在第一时间发现异常,所以,监控工具需要定期的对被监控主机进行检查、信息收集等操作,当被监控主机出现异常时,能够及时报警、通知管理员,并且需要记录这些异常,以便我们分析这些数据,查漏补缺,那么,一个监控工具就应该具备采集信息、存储信息、展示信息、报警通知等功能。而zabbix就可以做到这些。

总结来说,监控可以给我带来:

  • 在需要的时刻,提前提醒我们服务器出问题了
  • 当出问题之后,可以找到问题的根源
  • 网站/服务器的可用性
     

1.1、网站可用性 

 在软件系统的高可靠性(也称为高可用性,英文描述为HA,High Available)里有个衡量其可靠性的标准——X个9,X个9表示在软件系统1年时间的使用过程中,系统可以正常使用时间与总时间(1年)之比,我们通过下面的计算来感受下X个9在不同级别的可靠性差异。
 1个9:(1-90%)*365=36.5天,表示该软件系统在连续运行1年时间里最多可能的业务中断时间是36.5天。
 2个9:(1-99%)*365=3.65天 , 表示该软件系统在连续运行1年时间里最多可能的业务中断时间是3.65天。
 3个9:(1-99.9%)*365*24=8.76小时,表示该软件系统在连续运行1年时间里最多可能的业务中断时间是8.76小时。
 4个9:(1-99.99%)*365*24=0.876小时=52.6分钟,表示该软件系统在连续运行1年时间里最多可能的业务中断时间是52.6分钟。
 5个9:(1-99.999%)*365*24*60=5.26分钟,表示该软件系统在连续运行1年时间里最多可能的业务中断时间是5.26分钟。
 6个9:(1-99.9999%)*365*24*60*60=31秒, 示该软件系统在连续运行1年时间里最多可能的业务中断时间是31秒。


2、监控什么东西

监控一切需要监控的东西,只要能够想到,能够用命令实现的都能用来监控

2.1、监控范畴

zabbix监控_第1张图片

3、企业级监控解决方案——Zabbix

 Zabbix是一个高度集成的企业级开源网络监控解决方案,提供分布式监控以及集中的web管理界面。
 zabbix具备常见商业监控软件所具备的功能,例如主机性能监控,网络设备性能监控,数据库性能监控,ftp、http等通用协议的监控,能够灵活利用可定制告警机制,允许用户对事件发送基于E-mail的告警,保证相关人员可以快速解决。
 zabbix提供杰出的报表及实时的图形化数据处理,实现对监控主机7x24小时集中监控。
 Zabbix通过C/S模式采集数据,通过B/S模式在web端展示和配置,而被监控对象只需要支持SNMP协议或者运行Zabbix agents代理程序即可。服务端监听端口为10051,而被监控端即Zabbix——agents代理程序监控10050端口


4、zabbix主要功能

 Zabbix是一个高度集成的网络监控套件,可实现如下功能:
 1、数据收集:自定义间隔收集收据
 2、灵活的阀值定义:灵活地自定义故障阀值,Zabbix中称为触发器(trigger), 存储在后端数据库中;
 3、高级告警配置:可以自定义告警升级(escalation)、接收者及告警方式;通过远程命令实行自动化动作;
 4、实时绘图:通过内置的绘图引擎实现监控数据实时绘图;
 5、具备应对复杂环境情况:通过Zabbix proxy可以非常容易的创建远程监控;
 

5、zabbix监控范畴

  1.  硬件监控:Zabbix IPMI Interface ,通过IPMI接口进行监控,我们可以通过标准的IPMI硬件接口,监控被监控对象的物理特征,比如电压、温度、风扇状态、电源状态等。
  2. 系统监控:Zabbix Agent Interface ,通过专用的代理程序进行监控,与常见的master/agent模型类似,如果被监控对象支持对应的agent,推荐首选这种方式。
  3.  Java监控:Zabbix JMX Interface ,通过JMX进行监控,JMX(java management extensions,即java管理扩展),监控JVM虚拟机时,使用这种方法是非常不错的选择。
  4.  网络设备监控:Zabbix SNMP Interface ,通过SNMP协议与被监控对象进行通信,SNMP协议的全称为simple network management protocol,被译为简单网络管理协议,通常来说,我们无法在路由器、交换机这种硬件上安装agent,但是这些硬件都支持SNMP协议。
  5.  应用服务监控:Zabbix Agent UserParameter 
  6.  MySQL数据库监控:percona-monitoring-plulgins   
  7.  URL监控:Zabbix Web 监控
     

 6、zabbix监控组件

Zabbix监控组件主要包括:Zabbix Server、Zabbix Proxy、Zabbix Agent;其中Zabbix Server包括:WEB GUI、Database、Zabbix Server。

zabbix监控_第2张图片

 

每个模块工作职责:

  1. Zabbix Server:负责接收agent发送的报告信息的核心组件,所有配置,统计数据及操作数据均由其组织进行;
  2. Zabbix Database:用户存储所有zabbix的配置信息、监控数据的数据库;
  3. Zabbix Web:Zabbix的web界面,管理员通过web界面管理zabbix配置以及查看zabbix相关监控信息,通常与zabbix Server运行在同一台主机上,也可以单独部署在独立的服务器上;
  4. Zabbix Proxy:常用于分布监控环境中,代理zabbix Server收集部分被监控的监控数据并统一发往Server端;(通常大于500台主机需要使用)
  5. Zabbix Agent:部署在被监控主机上,负责收集本地数据发往Server端或Proxy端;
     

7、zabbix常用的监控架构平台

server-agentd模式:

将zabbix agent部署到被监控主机上,由agent采集数据,报告给zabbix server,zabbix server将从agent端接收到的信息存储于zabbix database,如果管理员需要查看各种监控信息,则需要zabbix web,zabbix web是使用php编写的,所以,如果想要使用zabbix web展示相关监控信息,需要依赖LAMP或LNMP环境。不管是zabbix server,或是zabbix web,他们都需要连接zabbix database获取相关数据。

zabbix监控_第3张图片

  server-proxy-agentd模式:

 当监控规模变得庞大时,我们可能有成千上万台设备需要监控,那如何分摊巨大的监控压力呢?其实,zabbix天生就有处理这种问题的能力,因为zabbix支持分布式监控,我们可以把成千上万的被监控对象分成不同的区域,每个区域中设置一台代理主机,区域内的每个被监控对象的信息被agent采集,提交给代理主机,我们称这些代理主机为zabbix proxy,zabbix proxy再将收集到的信息统一提交给zabbix server处理。这样,zabbix proxy分摊了zabbix server的压力,同时,我们还能够通过统一的监控入口,监控所有的对象。

 zabbix监控_第4张图片

 8、zabbix运行过程图

zabbix监控_第5张图片

 server-proxy-agentd模式:

 一个监控系统运行的大概的流程是这样的:
 agent需要安装到被监控的主机上,它负责定期收集各项数据,并发送到zabbix server端,zabbix server将数据存储到数据库中,zabbix web根据数据在前端进行展现和绘图。这里agent收集数据分为主动和被动两种模式:
 主动:agent请求server获取监控项列表,并主动将监控项内需要检测的数据提交给server/proxy
 被动:server向agent请求获取监控项的数据,agent返回数据。
 

你可能感兴趣的:(监控系统zabbix,服务器,运维)