巴利奇

CentOS Linux 监控安装之Nagios

CentOS Linux 监控安装之Nagios

1、Nagios介绍

Nagios是一款开源的免费网络监视工具，能有效监控Windows、Linux和Unix的主机状态，交换机路由器等网络设置。

Nagios的功能是监控服务和主机，但是他自身并不包括这部分功能，所有的监控、检测功能都是通过各种插件来完成的。

　　启动Nagios后，它会周期性的自动调用插件去检测服务器状态，同时Nagios会维持一个队列，所有插件返回来的状态信息都进入队列，Nagios每次都从队首开始读取信息，并进行处理后，把状态结果通过web显示出来。

Nagios提供了许多插件，利用这些插件可以方便的监控很多服务状态。安装完成后，在nagios主目录下的/libexec里放有nagios自带的可以使用的所有插件，如，check_disk是检查磁盘空间的插件，check_load是检查CPU负载的，等等。每一个插件可以通过运行./check_xxx �Ch 来查看其使用方法和功能。

在监控远程主机的状态比如，磁盘、某个端口的服务，就需要使用到nrpe服务。NRPE 总共由两部分组成：（1）check_nrpe 插件，位于监控主机上；（2）NRPE daemon，运行在远程的Linux主机上(通常就是被监控机)

Nagios定义了4种监控状态，代表不同的级别，除了OK代表正常不需要关心外，其他的都是需要关注的。

状态代码颜色

正常 OK 绿色

警告 WARNING ***

严重 CRITICAL 红色

未知错误 UNKOWN 深***

2、部署Nagios监控平台

安装前的准备工作：

1）、添加防火墙规则

vim /etc/sysconfig/iptables

-A INPUT -m state --state NEW -m tcp -p tcp--dport 80 -j ACCEPT #web访问查看监控

-A INPUT -m state --state NEW -m tcp -p tcp--dport 5666 -j ACCEPT #nrpe通信端口

:wq #保存退出

/etc/init.d/iptables restart #最后重启防火墙使配置生效

2）、关闭SELinux

vim /etc/selinux/config

#SELINUX=enforcing #注释掉

#SELINUXTYPE=targeted #注释掉

SELINUX=disabled #增加

:wq! #保存退出

setenforce 0 #使配置立即生效，重启系统永久生效

3）、监控环境说明：

类型操作系统 IP地址软件

监控服务端 CentOS 6.7 x86_64 192.168.17.10 Apache、php、nagios、nagios-plugins

监控客户端 CentOS 6.7 x86_64 192.168.17.20 nagios-plugins、nrpe

监控客户端 Windows 7 192.168.17.1 NSClient++

局域网内有两台主机，一台Linux、一台Windows，现在需要配置一台Nagios监控服务器对这两台主机进行监控。

以下是在Nagios监控的服务器（192.168.17.10）上操作：

1）、因为使用yum安装，需要用到epel的扩展源

yum install -y epel-release

2）、安装LAMP环境，使用yum安装（可不需要mysql，根据实际的环境部署，建议使用源码安装）

yum install -y httpd php php-mysql mysql mysql-servermysql-devel php-gd libjpeg libjpeg-devellibpng libpng-devel

3）、安装nagios相关的软件包（nagios插件、nrpe）

yum install -y nagios nagios-pluginsnagios-plugins-all nrpe nagios-plugins-nrpe

4）、设置用于访问nagios的访问控制（使用apache的htpasswd工具）

htpasswd -c /etc/nagios/passwd nagiosadmin #然后输入两次密码nagiosadmin

5）、重启服务

service httpd start; service nagios start

6）、使用浏览器访问http://ip/nagios（http://192.168.17.10/nagios）

另外，nagios的默认全局配置文件是 /etc/nagios/nagios.cfg ，在里面定义了一些模版文件，带#号表示没有启用

cfg_file=/etc/nagios/objects/commands.cfg #定义命令配置文件

cfg_file=/etc/nagios/objects/contacts.cfg #定义联系人和联系人组的配置文件

cfg_file=/etc/nagios/objects/timeperiods.cfg #定义Nagios 监控时间段的配置文件

cfg_file=/etc/nagios/objects/templates.cfg #定义主机和服务的一个模板配置文件

# Definitions for monitoring the local(Linux) host

cfg_file=/etc/nagios/objects/localhost.cfg #监控本机的配置文件

# Definitions for monitoring a Windowsmachine

#cfg_file=/etc/nagios/objects/windows.cfg #定义Windows的模版文件

# Definitions for monitoring arouter/switch

#cfg_file=/etc/nagios/objects/switch.cfg #定义交换机的模版文件

# Definitions for monitoring a networkprinter

#cfg_file=/etc/nagios/objects/printer.cfg #定义打印机的模版文件

验证nagios配置文件是否有误，可以使用如下命令：

nagios -v /etc/nagios/nagios.cfg

3、配置被监控的主机（监控）

1）、配置Linux客户端

Linux客户端上需要安装nagios等相关插件，同时需要开启防火墙TCP 5666端口

vim /etc/sysconfig/iptables #编辑防火墙配置

-A INPUT -m state --state NEW -m tcp -p tcp--dport 5666 -j ACCEPT

/etc/init.d/iptables restart #重启防火墙使配置生效

在linux 客户端上需要安装的软件有nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe

（1）、安装nagios相关组件（192.168.171.20）

yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe

（2）、修改nrpe.cfg配置文件

vim /etc/nagios/nrpe.cfg

找到“allowed_hosts=127.0.0.1 ” 改为“allowed_hosts=127.0.0.1,192.168.17.10”

##即增加服务器的IP

找到“dont_blame_nrpe=0” 改为“dont_blame_nrpe=1”

2）、配置Windows客户端

Windows客户端需要安装NSClient++，下载地址是：http://www.nsclient.org/，下载软件后，直接点击运行安装即可。

在选择安装类型的时候，可以感觉自己的需要选择安装，我这里选择的是“典型”安装，在安装的过程中会有一个配置，主要有以下几点：

Allowed hosts:这是运行那些主机，在后面添加监控主机的ip（192.168.17.10）,这个也可以安装完之后修改配置文件。

password：用于通信的密码

Modules to load：这里是选择要加载的模块，根据实际选择，需要就勾选。

安装完成后，NSClient++会以服务的形式运行，可以使用命令：services.msc 打开服务查看NSClient++是否运行，它监听的端口是TCP 12489

4、在监控服务器上配置监控的客户机

1）、设置linux 客户端

（1）、在监控服务器上配置Linux主机（192.168.17.20）的监控，我们可以直接使用现在系统上有的模版修改，把配置文件存放到/etc/nagios/conf.d/目录，配置文件的名字可以使用主机类型+IP地址命名，比如linux192.168.17.20.cfg

修改如下：

vim/etc/nagios/conf.d/linux192.168.17.10.cfg

# Define a host for the 192.168.17.20machine

define host{

use linux-server

host_name 192.168.17.20

alias 17.20

address 192.168.17.20

}

# Define a service to "ping" thelocal machine

define service{

use local-service

host_name 192.168.17.20

service_description PING

check_command check_ping!100.0,20%!500.0,60%

max_check_attempts 5 #检查5次才报警

normal_check_interval 1 #重新检查时间，默认3分钟

}

# Define a service to check the disk spaceof the root partition

# on the local machine. Warning if < 20% free, critical if

# < 10% free space on partition.

define service{

use local-service

host_name 192.168.17.20

service_description Root Partition

check_command check_local_disk!20%!10%!/

max_check_attempts 5

normal_check_interval 1

}

# Define a service to check the number ofcurrently logged in

# users on the local machine. Warning if > 20 users, critical

# if > 50 users.

define service{

use local-service

host_name 192.168.17.20

service_description Current Users

check_command check_local_users!20!50

max_check_attempts 5

normal_check_interval 1

}

# Define a service to check the number ofcurrently running procs

# on the local machine. Warning if > 250 processes, critical if

# > 400 users.

define service{

use local-service

host_name 192.168.17.20

service_description Total Processes

check_command check_local_procs!250!400!RSZDT

max_check_attempts 5

normal_check_interval 1

}

# Define a service to check the load on thelocal machine.

define service{

use local-service

host_name 192.168.17.20

service_description Current Load

check_command check_local_load!5.0,4.0,3.0!10.0,6.0,4.0

max_check_attempts 5

normal_check_interval 1

}

# Define a service to check the swap usagethe local machine.

# Critical if less than 10% of swap isfree, warning if less than 20% is free

define service{

use local-service

host_name 192.168.17.20

service_description Swap Usage

check_command check_local_swap!20!10

max_check_attempts 5

normal_check_interval 1

}

# Define a service to check SSH on thelocal machine.

# Disable notifications for this service bydefault, as not all users may have SSH enabled.

define service{

use local-service

host_name 192.168.17.20

service_description SSH

check_command check_ssh

notifications_enabled 0

max_check_attempts 5

normal_check_interval 1

}

# Define a service to check HTTP on thelocal machine.

# Disable notifications for this service bydefault, as not all users may have HTTP enabled.

define service{

use local-service

host_name 192.168.17.20

service_description HTTP

check_command check_http

notifications_enabled 0

max_check_attempts 5

normal_check_interval 1

}

在这定义的服务中，需要使用到nrpe检测客户机的状态的有检测磁盘（check_local_disk）、负载（check_local_load）等，需要在客户机上的配置文件（/etc/nagios/nrpe.cfg）上有定义这样的命令，如果没有，则需要自行编写。

（2）、自定义监控项目

在nagios中默认的模版是没有监控内存的，需要自行定义，以下就使用自定的方式通过NRPE来监控远程服务器上的内存使用率。

a、监控的客户机下操作

下载监控内存的脚本

cd /usr/lib64/nagios/plugins/ #请根据系统的版本进入响应的目录

wgethttps://raw.githubusercontent.com/justintime/nagios-plugins/master/check_mem/check_mem.pl#下载脚本

mv check_mem.pl check_mem

chmod +x check_mem

可以使用如下命令测试脚本是否可用

./check_mem -f -w 30 -c 20 #可用内存为30%就警告，20%就严重警告

b、在监控主机上操作

vim /etc/nagios/objects/commands.cfg #编辑nagios命令配置文件，在后面增加检查内存的命令

define command{

command_name check_nrpe

command_line /usr/lib64/nagios/plugins/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

}

另外这种写法也可以：

define command{

command_name check_nrpe

command_line $USER1$/check_nrpe-H $HOSTADDRESS$ -c $ARG1$

}

然后在继续编辑之前监控的那台linux主机的配置文件：

vim/etc/nagios/conf.d/linux192.168.17.10.cfg #编辑配置文件，增加服务

define service{

use local-service

host_name 192.168.17.20

service_description Check RAM

check_command check_nrpe!check_mem

notifications_enabled 0

max_check_attempts 5

normal_check_interval 1

}

重启nagios服务

/etc/init.d/nagios restart

c、在监控客户机上操作

vim /etc/nagios/nrpe.cfg #增加check_men的命令

command[check_men]=/usr/lib64/nagios/plugins/check_mem�Cf -w 20 -c 10

重启nrpe服务

/etc/init.d/nrpe restart

在监控主机上也可以使用命令检查check_nrpe是否可以返回检查内存的状态：

/usr/lib64/nagios/plugins/check_nrpe -H192.168.17.20 -c check_mem

此时，在监控的控制台上可以看到刚刚配置的监控主机和服务。

2）、设置Windows客户端

在监控服务器上配置Windows主机（192.168.17.1）的监控，同样也是直接使用现在系统上有的模版修改（windows模版），把配置文件存放到/etc/nagios/conf.d/目录，配置文件的名字使用主机类型+IP地址命名，比如windows192.168.17.1.cfg，同时需要在/etc/nagios/nagios.cfg把windows.cfg的配置打开。

找到“#cfg_file=/etc/nagios/objects/windows.cfg”修改为：cfg_file=/etc/nagios/objects/windows.cfg

vim/etc/nagios/conf.d/windows192.168.17.1.cfg

define host{

use windows-server

host_name 192.168.17.1

alias My Windows Server

address 192.168.17.1

}

define service{

use generic-service

host_name 192.168.17.1

service_description NSClient++ Version

check_command check_nt!CLIENTVERSION

}

define service{

use generic-service

host_name 192.168.17.1

service_description Uptime

check_command check_nt!UPTIME

}

define service{

use generic-service

host_name 192.168.17.1

service_description CPU Load

check_command check_nt!CPULOAD!-l 5,80,90

}

define service{

use generic-service

host_name 192.168.17.1

service_description Memory Usage

check_command check_nt!MEMUSE!-w 80 -c 90

}

define service{

use generic-service

host_name 192.168.17.1

service_description C:\ Drive Space

check_command check_nt!USEDDISKSPACE!-l c -w 80-c 90

}

define service{

use generic-service

host_name 192.168.17.1

service_description W3SVC

check_command check_nt!SERVICESTATE!-d SHOWALL-l W3SVC

}

define service{

use generic-service

host_name 192.168.17.1

service_description Explorer

check_command check_nt!PROCSTATE!-d SHOWALL -lExplorer.exe

}

在这个模版里面，主要是修改host_name，address。

同时需要在/etc/nagios/objects/commands.cfg 配置文件里面修改配置。

找到：

define command{

command_name check_nt

command_line $USER1$/check_nt-H $HOSTADDRESS$ -p 12489 -v $ARG1$ $ARG2$

}

修改为：

define command{

command_name check_nt

command_line $USER1$/check_nt-H $HOSTADDRESS$ -p 12489 -s frAQBc8Wsa1xVPfv -v $ARG1$ $ARG2$

}

也就是增加：-s password，增加密码认证，这个密码是可以在客户端上修改的。

保存配置文件后，重启nagios服务。

/etc/init.d/nagios restart

此时在nagios控制台上会有刚刚添加的Windows监控客户端。

5、配置邮件告警功能

nagios是可以通过设定一个阀值发出警告的，可以使用这个功能达到发送邮件或者短信给管理员。

1）、测试本机是否安装sendmail服务，如果没有请安装，

yum install -y sendmail

/etc/init.d/sendmail start #启动sendmail服务

2）、测试发送邮件，格式：mail �Cs “主题” 邮箱地址

echo "from balich nagios server"| mail -s "from balich" [email protected]

3）、配置告警

编辑联系方式的配置文件，在后面增加配置

vim /etc/nagios/objects/contacts.cfg

define contact{

contact_name balich #联系名

use generic-contact

alias balich Admin

email [email protected] #邮箱地址

}

define contactgroup{

contactgroup_name balichs

alias balichAdministrators

members balich

}

然后在编辑需要报警的主机的配置文件，比如：linux192.168.17.20.cfg 这台主机，需要对某项的服务需要开启报警。

define service{

use local-service

host_name balich-ha2

service_description HTTP

check_command check_http

notifications_enabled 1 #是否开启提醒功能，1：提醒；0：禁用

notification_interval 5

max_check_attempts 5

normal_check_interval 1

contact_groups balichs #定义提醒联系人组

notification_period 24x7 #定义提醒时间

notification_ options w,u,c,r #d定义发送的告警的状态

}

notifications_enabled : 是否开启提醒功能。1为开启，0为禁用。一般，这个选项会在主配置文件（nagios.cfg）中定义，效果相同。

contact_groups: 定义接收提醒的联系人组

notification_interval:重复发送提醒信息的最短间隔时间。默认间隔时间是60分钟。如果这个值设置为0，将不会发送重复提醒。

notification_period: 发送提醒的时间段。非常重要的主机（服务）我定义为7×24，一般的主机（服务）就定义为上班时间。如果不在定义的时间段内，无论什么问题发生，都不会发送提醒。

notification_options: 这个参数定义了发送提醒包括的情况：d = 状态为DOWN, u = 状态为UNREACHABLE , r = 状态恢复为OK , f = flapping。，n=不发送提醒。

这里只是定义了web的服务，可以根据需要设置。

重启nagios服务，把web服务关闭，测试提醒功能。

/etc/init.d/nagios restart

然后测试，邮件报警功能是否可用。

邮件的报警内容：

***** Nagios *****

Notification Type: PROBLEM

Service: check_http

Host: 17.20

Address: 192.168.17.20

State: CRITICAL

Date/Time: Wed Oct 14 12:17:10 CST 2015

Additional Info:

connect to address 192.168.17.20 and port80: 拒绝连接

至此，nagios监控就安装完成了。

你可能感兴趣的:(nagios,邮件告警,监控安装)

分布式框架Celery七(Django-Celery-Flower实现异步和定时爬虫及其监控邮件告警) yjjpp2301 Celery 分布式 django python 后端
Django中集成方式安装模块pipinstallDjango==3.2.22pipinstallcelerypipinstallredispipinstalleventlet#在windows环境下需要安装eventlet包-----------pipinstalldjango-celery-beatpipinstalldjango-celery-resultspipinstalldjango-
Nagios安装部署全攻略 weixin_34109408 memcached php 操作系统
概述：公司的生产机器一共有12台，2台LVS(主备)、2台nginx、2台tomcat、1台后台服务器(nginx_tomcat)、3台mysql(主+备+异地灾备)、1台图片服务器、2台memcached.可以看出网站的架构就是基于高可用的原理的，每个层面都做了主备、系统的PV不高，对于并发布，高性能没有那么苛求，对于系统安全、稳定有较高要求，前期已经对系统做了各种日志分析，WAF配置，漏洞扫面
Zabbix5.0之邮件告警傻笑zz Zabbix企业级实战 zabbix 触发器 centos
前言依据zabbix5.0监控Nginx服务状态，当出现故障，或者异常关闭时，zabbix第一时间通过邮件通知到相关人员进行处理。以下文档并不讲述zabbix5.0部署。需要部署zabbix5.0的可参考：《CentOS7部署zabbix5.0LTS》一、监控Nginx服务状态1.1选择Nginx服务的主机，进入监控项配置界面1.2创建监控项1.3创建“Nginx服务状态”监控项1.4查看最新数据
zabbix6.0配置邮件告警有谁看见我的剑了？服务器网络运维
1、配置发送邮件服务器（管理媒介Email）2、创建用户用来接收邮件告警（管理用户创建用户）用户报警媒介权限3、设置触发器报警后的动作（配置动作触发器动作创建动作）邮件报警是基于触发器的，当触发器报警后，在进行发送报警邮件动作操作（点击操作点击添加）服务故障报警主题：故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生:{TRIGGER.NAME}故障!消息：触发
【zabbix】（三）-邮件告警配置小关暗器 zabbix 企业微信钉钉
企业微信、钉钉和邮件告警配置的目的是为了确保监控系统检测到的问题能够及时传达给相关人员，并通过灵活的通知方式提高团队的响应速度和协作效率。本文介绍的是QQ邮件告警一开启发件服务器SMTP功能本文使用的是QQ邮箱，其他邮箱操作类似：进入QQ邮箱，然后点击左上侧，下来到选择《POP3/SMTP/IMAP》服务管理按照要求进行验证后，获取授权码：二安装邮件服务软件安装配置Mailx和msmtp服务器信息
zabbix监控MySQL lu9up zabbix mysql 数据库
1PMP介绍PMP（percona-monitoring-pluggins）是高质量的mysql监控组件，以模板、插件和脚本的形式提供我们去应用。可以将企业级MySQL功能添加到现有的本地监控解决方案中，支持如Nagios、Cacti和Zabbix等热门解决方案。更详细介绍请阅读官方文档第三章【TEMPLATESFORZABBIX】：Percona-Monitoring-Plugins-1.1.8
为什么现在这么多欠钱不还的昆虫明子
我是干个体的，主要从事安防工作。比如，监控安装、道闸门、综合布线，弱电智能化，就是跟弱电相关的产业。去年，一个朋友找到我，说有块消防的活干不干，也属于弱电类。我说，消防的活没干过，不敢接啊，怕好不好，别到时候砸了自己的买卖。他说，干弱电的都会干，是消防电，不是消防水，一说就懂。正好赶上当时手里没有什么活，也就应下了。活，没有想象的那么简单，但也算不复杂，前前后后干了，一个月左右。保证，各项工作做到
vulnhub靶机midwest-v1.0.1 himobrinehacken vulnhub 安全系统安全网络安全
下载地址：https://download.vulnhub.com/midwest/midwest-v1.0.1.ova主机发现目标144端口扫描服务扫描漏洞扫描访问web咯改一下host接下来用wpscan看一下用户名接下来看一下密码能不能出来扫的时候顺便看了一下网站目录nagios401了那就是又这个东东被拦截了这玩意又是一个waf好好好密码估计是出不来了再用域名扫一下这个也是一样的，只能访问
ESP8266 传感器搭配 Node-RED实时显示数据，邮件告警实验拿我格子衫来 Node-RED系列教程物联网物联网 iot
前言esp826612f，wif模块，接倾斜传感器，火焰传感器，烟雾传感器，水浸传感器，蜂鸣器。通过mqtt发布数据，并使用node-red实时获取数据，显示到页面上。并且通过邮件和页面两种方式报警。需求如下：①倾斜传感器：监测是否保持平衡。UI界面显示平衡度。如果不平衡，UI界面跳出弹窗信息“xxxxx！”。②烟雾传感器：监测是否有烟。有烟的话蜂鸣器响起，并发送邮件，UI界面跳出弹窗信息“xxx
php sendmail 抄送,Python发送邮件各种姿势 SherryLi禅玉 php sendmail 抄送
Python发送邮件各种姿势本章目录Python标准库smtplibPython发送邮件并抄送Python发送邮件带附件Python发送HTML邮件Python发送图片邮件在写脚本时，放到后台运行，想知道执行情况，会通过邮件、SMS(短信)、飞信、微信等方式通知管理员，用的最多的是邮件。在linux下，Shell脚本发送邮件告警是件很简单的事，有现成的邮件服在写脚本时，放到后台运行，想知道执行情况
Zabbix分布式监控系统概述、部署、自定义监控项、邮件告警江南字子川 zabbix 分布式
目录前言（一）业务架构（二）运维架构一、Zabbix分布式监控平台（一）Zabbix概述（二）Zabbix监控原理（三）Zabbix6.0新特性1.Zabbixserver高可用2.Zabbix6.0LTS新增Kubernetes监控功能（四）Zabbix6.0功能组件1.ZabbixServer（1）Zabbixdatdbdse（2）Zabbixweb2.ZabbixAgent（1）主动模式（2
Django Web框架07 codeboy-leon Django django
《DjangoWeb框架教学笔记》目录文章目录《DjangoWeb框架教学笔记》目录文件上传Django中的用户认证(使用Django认证系统)auth基本模型操作:auth扩展字段电子邮件发送项目部署uWSGI网关接口配置(ubuntu18.04配置)nginx及反向代理配置nginx配置静态文件路径邮件告警文件上传文件上传必须为POST提交方式表单中文件上传时必须有带有enctype="mul
源码部署zabbix监控详细步骤 Mr Sean zabbix 监控类
由于实际工作中所需要监控的服务器数量之大，人工监控耗时耗力，基于这种情况寻找可用于监控的服务器的开源软件，有三款推荐软件可使用：Cacti、Nagios、Zabbix三款软件各自的特点如下：Cacti:基于SNMP协议的监控软件,强大的绘图能力Nagios:基于Agent监控,强大的状态查验与报警机制,插件极多,自己写监控脚本潜入到Nagios非常方便.Zabbix:基于多种监控机制,支持分布式监
zabbix邮件告警 Starts️ zabbix linux 服务器
目录一、获取邮箱的授权码（自行解决）二、配置报警媒介（收件人）三、配置报警媒介类型四、定义一个动作（前提是主机，监控项，触发器都已配置成功）一、获取邮箱的授权码（自行解决）二、配置报警媒介（收件人）点击管理-------用户--------报警媒介三、配置报警媒介类型管理-----报警媒介类型-----Email(HTML)四、定义一个动作（前提是主机，监控项，触发器都已配置成功）当数据在非合理范
Hack The Box-Monitored 0415i HTB靶场合集网络服务器运维 linux web http
端口扫描&信息收集使用nmap对ip进行扫描nmap10.10.11.248开放了22、80、389、443端口使用dirsearch对网站目录进行扫描dirsearch-u10.10.11.248发现一个/nagios的网页，尝试访问发现需要用户名和密码，这里没有用户名密码，先继续下一步将ip和域名加入到hosts文件中后，访问ipecho'10.10.11.248nagios.monitore
htb monitored root方式其中的一种（仅作记录）春猿火 linux
快下班时候审出来的，目前root的第5种方式nagios@monitored:~$cat/usr/local/nagiosxi/scripts/backup_xi.sh#!/bin/bash##CreatesaFullBackupofNagiosXI#Copyright(c)2011-2020NagiosEnterprises,LLC.Allrightsreserved.#BASEDIR=$(di
Linux运维日常使用软件和技能寻宝记_楠哥
运维工程师使用的运维平台和工具包括：Web服务器：apache、tomcat、nginx、lighttpd监控：nagios、ganglia、cacti、zabbix自动部署：ansible、sshpt、salt配置管理：puppet、cfengine负载均衡：lvs、haproxy、nginx传输工具：scribe、flume备份工具：rsync、wget数据库：mysql、oracle、sql
持续运维与监控 Michaelzh
运维的趋势，挑战，事件管理，流程管理运维权限管理开源运维平台云上IAM监控开源监控方案zabbix+短信、邮件、微信、钉钉告警普罗米修斯(容器)Nagiosopen-falconzenoss监控对象服务器、虚拟机监控数据库监控中间件监控容器监控云上监控云上自带服务，例如AWS的cloudwatch+SNS、阿里云的云监控+短信服务等告警消息分级，人性化监控系统运维可视化开源技术grafana云上服
开源监控服务一瞥：Prometheus、Grafana、Zabbix、Nagios、Icinga和Open-Falcon CodeArtisanX 开源监控
前言随着信息技术的发展，监控服务在维护系统稳定性和性能方面变得越来越重要。本文将比较一些流行的开源监控服务，以帮助你选择适合你需求的解决方案。监控服务对比监控服务特点优势不足性能扩展性安全性Prometheus-多维度数据模型-监控容器化环境的强大工具-需要单独设置存储后端-查询性能较高，适用于大规模环境-可通过分布式部署进行横向扩展-支持基于HTTPS的数据传输，提供基本认证-支持服务发现自动发
分布式任务调度-xxl-job java牛虻 Java开发面试题分布式 java spring
12.1.什么场景用了任务调度xxl-job解决的问题解决集群任务的重复执行问题（你用Springtask的话很容易造成任务重复执行）cron表达式定义灵活（SpringTask是把cron表达式定义在代码中的，xxl-job可以定义在页面上，管理灵活，修改方便。）定时任务失败了，重试和统计。（问题分析，邮件告警，故障转移）任务量大，分片执行（花呗通知还款）12.2.xxl-job路由策略有哪些？
nagios部署记录 shaoqiu.wu linux centos 运维
nagios主程序部署前期准备工作#关闭防火墙systemctlstopfirewalld#关闭防火墙开启自启systemctldisablefirewalldvi/etc/sysconfig/selinuxSELINUX=disabled#重启#换源cd/etc/yum.repos.d/#备份源mvCentOS-Base.repoCentOS-Base.repo.bak#下载阿里源curl-o/
pnp4nagios 配置 nagios nextflying java 前端服务器
/root/software/pnp4nagios-0.6.26/sample-config/nagios.cfg-sample.in/root/software/pnp4nagios-0.6.26/sample-config/misccommands.cfg-sample.in/root/software/pnp4nagios-0.6.26/sample-config/nagios.cfg-sa
nagios php-fpm,nagios平台从apache迁移到nginx weixin_39907762 nagios php-fpm
nginx的性能远远优于apache，但由于nagios的web界面中包含php和c-cgi程序，因此需要两套fcgi管理工具(并非必须)和两套解释器(必须)。php用php-cgi跑就可以，c-cgi我选用fcgiwrap。下面介绍安装/配置步骤。php-fpm：是为PHP打的一个FastCGI管理补丁，可以平滑变更php.ini配置而无需重启php-cgiSpawn-fcgi：是lighttp
《高性能Linux服务器构建实战》笔记 SkTj
系统安全、故障排查、自动化运维、集群架构1、账号安全，安装完后可以删除的账号：adm,lp,sync,shutdown,halt,news,uucp,operator,games,gopher禁用登录功能：usermod-s/sbin/nologinnagios2、关闭不需要的服务:anacronauditdautofsavahi-daemonavahi-dnsconfdbluetoothcpus
Prometheus+Grafana 监控 MySQL 萧木易 linux linux centos mysql
Prometheus获取MySQL的监控数据，并通过Grafana展示的过程。首先来看整体架构图：1架构图如上图，通过mysql_exporter获取MySQL的监控数据，通过node_exporter获得Linux服务器的监控数据。将获得的监控数据传到Prometheus中，最终通过Grafana展示出来，效果如下图：除了展示监控数据，在文章的最后也会增加邮件告警的配置。2实验环境介绍实验环境大
Prometheus-AlertManager 邮件告警被一米六支配的恐惧容器 prometheus
环境,软件准备本次演示环境，我是在虚拟机上安装Linux系统来执行操作，以下是安装的软件及版本：System:CentOSLinuxrelease7.6Docker:24.0.5Prometheus:v2.37.6Consul:1.6.1docker安装prometheus,alertmanage,说明一下这里直接将exporter,grafana等组件一起安装完成.[root@node1-pro
Zabbix“专家坐诊”第222期问答汇总乐维_lwops zabbix有问有答 zabbix
问题一Q：Zabbix6.4能讲下维护区间吗？启动区间和期间是什么不同？TiuySPzJ6567d4304f4b9.pngA：启动区间是这条维护规则的有效时间；期间则是维护的周期，比如什么时候维护，维护多久。问题二Q：Zabbix版本是6.4，请问如何在邮件告警里面调用特定监控项的值调用格式是？如何调用？A：能调用触发器表达式中引用到的值,{ITEM.VALUE1}、{ITEM.VALUE2}分别
L2tp客户端 jameslord makefile nagios linux ubuntu file 服务器
root@ubuntu:~/download/backfire$lsfeeds/packages/net/xd/feeds里面放了很多Makefile，编译时怎么没把xd编译出来呢?filesMakefilepatchesREADMEroot@ubuntu:~/download/backfire$lsdl/|grepxfeeds/packages/admin/nagios/Makefilenagi
16、Mysql用户工具 geek-wmy Mysql高性能学习 mysql 数据库 java 后端面试
接口工具MysqlWorkbenchSQLyogphpMyAdminAdminer命令行工具集PerconaToolkitMaatkitandAspersaTheopenarkkitMysqlWorkbench工具集SQL实用集common_schemamysql-sr-libMysqlUDF库MysqlForge监测工具开源的监控工具NagiosZabbixZenossHypericHQOpen
k8s实战之部署Prometheus+Grafana可视化监控告警平台诸葛钢铁云 K8S
写在前面之前部署web网站的时候，架构图中有一环节是监控部分，并且搭建一套有效的监控平台对于运维来说非常之重要，只有这样才能更有效率的保证我们的服务器和服务的稳定运行，常见的开源监控软件有好几种，如zabbix、Nagios、open-flcon还有prometheus,每一种有着各自的优劣势，感兴趣的童鞋可以自行百度，但是与k8s集群监控，相对于而已更加友好的是Prometheus，今天我们就看
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。